R语言简介
R语言的诞生、发展、优缺点
· R语言——集数据操作、分析、展示于一体的数据分析工具
所以与数据相关的工作,除了数据存储使用数据库之外,其他的工作,比如分析、展示等等,都是可以用R语言来完成的,R语言是一门功能非常强大的工具
· 源于S语言,与S-PLUS同为S语言的实现
S语言是由钱伯斯在上个世纪七八十千代在贝尔实验室开发完成的,目前市面上基于S语言的实现有两个,一个是S-plus,另一个就是我们要学习的R语言。
S-plus是一个商业软件,R语言是一个开源软件,R语言最早是由新西兰的奥克兰大学的罗斯和罗伯特两位教授开发的。
· 2000年发布第一个二进制版本,目前最新版本4.0.0
目前R语言的维护工作是由R语言开发核心小组进行,S语言的开发者钱伯斯也是属于开发核心小组的成员。R语言4.0.1版本的预发布版将于2020-05-27发布,最终版本定于2020-06-06发布。
· 随着数据分析的兴起,R语言也正在变得热门——TIOBE
TIOBE这个网站会发布各种编程语言的热门程度,每个月发布一次。
我们可以看到,同比于2019年5月,R语言的热门程度从21位增长到第10位,增长是比较快的。
从R语言的历史发展趋势来看,从最早07年左右,到现在2020年,R语言的热门程度总体是一个呈现上升的趋势,并且我们可以看到由于2020年疫情的影响,对于数据分析需求的递增,R语言的热门程度呈现一个快速上升的趋势。
· R语言的优点
- R语言是一个免费、开源软件
这对于广大的数据分析工作者来说是一个福音,相比于其他商业软件,动辄于几万的价格,免费就意味着成本的节约,是一个非常大的优势
- R语言的扩展性非常高,具有丰富多样的包
目前数据分析中用到的方法,在R语言中都可以找到相应的一个实现的包,同样对于数据分析工作者来说是一个非常大的优点
· R语言的缺点
速度慢,主要表现在执行大数据复杂运算任务时,但是对于日常一般的使用,这个缺点是不构成威胁的。
开发工具----R与Rstudio
R
· R-project网站介绍、下载安装
https://www.r-project.org/这个是R-project网站,进入后界面如下:
点击页面CRAN链接,跳转到CRAN的镜像地址选择网页
选择一个和自己物理地址最接近的地方进行访问,我们这里选择中国-清华大学进入。
这个页面我们主要使用的有四块,第一个就是R的下载与安装,Download and Install R,另外我们经常会用到的链接有三个,packages,manuals和search,接下来会依次给大家介绍:
- R的下载与安装
进入CRAN的页面后,根据自己电脑所使用的操作系统选择相应的R版本下载,这里我们选择Windows系统。
R下载完成之后,找到安装文件,双击即可安装。
安装程序开始运行后,最先进入“语言选择”窗口,这时候根据自己的习惯选择即可,此处选择“中文(简体)”。
在“信息”窗口选择“下一步”,进入选择安装位置的窗口,可根据自己的喜好进行调整。
接下来进入“选择组件”的窗口,我们可以选择适配系统的位数进行安装,也可以全部选择,此处我们直接点击“下一步”。
同样在“启动选项”窗口,我们接受默认选项点击“下一步”。
进入“选择开始菜单文件夹”窗口,接着点击“下一步”,进入“选择附加任务”窗口,建议勾选“创建桌面快捷方式”,进入“下一步”。
可以看到程序进入正在安装过程,此时无须操作,待安装结束后会弹出安装完成提示窗口,点击“结束”即完成R的安装。
安装完成之后,桌面上会看到R程序的图标,双击即可进入R环境。
进入R环境之后,大致的页面布局如截图所示,详细内容后续会有介绍。
2. Packages
点击packages链接之后,会跳转到packages页面上去,在这个页面,他有提供两个列表,一个是按照发布日期对packages进行排列,另一个是按照名称进行排列
点击进去之后,我们可以看到格式各样的R的包,左边是包的名称以及链接,右边是包的一个简要介绍,可以在网页上使用CTRL+F搜索功能查找想获取的包。
点击包的名称进入包的详细介绍页面,用到比较多的就是download部分。
Reference manual 后面是一个pdf文档,文档中的内容是关于包里面各种函数的具体用法,Reference manual是每一个包都会提供的,我们可以在线观看,也可以下载到本地去阅读。
Vignettes 是一个更详细的说明文件,部分包会有该类文件,它比manual文件更详细,更具有阅读价值。
另一块就是文件信息,R安装packages有几种方式,其中一种就是本地安装,本地安装就需要本地硬盘上面存在包的文件,我们可以通过Package source 和Windows/macOS binaries 中提供的链接选择合适的版本进行下载。
3. Manuals
Manuals这个链接中主要提供一些R的手册,这个手册会提供一些怎样去使用R的文件,例如R数据的导入导出等等。
4. Search
Search也可以看作为一个帮助系统,我们点击Search,选择R site Search R站点内搜索,输入关键字,可以获取到有关的链接文件等等。
· R环境界面介绍
双击桌面R图标进入程序,首先显示的窗口是R语言环境的控制台,这个控制台就是供输入相应的代码运行相应的代码来出现结果的地方,如果有图形的话,他会在右边的区域弹出一个新的图形窗口。
除了控制台窗口外,还提供了工具栏,包括,文件,编辑,程序包等等,文件里面主要是加载、保存一些R的脚本程序等等。编辑就是你在R里面进行编辑代码的时候会用到的一些复制、粘贴、清理控制台等等,还可以通过GUI选项去配置编辑器。其他中也提供一些相应的选项,当前计算,中断计算等等。在程序包中也有刚刚提到的从本地去安装程序包,就是通过程序包下install package from local files 来实现的。窗口和帮助主要是在R中怎样去布局窗口以及如何去获取一些帮助信息。这里不一一截图了,关于R的具体的使用,我相信在后续的学习当中,我们能够慢慢更深入地去了解。
RStudio
RStudio可以看成是R语言的一个IDE,是一个集成的开发环境,相比于R的原生程序,功能会更加的丰富多样。
· Rstudio下载与安装
https://rstudio.com/products这个是RStudio网站,进入后界面如下:
首先是RStudio的下载和安装,点击DOWNLOAD RSTUDIO,进入下载页面,选择桌面版的开源版
然后根据自己电脑所使用的操作系统选择相应下载即可,这里我们选择Windows系统
下载完成后,双击安装文件,开始安装
首先在”RStudio安装向导"界面点击“下一步”。在随后的“选择安装位置”界面,根据自己的喜好选择安装位置,然后点击“下一步”。
在“选择开始菜单文件夹”界面直接点击“安装”,进入“正在安装”界面,此时无须操作。待安装完成后,在“正在完成RStudio安装向导”界面点击“完成”,RStudio安装即告成功。
RStudio安装完成之后在桌面上并没有RStudio的图标,此时可以在开始菜单中找到RStudio,然后将鼠标移动到RStudio上,再按住鼠标左键将其拖动到桌面上,即可在桌面上创建RStudio的快捷方式。
· RStudio Blogs
RStudio网站提供一个Blogs功能,以Tidyverse为例
Tidyverse是我们后续学习经常用到的一个包,它实际上是一个包的集合,它里面包括ggplot2,readr,dplyr等等
一些核心包,在在家Tidyverse之后,不需要再去单独加载核心包,但是如果是非核心包,类似readxl包,需要加载Tidyverse之后,再单独加载readxl包。
我们点击包进入页面之后,他还提供了包的使用说明,包括包的函数使用方法、说明文档等等。
· RStudio界面
双击RStudio桌面快捷方式,即可进入到RStudio中开始编写并运行R代码。初始情况下,RStudio界面主体是三块,可以通过按下快捷键Ctrl+Shift+n新建或加载已有脚本,生成另外一个窗口,这个窗口就是用来编写并运行代码。右边的窗口的功能以及RStudio的使用在后续的学习中,都会有一个介绍。
|
请发表评论