R是用于统计分析、绘图的语言和 *** 作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。
R语言是一个开源的数据分析环境,起初是由数位统计学家建立起来,以更好的进行统计计算和绘图,这篇wiki中包含了一些基本情况的介绍。由于R可以通过安装扩展包(Packages)而得到增强,所以其功能已经远远不限于统计分析。
R语言的特点R作为一种统计分析软件,是集统计分析与图形显示于一体的。它可以运行于UNIX,Windows和Macintosh的 *** 作系统上,而且嵌入了一个非常方便实用的帮助系统,相比于其他统计分析软件,R还有以下特点:1.R是自由软件。这意味着它是完全免费,开放源代码的。可以在它的网站及其镜像中下载任何有关的安装程序、源代码、程序包及其源代码、文档资料。标准的安装文件身自身就带有许多模块和内嵌统计函数,安装好后可以直接实现许多常用的统计功能。
2.R是一种可编程的语言。作为一个开放的统计编程环境,语法通俗易懂,很容易学会和掌握语言的语法。而且学会之后,我们可以编制自己的函数来扩展现有的语言。这也就是为什么它的更新速度比一般统计软件,如,SPSS,SAS等快得多。大多数最新的统计方法和技术都可以在R中直接得到。
3. 所有R的函数和数据集是保存在程序包里面的。只有当一个包被载入时,它的内容才可以被访问。一些常用、基本的程序包已经被收入了标准安装文件中,随着新的统计分析方法的出现,标准安装文件中所包含的程序包也随着版本的更新而不断变化。在另外版安装文件中,已经包含的程序包有:base一R的基础模块、mle一极大似然估计模块、ts一时间序列分析模块、mva一多元统计分析模块、survival一生存分析模块等等。
4.R具有很强的互动性。除了图形输出是在另外的窗口处,它的输入输出窗口都是在同一个窗口进行的,输入语法中如果出现错误会马上在窗口口中得到提示,对以前输入过的命令有记忆功能,可以随时再现、编辑修改以满足用户的需要。输出的图形可以直接保存为JPG,BMP,PNG等图片格式,还可以直接保存为PDF文件。另外,和其他编程语言和数据库之间有很好的接口。[2] 5.如果加入R的帮助邮件列表一,每天都可能会收到几十份关于R的邮件资讯。可以和全球一流的统计计算方面的专家讨论各种问题,可以说是全世界最大、最前沿的统计学家思维的聚集地。
R是基于S语言的一个GNU项目,所以也可以当作S语言的一种实现,通常用S语言编写的代码都可以不作修改的在R环境下运行。 R的语法是来自Scheme。R的使用与S-PLUS有很多类似之处,这两种语言有一定的兼容性。S-PLUS的使用手册,只要稍加修改就可作为R的使用手册。所以有人说:R,是S-PLUS的一个“克隆”。但是请不要忘了:R是免费的(R is free)。R语言源代码托管在github,具体地址可以看参考资料。
R语言的下载可以通过CRAN的镜像来查找。
R语言有域名为.cn的下载地址,有六个,其中两个由Datagurn,由中国科学技术大学提供的。R语言Windows版,其中由两个下载地点是Datagurn和USTC提供的。
R语言基础入门教程一: 1、学习前提在继续学习本教程之前,您应该基本了解计算机编程术语。 对任何编程语言的基本理解将帮助您理解R语言编程概念,并在学习轨道上快速移动
R语言适用人群本教程是为期待使用R编程开发统计软件的软件程序员,统计学家和数据挖掘者设计的。 如果你试图理解R编程语言作为一个初学者,本教程将给你足够的了解语言的几乎所有的概念,从那里你可以把自己的更高水平的专业知识。
2 为什么要学习R语言可能你想说,“我已经学会了spss/sas/stata.。。,为什么还要去学习R呢?”如下几方面可能会吸引到你:
R是免费开源软件:现在很多学术期刊都对分析软件有版权要求,而免费的分析工具可以使你在这方面不会有什么担心。另一方面,如果学术界出现一种新的数据分析方法,那么要过很长一段时间才会出现在商业软件中。但开源软件的好处就在于,很快就会有人将这种方法编写成扩展包,或者你自己就可以做这件工作。
命令行工作方式:许多人喜欢类似SPSS菜单式的 *** 作,这对于初学者来说很方便入门,但对于数据分析来说,命令行 *** 作会更加的灵活,更容易进行编程和自动化处理。而且命令行 *** 作会更容易耍酷,不是嘛,一般人看到你在狂敲一推代码后得到一个分析结果,对你投来的目光是会不一样的。
小巧而精悍:R语言的安装包更小,大约不到40M,相比其它几个大家伙它算是非常小巧精悍了。目前R语言非常受到专业人士欢迎,根据对数据挖掘大赛胜出者的调查可以发现,他们用的工具基本上都是R语言。此外,从最近几次R语言大会上可以了解到,咨询业、金融业、医药业都在大量的使用R语言,包括google/facebook的大公司都在用它。因此,学习R语言对你的职业发展一定是有帮助的。
3 R语言的下载和GUI界面R语言安装包可以在官方网站下载,windows版可直接点击这个连接
在ubuntu下面安装R则更容易,在终端里头运行如下命令即可
sudo apt-get update
sudo apt-get install r-base
此外,学习R语言时强烈推荐安装Rstudio做为R的图形界面,关于Rstudio之前的博文有过简单介绍,点这里可能转到它的官方网站。
4 R语言的学习方法学习R并不是一件非常轻松的事情,初学者需要记住的就是:
亲手键入代码并理解其意义
在笔记里记下一些重点或心得(个人推荐Evernote)
坚持练习,对手边的数据进行应用分析
理解背景知识,细节很重要。
5 哪里可以得到参考资料1.官方网站 http://cran.csdb.cn/index.html (官方文献集中地)
2.统计之都论坛
3.人大经济论坛-R子论坛 (免费资料也不少)
4.http://library.nu/ 这是网上电子书最多的地方,其中有一个R语言专门书柜(也就是一个shelves)
5.关于R语言的教材小结
6.笔者在verycd上发的一个书单
7.一个国外著名的R语言群博 http://www.r-bloggers.com/
8.展示R语言的各类绘图 http://addictedtor.free.fr/graphiques/
本人博客里也有一些关于R语言的资料:xccds1977.blogspot.com (需FQ)
如果有一些简单的入门问题,也可以在推特上follow me twitter: @xccds
6 本系列博文的目的
本系列入门的目的是为初学者提供最简洁清晰的资料,以迅速入门。所针对的读者人群是那些正在大学里学习初级统计学的同学。本系列计划包括内容有:基本命令,数据 *** 作;描述统计和绘图;重要的R语言函数计算;统计推断和估计;非参数统计方法;方差分析;线性回归和一般线性模型。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)