R是一种适用于统计分析计算和图像处理的语言,受S语言和Scheme语言影响发展而来,由来自新西兰奥克兰大学的Ross Ihaka和Robert Gentleman开发。


R语言还没有发明之前,Ross Ihaka从一本书中了解到了Scheme语言,对Scheme非常感兴趣,差不多的时间里他正好获得一版新S语言的源代码,他注意到Scheme和S语言二者之间的异同点。某一次Ross准备用Shceme向别人演示词法作用域,但手边没有Scheme的书,就用来S语言,结果却失败了。由此萌生了改进S语言的想法。


在相当长的一段时间之后.Ross Ihaka和Robert Gentlemen在奥克大学成了同事.他们都对统计计算十分感兴趣.而且试图为他们的实验室寻找一个更好的软件.因为在商业软件中一直找不到他们想要的。这时,Ross 联想到当初S语言后自己一直想改进S语言的想法.于是他们决定自己开发。


早在1998年,美国计算机协会ACM就授予了S语言的主要设计者John M.chambers“软件系统奖”,用来表彰S取得的成就。这是迄今为止众多统计软件中“唯一”被ACM授奖的统计系统。

当时ACM是这样评价S语言的:“ 永久地改变了人们分析、可视化、处理数据的方式”,“是一个优雅的、被广泛接受的、不朽的软件系统”。


Scheme诞生于1975年的MIT,它是LISP语言的一个变种,可以编译成机器码。Scheme的主要特征是可以像操作数据一样进行函数调用,其主要目的是训练人的机器化思维。


1993年,Ross和Robert将R的部分二进制文件放到卡耐基.梅隆大学统计系的Statlib中,并在S语言的新闻列表上发布了一个公告.随后有人开始下载使用并提出一些反馈,其中以苏黎世理工学院的MartinM最为突出,Martin在邮件中极力劝说两位原作者公布源代码,让R成为自由软件。在Martin劝说下,1995年6月R预言的源代码正式发布到自由软件协会的FTP上。


随着R语言的进一步开发,程序版本的归档又成了一个问题,维也纳工业大学的Kurt Hornik承担了这个任务。他们在维也纳建立了R程序的归档,这使得程序版本的发布变得更加规范,世界各地开始出现R程序的镜像。


1997年中期,R核心团队正式成立,包括11位早期成员。2013年,R核心团队已经达到20人,成员主要来自世界各地的大学,如牛津大学、西安大略大学等,也有来自企业的成员,如AT&T实验室的Simon Urbanek。R语言的扩展性非常强.,吸引了大量用户编写自定义的函数包。


R语言目前最新版本是3.0.0,程序大小由1997年的959K增加到今天的51.5M(Windows版),整个软件体系一直都保持着非常精简的优势,这也是商业软件无法比拟的。


如今,R的邮件列表由苏黎世理工学院的Martin Macher提供支持,邮件列表主要包含四大类:R-announce 消息发布、R-help附加包、R-help帮助和R-develR程序的开发.


R除了官方文档外.还有创办于2001年的一个刊物R News。该刊物主要用来介绍R的最新特征、CRAN的动态、附加包的说明短文、编程技巧、手册和FAQ中没有介绍的小提示,以及R在数据分析中应用实例。2009年R News更名为The R Journal.


2012年初,Oracle 加入了 R 语言行列,推出Advanced Analytics 工具,作为 Oracle 数据库与 R 分析引擎之间的桥接。Advanced Analytics 是 Oracle 在其 11g R2 数据库中部署的 Data Mining 附件,当 R 程序员需要运行统计例程时,他们可以在数据挖掘工具箱中调用等同的 SQL 函数,并在该数据库中运行。如果没有这样的 SQL 函数,遍历数据库节点的嵌入式 R 引擎将运行 R 例程,收集汇总数据并作为结果将其返回 R 控制台。


Oracle还为其Big Data Appliance提供了一个名为 R Connector for Hadoop 工具,这是一个在 racle Exa x86 集群上运行的 Cloudera CDH3 Hadoop 境,该连接器可让 R 控制台与在Big Data Appliance 运行的Hadoop 分布式文件系统和NoSQL 数据库进行通信。


Google首席经济学家Hal Varian说:“R的最让人惊艳之处在于,你可以通过修改它来做所有的事情,而你已经拥有大量可用的工具包,这无疑让你是站在巨人的肩膀上工作。”R语言目前在机器学习、统计计算、高性能计算得到广泛应用,比如数据仓库与 Hadoop 数据过滤器尤其喜欢R语言,Hadoop 集群的每个节点都可以对HDFS中的数据进行本地 R 分析,并对这些计算的结果进行整合。