《教师生活365》网[师慧园]论坛

 找回密码
 必须实名注册
查看: 76|回复: 0
打印 上一主题 下一主题

R语言如何实战

[复制链接]

1万

主题

2万

帖子

20万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
204692
跳转到指定楼层
楼主
发表于 2015-1-21 23:48:08 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
R语言如何实战邹羽洋 《 中华读书报 》( 2015年01月14日   17 版)

    借着大数据的狂风,R语言已经飞起来了,并且由于自身的开源特性,用户无需支付任何费用,R语言实际上在飞起来之前,就已经长出了一对翅膀。在2015年,R语言会越飞越高。
    经过了数十年的发展,尽管不断有新型编程语言出现,但编程语言领域已成为一个格局相对稳定的领域了。TIOBE编程语言榜尽管每个月的榜单都有微调,但上榜的语言多数都是熟面孔了。而除了Java、C、C++、C#等常客,每种语言的流行都有其特定原因。就像开源造就了PHP的流行;移动开发的火爆使得只能运行于苹果设备之上的Object-C也能冲入编程语言十强;减少编程时不必要琐碎时间的需求催生了Ru⁃by语言的火爆。因此,编程语言格局的变革,最能反映某种新技术的大规模流行。而接下来,大数据技术的流行,将注定使得R语言走向前台。
    大数据的发展
    在TIOBE2014年12月编程语言排行榜上,C、Java、Objective-C分列前三名。而R和Swift成为了2014年TIOBE年度语言的候选者。根据统计,R增长率1.38%,Swift作为苹果公司的新语言增长率1.06%。这样,最终的胜出者可能是R语言。
    要理解R语言为什么在2014年变得这么火,还得从大数据技术本身说起。从大数据的定义可知,它是指所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理并整理成为帮助企业经营决策更积极目的资讯。这样,变得越来越多的海量数据,就需要一系列新生的工具去处理它们,进而把海量数据加工成有用的结论。
    这样,大数据最先影响到的是存储领域,因此分布式存储变得越来越流行。接下来,基于分布式系统基础架构,可以让用户在不了解分布式底层细节的情况下,开发分布式程序的Hadoop数据库变得流行起来。但接下来,用户发现这还远远不够。数据科学家们还需要一种模式,来替代传统的SAS及SPSS模式,这个需求使得R语言越来越受宠。R语言的命运实际上与大数据的发展息息相关。
    业内分析机构认为:2015年,人们将更多关注大数据的可用性以及大数据带来的价值,而不是讨论大数据需要的技术。公司需要为大数据配置分析技能的人员,能够建设处理非结构化的数据和实时输入所需的新的数据结构。企业需要在客户洞察力、内部决策、产品创新或IT服务等方面需要大数据分析提供的帮助。2015年,大数据将发挥更重要的作用。
    这样看来,R语言在2014年的成绩只可以算是崭露头角,而在2015年它极可能迎来自己的爆发年。
    R是一种什么样的语言
    从官方定义来看,R语言是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件。它是一个用于统计计算和统计制图的优秀工具。
    更通俗地说,R语言是一种功能强大的计算机语言,它比C\C++、Perl都要强大,虽然它没有C那么万能,没有Perl那么强的文本处理能力,但是在计算和数据处理上,它却绝对是一顶一的。更为重要的是,它降生的目的,就是为了要让非计算机专业的人也能用计算机语言完成工作,极大程度上降低了非计算机专业人士掌握计算机语言的难度。
    R语言也并非是横空出世,它不过是S语言的一种实现。S语言是由AT&T贝尔实验室开发的一种用来进行数据探索、统计分析和作图的解释型语言。S语言的实现版本主要是S-PLUS,这样,我们实际上可以把R语言看作是S-PLUS的一个“克隆”版本。
    R如其说是一种统计软件,还不如说它是一种数学计算的环境。最重要的,R是一个免费的自由软件,它有UNIX、Linux、MacOS和Windows版本。任何人只要想,都可以自由下载到R的源代码。
    R语言的使用,很大程度上是借助各种各样的R包的辅助,从某种程度上讲,R包就是针对于R的插件,不同的插件满足不同的需求。由于R实际上是一个开源环境,并且广泛地支持各类操作系统,所以到了2013年,CRAN已经收录了各类包4338个。这些包广泛用于经济计量、财经分析、人文科学研究以及人工智能等领域。
    雷军说,处在风口上,猪也能飞起来。借着大数据的狂风,R语言已经飞起来了,并且由于自身的开源特性,用户无需支付任何费用,R语言实际上在飞起来之前,就已经长出了一对翅膀。在接下来的2015年,我们有理由相信,R语言会越飞越高。
    R语言图书如何实战
    R语言逐年上升的用户数在2014年或者更早时间内,已经引起了国内出版界的注意。一批类似于《R语言实战》《R语言核心技术手册》《R语言编程艺术》这样的图书已有所作为。但我们不得不说,这还远远不够。
    表现之一,就是R语言作为免费开放的统计学软件,以往大多数用户只停留在简单地编几个小程序实现统计过程,而没有想到R语言在可视化设计方面居然功能如此强大。而事实上,在向量图绘制方面R语言已经达到甚至超越了一些专业的商业化软件的水准。另一方面,从大数据的发展趋势分析,大数据的可视化将注定成为一个新的趋势。这就像商业智能软件,在一开始只是注重数据挖掘的技术,而对展现界面的明晰、美观关注度不高一样。当R语言越来越被重用之后,用户对它的展现功能将越发重视。
    从笔者的角度来看,就象PHP被大量用于复杂应用开发时,用户对于它与MySQL数据库的配合产生浓厚兴趣一样,R语言与Hadoop数据库实现协同开发,也可能会成为一个热点话题。
    更为重要的,是大数据技术本身还处于一种发展阶段,越来越多的行业被卷入进来,就会有越来越奇特的应用需求产生出来。这样,Hadoop数据库也好,R语言也罢,它们不过是体,而应用需要这个“用”的变化却是千奇百怪的。各类个性化应用需求,本身就给R语言类图书创造了更多样化的题材。
    接下来,2015年的R语言图书实战,绝对是一台好戏。



回复

使用道具 举报

您需要登录后才可以回帖 登录 | 必须实名注册

本版积分规则

QQ|Archiver|手机版|小黑屋|《教师生活365》网[师慧园]论坛  admin.php?action=setting&operation=basic

GMT+8, 2024-10-6 06:47 , Processed in 0.078817 second(s), 29 queries .

Powered by Discuz! X3.1

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表