有证据表明Python的受欢迎程度正在损害R的使用。根据TIOBE索引,Python目前是世界上第三大流行语言,仅次于常年重量级Java和C.从2018年8月到2019年8月,Python使用率飙升超过3%,达到10%的评级(TIOBE的专有度量标准)它主要衡量搜索活动),很容易在20种最流行的语言中获得最大收益。
相比之下,R在TIOBE指数上最近表现不佳,它从2018年1月的第8位下降到今天成为第20位最流行的语言,仅次于Perl,Swift和Go。在2018年1月达到顶峰时,R的受欢迎程度约为2.6%。但根据TIOBE指数,今天下跌至0.8%。
“Python的持续增长是以牺牲其他编程语言的普及为代价的,”TIOBE指数背后的人们在7月写道。“其中一种编程语言是R,但Perl已被打得更厉害。”
这导致一些专家宣布R的消亡,一个科技相关的在线出版物. Dice Insights,宣称R是“可能注定失败”的五种语言之一。
“尽管R仍然被学术界和数据科学家所使用,但对数据分析感兴趣的公司正在转向使用Python,因为它具有可扩展性和易用性,”Dice Insights的高级编辑Nick Kolakowski写道。他写道,依靠“少数学者和其他人”的使用可能不足以让R活着。“这不可行。”
其他数据表明,Python多年来的成功是以牺牲R和SAS(流行的专有分析环境)为代价的。作为其薪资调查的一部分,Burtch Works一直在向数据科学家和分析师询问他们喜欢哪种环境:R,Python或SAS。
在2014年和2015年,SAS仍然占主导地位,但R很快就获得了成功。然而,从2016年到2018年,Python悄然融入其中。在2018年,Python,R和SAS三方的缠斗更加激烈了。
Python显然有气势,但Martijn Theuwissen拒绝断言R是死亡或正在死亡。“有关R的下降的报道被夸大了,”他说。“如果你看一下R的增长,它仍在增长。根据我的观察,Python的发展速度更快。“
“当我们六年前创办公司时,数据科学的R大幅增长,”Theuwissen说。“我们没有听到很多Python。但是两年后,我们听说Python越来越多地用于数据科学。“
试图衡量语言的流行度是一项众所周知的艰巨任务。虽然语言确实具有自然生命,但在任何特定时刻都没有简单的方法来确定它们在生命周期中的位置。当然,没有办法用任何接近完全确定的东西来预测未来(甚至MATLAB目前在TIOBE上都是#12)。
当Guido van Rossum在20世纪80年代后期首次构想Python时,其目标不是创建世界上最流行的数据科学语言。谁能预测到Python将会成为数据科学和机器学习的通用语言?
与Python相比,R被认为是统计计算的语言。从20世纪90年代初开始,奥克兰大学的R创作者Ross Ihaka和Robert Gentlemen寻求一种方法,将S的结构与良好的用户界面结合起来,以便学者,工程师和其他人建立统计模型和分析数据。
“我们都对统计计算感兴趣,并且在我们的Macintosh教学实验室中看到了对更好的软件环境的共同需求,”Ihaka在1998年的论文“R:过去和未来的历史”中写道。 “我们看不到合适的商业环境,我们我开始尝试看看自己开发自己可能涉及的内容。”
在过去三十年里,R已远远超越新西兰。R Consortium是一个致力于推广使用开源语言的团体,目前全球有超过200万用户。开发人员通过CRAN编写并开源了超过13,000个库,以自动执行各种统计任务和绘制图形。
R Consortium在其网站上表示:“许多组织已采用R语言作为数据科学平台,包括生物技术,金融,研究和高科技行业。” “R语言通常集成到第三方分析,可视化和报告应用程序中,并可在各种计算平台上运行。”
R的一个好处是它在大学和学院广泛传授。许多攻读多个学科科学学位的研究生学习R进行统计建模。随着对数据科学家的需求的增长,许多受过“硬”科学训练的人将他们的统计能力融入新的数据科学贸易中,并带来了他们的R知识。
Python也在高等教育中教授,但它更容易在计算机科学系中找到,而不是天文学或野生动物生物学。随着这些大学毕业生加入劳动力队伍并成为软件工程师,Python就是其中的语言之一。当这些人转变为数据科学角色时,他们更倾向于更多地依赖Python。
在Reddit讨论中,人们比较并对比了R与Python的各种技术优势。反复出现的一个主题是,虽然用户可能能够在R或其中一个库中本地完成任何统计任务,但是人们担心该语言无法跟上Python,特别是当涉及到在网页浏览器中工作时。
另一方面,Python从Numpy这样的统计库中受益匪浅。Python很容易用于数据科学笔记本中的建模,例如iPython和Jupyter。R也可以在像Jupyter这样的数据科学笔记本中使用,但Python是默认模式。
DataCamp的Theuwissen表示,Python生态系统正在超越R生态系统。自微软于2015年收购Revolution Analytics 以来,专注于R的数据科学和分析软件供应商的数量已经缩减。
“你有R Studio,除此之外,我认为没有大公司推动语言发展,”他说。“有了Python,很多人都为这个生态系统做出了贡献。”
除了发布名为Microsoft R Open的开放版本之外,微软仍然开发并支持它通过Revolution Analytics交易获得的R软件。但是,核心R产品不再具有R名称,而Python就是其中之一。“该产品已从R Server重命名为Machine Learning Server,以反映基于Python的分析,”该公司上个月在一篇博客文章中写道。
数据科学帐篷庞大而多样。虽然它在过去几年中明确表达了对Python的亲和力,但这并没有减少其他语言的贡献或个人在其他环境中做好工作的潜力。
在这个特定的时间,Python的未来可能比R更明亮,但这并不意味着R没有前途。Python可能是某些数据科学工作的最佳工具,但对于其他人来说,很难击败R.