我觉得 Python 和 R 就是两个最主流、最有前途、也足够用了。
Python 是正宗的编程语言,全能、流行。R不那么像传统的编程语言,在其统计分析及其扩展领域,始终占据顶级的一席之地。
Python 近几年炒的太火,特别是国内,从知乎问题上就能看得出来,R还不够Python的零头。
我更喜欢 R,尽量客观的来说,R 在国内属于严重被埋没,两点佐证:
(1) 国外R的流行度,无论是在学界还是业界,都远高于国内。
(2) R近年来的涌现出来的若干非常现代和好用的数据科学/机器学习/文档沟通包:
tidyverse、data.table、tidymodels(上代是caret)、mlr3(上代是mlr)、Rmarkdown/Shiny。。。。。。
在国内很少有人知道和推广它们,绝大部分 R 语言教师/教材/教程/博客文章、R入门者还在整 5 年前的古董级的 R 语法,推荐 R 书都是什么 R 语言实战(不是说书不好,是语法实在太陈旧了),时髦点的推荐 R 数据科学(还行,起码是 tidyverse了,只不过是 2016年底的就在国外出版发行的书),对 R 的印象始终停留在:R语法晦涩难懂,速度慢
R做统计分析和绘图还行,
R机器学习只有单独算法的包
R做不了深度学习、大数据、工业部署。。。。
如果你去用一下 tidyverse,你会发现它做数据操作比 pandas 好用好几倍,python以“优雅”著称,用用 tidyverse 你才会发现怎么操作数据才叫做“优雅”,要是嫌慢,轻松就能转换到 data.table
如果你去用一下tidymodels或mlr3,你会发现它足以媲美sklearn
R正在能够做深度学习、大数据、工业部署。。。。(当然是在国外)
R速度慢,有快的包和方法啊
______________
所以,我打算写一本真正适合入门的、现代的、最新技术的R语言编程基础的书(基于最新tidyverse 包,免费电子书),以推广如今这么好用,却不被国内主流所知的 R 语言。