一、理论方面

  1.初级入门

  以入门来说,官方小册子《AnIntroductiontoR》便是踏进大数据分析的必备。《R4Beginners》也是一本小册子,其对应的中文版为《R入门》。除此之外,还可以去读刘思喆的《153分钟学会R》。


r语言 清华大学 r语言入门书籍推荐_R语言书单

  有了以上基础之后,便可以读一些比较全面的经典入门书籍了,例如曾经多次推荐的《统计建模与R软件》、《RCookbook》和《Rinaction》。另外,《RinaNutshell》也是一本颇负盛誉的R语言书籍。

  2.高级入门

  不满足于初级入门,你可以迈进高级入门阶段了。《StatisticswithR》和《TheRbook》是两本不容错过的经典书籍。

  这两本书的高级之处,除了因为它们已经不再受限于R的基础讲解,而且它们也结合了各种常见的数据分析以给出讲解,尤其是在R在线性回归、方差分析、多元统计、R绘图、时间序列分析、数据挖掘等各方面的内容,它们都做出了比较系统的介绍。由此你可以得知,R不仅功能强大,而且还非常的便捷简易。


r语言 清华大学 r语言入门书籍推荐_r语言 清华大学_02

  以上是关于R语言的理论基础,说到具体的应用,便是术业有专攻的范畴了。下面将简单介绍R语言在实际操作中不同方向的应用技巧,以及对应的几本经典书籍。

  二、应用方面

  1.数据挖掘

  数据挖掘方面的书不多,比较经典的推荐读《DataMiningwithR:learningwithcasestudies》。《DataMiningwithRattleandR》也是一本好书,配合Rattle软件讲述的,当然Rweka也是一款很棒的软件。


r语言 清华大学 r语言入门书籍推荐_R语言书单_03

  另外,R当中数据挖掘方面的包有非常之多,参考包当中的帮助文档足以辅助。

  2.绘图与可视化

  相比其他观感,present时,人们的视觉更敏感,因此,巩固了绘图和可视化在大数据分析中的地位。既然如此,如何利用R来画图和实现数据可视化呢?更具体地说,怎样用R往直方图上添加密度曲线,等等?

  《RGraphics》是一本全面介绍R中绘图系统的经典入门书籍;想要再深入一点的,推荐读《Lattice:MultivariateDataVisualizationwithR》;想走文艺小清新style的,建议读《ggplot2:ElegantGraphicsforDataAnalysis》;想玩高大上的交互图形的,推荐读《InteractiveandDynamicGraphicsforDataAnalysisWithRandGGobi》;怕麻烦想要看中文版本的话,谢益辉的《现代统计图形》也不错。


r语言 清华大学 r语言入门书籍推荐_r语言 清华大学_04

  3.时间序列分析

  有关时间序列分析的书籍分两类,一种是比较普适的;一类是比较专业的,例如泛经济领域中的时间序列分析。

  比较普适的时间序列分析书籍,推荐《TimeSeriesAnalysisandItsApplications:withRexamples》,它介绍了各种时间序列分析的经典方法,以及实现各种经典方法的R代码。

  泛经济领域中的时间序列分析书籍,比较流行的有《Analysisoffinancialtimeseries》和《TimeSeriesFAQ》。前者适合有时间序列分析基础和金融基础的读者,后者适合喜欢钻研的读者。想要研读关于协整理论的书籍,可以看看《AnalysisofIntegratedandCointegratedTimeSerieswithR》。还有高级一点的关于小波分析的,可以看看《WaveletMethodsinStatisticswithR》。


r语言 清华大学 r语言入门书籍推荐_R语言书单_05

  4.计量经济学

  虽然《EconometricsInR》只是一本很薄的小册子,但是做计量经济学入门用,足矣。另外,《AppliedEconometricswithR》是对应AER的R包的书籍,安装该R包后配合使用,效果更好。计量经济学中很大一部分是关于时间序列分析的,可以参考上文。


r语言 清华大学 r语言入门书籍推荐_R语言教程_06

  5.金融

  用R做金融的书籍,对于懂金融、不懂数据分析技术的人相对比较有用。毕竟,金融的领域很广泛,如果是大金融的话,保险也要被纳入其中,这就需要读者更多地掌握金融知识,如果只会数据分析技术的话,会比较难理解。

  《AdvancedTopicsinAnalysisofEconomicandFinancialDataUsingR》、《ModellingFinancialTimeSeriesWithS-plus》,都是金融方面比较经典的书籍;另外,涉及金融产品定价的话,常常要用到随机微分方程,那么可以参详《SimulationInferenceStochasticDifferentialEquations:withRexamples》此书;如果是涉及风险度量与管理的话,比较经典的有《ModernActuarialRiskTheoryUsingR》、《QuantitativeRiskManagement:Concepts,TechniquesandTools》和《SimulationTechniquesinFinancialRiskManagement》;涉及投资组合分析类和期权定价类的,推荐看《OptionPricingandEstimationofFinancialModelswithR》和《PortfolioOptimizationwithR》两本。


r语言 清华大学 r语言入门书籍推荐_R语言教程_07

  无论是经济管理出身,还是IT出身,想要成为一名优秀的大数据分析师,好书总能助你一臂之力!