一、理论方面
1.初级入门
以入门来说,官方小册子《AnIntroductiontoR》便是踏进大数据分析的必备。《R4Beginners》也是一本小册子,其对应的中文版为《R入门》。除此之外,还可以去读刘思喆的《153分钟学会R》。
有了以上基础之后,便可以读一些比较全面的经典入门书籍了,例如曾经多次推荐的《统计建模与R软件》、《RCookbook》和《Rinaction》。另外,《RinaNutshell》也是一本颇负盛誉的R语言书籍。
2.高级入门
不满足于初级入门,你可以迈进高级入门阶段了。《StatisticswithR》和《TheRbook》是两本不容错过的经典书籍。
这两本书的高级之处,除了因为它们已经不再受限于R的基础讲解,而且它们也结合了各种常见的数据分析以给出讲解,尤其是在R在线性回归、方差分析、多元统计、R绘图、时间序列分析、数据挖掘等各方面的内容,它们都做出了比较系统的介绍。由此你可以得知,R不仅功能强大,而且还非常的便捷简易。
以上是关于R语言的理论基础,说到具体的应用,便是术业有专攻的范畴了。下面将简单介绍R语言在实际操作中不同方向的应用技巧,以及对应的几本经典书籍。
二、应用方面
1.数据挖掘
数据挖掘方面的书不多,比较经典的推荐读《DataMiningwithR:learningwithcasestudies》。《DataMiningwithRattleandR》也是一本好书,配合Rattle软件讲述的,当然Rweka也是一款很棒的软件。
另外,R当中数据挖掘方面的包有非常之多,参考包当中的帮助文档足以辅助。
2.绘图与可视化
相比其他观感,present时,人们的视觉更敏感,因此,巩固了绘图和可视化在大数据分析中的地位。既然如此,如何利用R来画图和实现数据可视化呢?更具体地说,怎样用R往直方图上添加密度曲线,等等?
《RGraphics》是一本全面介绍R中绘图系统的经典入门书籍;想要再深入一点的,推荐读《Lattice:MultivariateDataVisualizationwithR》;想走文艺小清新style的,建议读《ggplot2:ElegantGraphicsforDataAnalysis》;想玩高大上的交互图形的,推荐读《InteractiveandDynamicGraphicsforDataAnalysisWithRandGGobi》;怕麻烦想要看中文版本的话,谢益辉的《现代统计图形》也不错。
3.时间序列分析
有关时间序列分析的书籍分两类,一种是比较普适的;一类是比较专业的,例如泛经济领域中的时间序列分析。
比较普适的时间序列分析书籍,推荐《TimeSeriesAnalysisandItsApplications:withRexamples》,它介绍了各种时间序列分析的经典方法,以及实现各种经典方法的R代码。
泛经济领域中的时间序列分析书籍,比较流行的有《Analysisoffinancialtimeseries》和《TimeSeriesFAQ》。前者适合有时间序列分析基础和金融基础的读者,后者适合喜欢钻研的读者。想要研读关于协整理论的书籍,可以看看《AnalysisofIntegratedandCointegratedTimeSerieswithR》。还有高级一点的关于小波分析的,可以看看《WaveletMethodsinStatisticswithR》。
4.计量经济学
虽然《EconometricsInR》只是一本很薄的小册子,但是做计量经济学入门用,足矣。另外,《AppliedEconometricswithR》是对应AER的R包的书籍,安装该R包后配合使用,效果更好。计量经济学中很大一部分是关于时间序列分析的,可以参考上文。
5.金融
用R做金融的书籍,对于懂金融、不懂数据分析技术的人相对比较有用。毕竟,金融的领域很广泛,如果是大金融的话,保险也要被纳入其中,这就需要读者更多地掌握金融知识,如果只会数据分析技术的话,会比较难理解。
《AdvancedTopicsinAnalysisofEconomicandFinancialDataUsingR》、《ModellingFinancialTimeSeriesWithS-plus》,都是金融方面比较经典的书籍;另外,涉及金融产品定价的话,常常要用到随机微分方程,那么可以参详《SimulationInferenceStochasticDifferentialEquations:withRexamples》此书;如果是涉及风险度量与管理的话,比较经典的有《ModernActuarialRiskTheoryUsingR》、《QuantitativeRiskManagement:Concepts,TechniquesandTools》和《SimulationTechniquesinFinancialRiskManagement》;涉及投资组合分析类和期权定价类的,推荐看《OptionPricingandEstimationofFinancialModelswithR》和《PortfolioOptimizationwithR》两本。
无论是经济管理出身,还是IT出身,想要成为一名优秀的大数据分析师,好书总能助你一臂之力!