数据类书籍推荐
《Python科学计算》
我的科学计算类入门书籍。当年自己毕业论文涉及到数据处理的部分,都是用的在这本书里学到的东西。从发行版的安装开始,这本书将科学计算及可视化的常见函数库,如numpy、scipy、sympy、matplotlib、traits、tvtk、mayavi、opencv等等,都进行了较为详细地介绍。由于涉及面太广,可能对于单个函数库来说还不够深入,但是这本书能够让人快速上手,全面了解科学计算所用到的常用函数库。进而在此基础上选择自己需要的函数库进行深入学习,相对来说要容易得多。此外,这本书还有免费的在线版本(在确定出版纸书之后停止了更新,不知道后来有没有继续更新),可谓业界良心。
《NumPyBeginner's Guide 2nd》/《Python数据分析基础教程:NumPy学习指南(第2版)》
面向新手的一本Numpy入门指南。整本书可谓是短小精干,条理清晰,将Numpy的基础内容讲得清清楚楚明明白白。此书的作者还写过一本《NumPyCookbook》/《NumPy攻略:Python科学计算与数据分析》,但这本书相比于前者,就显得结构有些杂乱,内容上也有些不上不下,如果要看的话,建议看完第一本再来看这本。在这里还想顺便吐槽一下这两本书的中文书名翻译。为了能够多卖几本,出版社也是蛮拼的,想方设法都要跟数据分析几个字挂上钩,就好像现在某些书总要扯上云和大数据一样。此外,还有一本《LearningSciPy for Numerical and Scientific Computing》的书,可以作为SciPy的入门教程来学习(似乎还没出中文版)。
《Pythonfor Data Analysis》/《利用Python进行数据分析》
这本书也是从numpy讲起,侧重于数据分析的各个流程,包括数据的存取、规整、可视化等等。此外,本书还涉及了pandas这个库,有兴趣的可以看看。
《MachineLearning in Action》/《机器学习实战》
Python机器学习的白盒入门教程,着重于讲解机器学习的各类常用算法,以及如何用Python来实现它们。这是一本教你如何造轮子的书,但是造出来的轮子似乎也不怎么好用就是了。不过,对于立志要造汽车的人们来说,了解一下轮子的结构和原理,还是十分必要的。此外,打算阅读此书之前,如果各位的高数线代概率论都忘得差不多了的话,还是先补一补比较好。
《BuildingMachine Learning Systems with Python》/《机器学习系统设计》
Python机器学习的黑盒入门教程。如果说上一本书是教你如何组装轮子的话,这本书就是直接告诉你怎么把轮子转起来以及如何才能转得更好。至于轮子为什么能转起来,请参阅上一本书。另外,可以配合《Learning scikit-learn:Machine Learning in Python》这本书来阅读(暂无中文版)。这本书是针对Python的机器学习库scikit-learn进行专门讲解的一本书,100页左右,可以作为官方文档的拓展读物。
《Pythonfor Finance》
教你用Python处理金融数据的一本书,应该是中国人写的,Packt出版,不过似乎现在还没有中文版。比起前面几本书,这本书专业性要强一些,侧重于金融数据分析。这本书我还没怎么看,也写不出什么更详细的介绍。之所以把它列出来,是因为在查资料的时候发现,O'Reilly年底似乎也准备出一本《Python for Finance》。看来Python真的是越来越火了。
Pastedfrom <http://dataunion.org/bbs/forum.php?mod=viewthread&tid=512>