Essential Python Lib 本节主要介绍Python用于大数据分析常用的各类库。Numpy Python下专用的数值计算标准模块库,包括: 1、一个强大的N维数组对象Array;2、比较成熟的(广播)函数库;
3、用于整合C/C++和Fortran代码的工具包;
4、实用的线性代数、傅里叶变换和随机数生成函数。numpy和稀疏矩阵运算包scipy配合使用更加方便。
5、线性计算
Numpy的数组是Python下一个强大的数据分类、管理手段高级工具。Numpy底层是用C语言编写的。Pandas Python下的Pandas模块可以快速、高效的对大数据进行处理。本书后续章节多出使用Pandas模块进行大数据处理和分析,常使用pandas里的dataframe对象,类似Excel二维表单结构,采用行列展示输出结果。Pandas和Numpy的结合使得pandas有能力处理二维表单或数据库表单。 Pandas在金融行业的数据处理更加得心应手,事实上pandas设计之初就是为了处理金融方面的数据分析