出租车价格预测·依赖包功能了解

  • numpy和pandas
  • matplotlib
  • seaborn
  • scipy
  • sklearn
  • ipython



在预测问题baseline中先引入了一些依赖包,作为小白先了解一下这些包的功能和使用方法。

numpy和pandas

NumPy (Numerical Python的简称):作为多维数组(ndarray)容器,可以对数组执行元素级计算以及直接对数组执行数学运算的函数。其也是用于读写硬盘上基于数组的数据集的工具。数据处理速度比Python自身的嵌套列表要快很多。

Pandas (名字来源于panel data面板数据): 是基于NumPy的一种工具,提供了快速便捷地处理结构化数据的大量数据结构和函数。使用最多的pandas对象主要是Series(一组数据及相应的索引标签)和DataFrame (二维表结构)。

matplotlib

Numpy主要对数据进行计算,但结果都是数字。要分析这些数据,就需要可视化。这时,有Matplotlib包来拯救我们。Matplotlib是强大的可视化库,而要使用 Matplotlib需要导入其子包pyplot。

seaborn

seaborn包是对matplotlib的增强版,需要安装matplotlib后才能使用。可以绘制出更加高级的统计分布图

scipy

SciPy是世界上著名的Python开源科学计算库,建立在Numpy之上。SciPy函数库在NumPy库的基础上增加了众多的数学、科学以及工程计算中常用的库函数。例如线性代数、常微分方程数值求解、信号处理、图像处理、稀疏矩阵等等。

sklearn

Sklearn (全称 Scikit-Learn) 是基于 Python 语言的机器学习工具。它建立在 NumPy, SciPy, Pandas 和 Matplotlib 之上,里面的 API 的设计非常好,所有对象的接口简单,很适合新手上路。
在 Sklearn 里面有六大任务模块:分别是分类、回归、聚类、降维、模型选择和预处理。

ipython

iPython 是一个Python 的交互式Shell,比默认的Python Shell 好用得多,功能也更强大。 支持语法高亮、自动完成、代码调试、对象自省,支持 Bash Shell 命令,内置了许多很有用的功能和函式等,非常容易使用。
该文章相关知识也参考了该领域专家学者们的分享,侵权删。关于这些依赖包的使用,期待在后续的学习和使用中认识和了解.