说到机器学习,相信大部分的研究者都是使用python来完成的,因为是实在太方便了,几行代码就搞定了,比较前人做的研究都积累在那边,所以今天我又重新安装了python(还不是因为要做机器学习方面的实验和luwn论文),so开始吧!

1、常用Python机器学习包

Numpy:用于科学计算的包

Pandas:提供高性能,易于使用的数据结构和数据分析工具

Scipy:用于数学,科学工程的软件

StatsModels:用于探索数据、估计统计模型、统计检验

Scikit-learn:提供经典的机器学习算法用于数据挖掘和数据分析

matplotlib:2D绘图库,可绘制高质量的图片

这些包是太好用了,Windows安装Python机器学习包网址:http://dblab.xmu.edu.cn/blog/python-machine-learning-package-windows

2、pip安装

pip 是一个安装和管理 Python 包的工具,若按照教程Python安装与基本使用安装了 Python 3.6,则默认已经安装了 pip,在开始菜单中找到“运行”(或者使用键盘快捷键Win + r),输入“cmd”,打开Windows 命令提示符,执行如下命令进行检验:

pip --version

若已经装好了pip,运行结果如下图如下,显示已安装的版本

python 导入依赖库 scipy依赖库_Python

PIP下载网址:https://bootstrap.pypa.io/get-pip.py,下载完成后,在对应目录下(即d:\get-pip.py),在cmd中,依次执行如下三条代码:

d:
cd d:\
python get-pip.py

安装成功后如下图所示,提示Successfully installed pip。

事实上我们在给Python3.6.1安装numpy库,可以选择直接键入命令:pip3 install numpy 。当然这样偷懒的方法又是不靠谱。

 

3、机器学习包的下载和安装

python 导入依赖库 scipy依赖库_机器学习_02

下载上述包的时候看好要下载的版本和位数。千万不要下错了。下载完成机器学习包后,进入到对应的下载目录文件下,使用pip3进行安装

python 导入依赖库 scipy依赖库_Python_03

在 cmd 中,可以利用 tab 键补全文件名,例如要安装 six-1.10.0-py2.py3-none-any.whl,只需要先输入 pip install six,再按一下 tab 键,就能自动补全文件名了,省去复制文件名的步骤。

pip install six-1.10.0-py2.py3-none-any.whl
pip install python_dateutil-2.5.0-py2.py3-none-any.whl
pip install pytz-2015.7-py2.py3-none-any.whl
pip install pandas-0.16.2-cp36-none-win_amd64.whl
pip install patsy-0.4.0-py2.py3-none-any.whl
pip install scipy-0.16.1-cp36-none-win_amd64.whl
pip install statsmodels-0.6.1-cp36-none-win_amd64.whl
pip install scikit_learn-0.16.1-cp36-none-win_amd64.whl
pip install pyparsing-2.0.7-py2.py3-none-any.whl
pip install cycler-0.10.0-py2.py3-none-any.whl
pip install matplotlib-1.5.1-cp36-none-win_amd64.whl

基本上上述操作就可以完成安装了。