说到机器学习,相信大部分的研究者都是使用python来完成的,因为是实在太方便了,几行代码就搞定了,比较前人做的研究都积累在那边,所以今天我又重新安装了python(还不是因为要做机器学习方面的实验和luwn论文),so开始吧!
1、常用Python机器学习包
Numpy:用于科学计算的包
Pandas:提供高性能,易于使用的数据结构和数据分析工具
Scipy:用于数学,科学工程的软件
StatsModels:用于探索数据、估计统计模型、统计检验
Scikit-learn:提供经典的机器学习算法用于数据挖掘和数据分析
matplotlib:2D绘图库,可绘制高质量的图片
这些包是太好用了,Windows安装Python机器学习包网址:http://dblab.xmu.edu.cn/blog/python-machine-learning-package-windows
2、pip安装
pip 是一个安装和管理 Python 包的工具,若按照教程Python安装与基本使用安装了 Python 3.6,则默认已经安装了 pip,在开始菜单中找到“运行”(或者使用键盘快捷键Win + r),输入“cmd”,打开Windows 命令提示符,执行如下命令进行检验:
pip --version
若已经装好了pip,运行结果如下图如下,显示已安装的版本
PIP下载网址:https://bootstrap.pypa.io/get-pip.py,下载完成后,在对应目录下(即d:\get-pip.py),在cmd中,依次执行如下三条代码:
d:
cd d:\
python get-pip.py
安装成功后如下图所示,提示Successfully installed pip。
事实上我们在给Python3.6.1安装numpy库,可以选择直接键入命令:pip3 install numpy 。当然这样偷懒的方法又是不靠谱。
3、机器学习包的下载和安装
下载上述包的时候看好要下载的版本和位数。千万不要下错了。下载完成机器学习包后,进入到对应的下载目录文件下,使用pip3进行安装
在 cmd 中,可以利用 tab 键补全文件名,例如要安装 six-1.10.0-py2.py3-none-any.whl,只需要先输入 pip install six,再按一下 tab 键,就能自动补全文件名了,省去复制文件名的步骤。
pip install six-1.10.0-py2.py3-none-any.whl
pip install python_dateutil-2.5.0-py2.py3-none-any.whl
pip install pytz-2015.7-py2.py3-none-any.whl
pip install pandas-0.16.2-cp36-none-win_amd64.whl
pip install patsy-0.4.0-py2.py3-none-any.whl
pip install scipy-0.16.1-cp36-none-win_amd64.whl
pip install statsmodels-0.6.1-cp36-none-win_amd64.whl
pip install scikit_learn-0.16.1-cp36-none-win_amd64.whl
pip install pyparsing-2.0.7-py2.py3-none-any.whl
pip install cycler-0.10.0-py2.py3-none-any.whl
pip install matplotlib-1.5.1-cp36-none-win_amd64.whl
基本上上述操作就可以完成安装了。