Anaconda 是一个用于科学计算的 Python 发行版,支持 Linux、Mac、Windows 系统,包含了众多流行的科学计算、数据分析的 Python 包。此外,Anaconda 提供了包管理与环境管理的功能,可以很方便地解决多版本 python 并存、切换以及各种第三方包安装问题。Anaconda 利用工具/命令 conda 来进行 package 和 environment 的管理,并且已经包含了 Python 和相关的配套工具。
与其说 Anaconda 是一个 IDE,还不如说它是一个 Python 环境。Anaconda 中包含 Numpy、Pandas、Matplotlib 等库,所以说利用 Anaconda 可以让我们避免将过多的精力花在环境搭建上,从而快速进入机器学习的探索当中。
Anaconda 的官方下载地址是 https://www.continuum.io/downloads/,但是国内下载实在太慢了,那么我们可以到清华大学开源软件镜像站下载 Anaconda 安装包。除此之外,清华大学 TUNA 团队还提供了 Anaconda 仓库的镜像,运行以下命令:
即可添加 Anaconda Python 免费仓库,然后运行 conda install numpy 测试一下吧。
我这里下载了 Windows 64bit 版本的 Anaconda,安装过程很简单,双击 exe 文件,根据提示点击“下一步”即可。

Anaconda 包含有超过720个关于科学,数据,工程和数据分析的 Python 和 R 包,我安装的这个版本需要 1.8GB 空间。如果不想在电脑里安装过多的包,也可以使用 Miniconda,它包含了 conda、它的依赖包以及 Python 包。
安装完之后,打开 Anaconda Prompt,输入 conda list 列出所有的已安装的 packages,如下图所示。

可以看到,我们接下来的机器学习所需要的一些库已经安装好了,包括:
- Numpy:科学计算库,封装了很多矩阵处理的函数;
- Pandas:数据分析处理库,封装了很多数据处理的函数;
- Matplotlib:数据可视化库,封装了很多可视化的函数;
- Scikit-learn:机器学习库,封装了机器学习、建模的函数。
最后总结一下:实际上 conda 可以理解为一个工具,也是一个可执行命令,其核心功能是包管理与环境管理。包管理与 pip 的使用类似,环境管理则允许用户方便地安装不同版本的 python 并可以快速切换。Anaconda 则是一个打包的集合,里面预装好了 conda、某个版本的 python、众多 packages、科学计算工具等等,所以也称为 Python 的一种发行版。其实还有 Miniconda,顾名思义,它只包含最基本的内容—— python 与 conda,以及相关的必须依赖项,对于空间要求严格的用户,Miniconda 是一种选择。
【参考阅读】
http:///86236/
http://www.360doc.com/content/16/1029/18/25664332_602357786.shtml
















