1. Python包管理工具
在安装Python包的过程中,经常涉及到distutils、setuptools、distribute、setup.py、easy_install、easy_install和pip等等。突然对Python的包管理凌乱了,这些工具关系是什么,应该怎么去选择使用?
下面就简单介绍下Python包管理相关的一些内容。
1.1 distutils
distutils 是 python 标准库的一部分,这个库的目的是为开发者提供一种方便的打包方式, 同时为使用者提供方便的安装方式。我们经常使用的setup.py就是基于distutils实现的,然后通过setup.py就可以进行打包或者安装了。
看一个简单的例子,找一个目录创建两个文件foo.py和setup.py,内容如下:
1 # foo.py
2 def func():
3 print 'hello world!'
1 # setup.py
2 from distutils.core import setup
3 setup(
4 name='foo',
5 version='1.0',
6 author='winter',
7 author_email='winter@126.com',
8 py_modules=['foo'],
9 )
然后,在该目录中运行如下命令:
会创建dist文件和一个foo-1.0.zip压缩文件,使用者就可以解压缩这个包,然后执行python setup.py install进行安装,然后就可以使用这个foo模块了。
关于更过如何编写setup.py的内容,请自行参阅Python官方文档中的setupscript部分。
1.2 setuptools 和 distribute
setuptools 是对 distutils 的增强,尤其是引入了包依赖管理。我们可以通过ez_setup.py来安装setuptools。
至于distribute,它是setuptools的一个分支版本。分支的原因是有一部分开发者认为 setuptools 开发太慢。但现在,distribute 又合并回了 setuptools 中,所以可以认为它们是同一个东西。
前面看到setup.py可以创建一个压缩包,而setuptools使用了一种新的文件格式(.egg),可以为Python包创建 egg文件。setuptools 可以识别.egg文件,并解析、安装它。
1.3 easy_install
首先,不推荐使用,因为只能安装不能卸载
当安装好setuptools/distribute之后,我们就可以直接使用easy_install这个工具了:
1) 从PyPI上安装一个包:当使用 easy_install package 命令后,easy_install 可以自动从 PyPI 上下载相关的包,并完成安装,升级
2) 下载一个包安装:通过 easy_install package.tgz 命令可以安装一个已经下载的包
3) 安装egg文件:通过 easy_install package.egg 可以安装一个egg格式的文件
根据上面的分析,可以看到setuptools/distribute和easy_install之间的关系:
a)setuptools/distribute 都扩展了 distutils,提供了更多的功能
b)easy_install是基于setuptools/distribute的一个工具,方便了包的安装和升级
1.4 PIP
pip是目前最流行的Python包管理工具,它被当作easy_install的替代品,但是仍有大量的功能建立在setuptools之上。
easy_install 有很多不足:安装事务是非原子操作,只支持 svn,没有提供卸载命令, 安装一系列包时需要写脚本。pip 解决了以上问题,已经成为新的事实标准。
通过pip –help查看帮助文档,cmd下直接运行pip命令;
如果你对yum和apt-get比较熟悉,那么pip的命令会让你有种似曾相识的感觉;
pip常用命令集合:
1)安装包
pip install SomePackage #从PyPI安装PyPI上最新的软件包
pip install SomePackage==1.0.4 #安装指定版本的软件包
pip install 'SomePackage>=1.0.4' #安装版本不能低于1.0.4
pip install ./downloads/SomePackage-1.0.4.tar.gz #本地安装
pip install http://my.package.repo/SomePackage-1.0.4.zip #从网上某个链接安装
还有一个根据依赖文件安装:
pip freeze > requirements.txt # 使用pip导出依赖文件列表
pip install -r requirements.txt # 根据依赖文件列表,自动安装对应的软件包
2)升级包
pip list --outdated #查看可升级软件包
pip install --upgrade SomePackage #升级软件包
3)卸载包
pip uninstall SomePackage
4)查询包
pip list #查看已安装软件包
pip show --files SomePackage #查看软件包安装了哪些文件及路径等信息
pip search “query” #不知道要安装的软件包的具体名称,使用search命令进行查询,会列出相关的包
5)配置镜像源
pip的镜像地址默认在国外,速度比较慢,可以设置为国内镜像源
a)linux
修改 ~/.pip/pip.conf (Linux/Mac)
b)windows
C:\Users\当前用户名\pip\pip.ini(没有pip.ini就创建一个)
国内的可以配置成清华的镜像源,配置为:
[global]
index-url = https://pypi.tuna.tsinghua.edu.cn/simple
6)pip代理设置
pip install xxx --proxy=http://username:password@host:port
7)升级pip
有时在安装python包时会提示pip版本过低:
这时需要升级pip版本,执行如下命令
pip install --upgrade pip -vvv
1.5 Conda包管理
说到conda,就必须要说到anaconda了;
Anaconda是一个用于科学计算的Python发行版,支持 Linux, Mac, Windows系统,拥有大量的用于科学计算的第三方库;
conda是anaconda的包管理和环境管理工具, 是 pip 和 vitualenv 的组合。强烈推荐
anaconda解决了Python开发者的两大痛点:
1)提供包管理,功能类似于 pip,Windows 平台安装第三方包经常失败的场景得以解决。
2)提供虚拟环境管理,功能类似于 virtualenv,解决了多版本Python并存问题。
安装时,会发现有两个不同版本的Anaconda,分别对应Python 2.7和Python 3.5,两个版本其实除了这点区别外其他都一样。后面我们会看到,安装哪个版本并不本质,因为通过环境管理,我们可以很方便地切换运行时的Python版本。
通过conda –help命令查看帮助
1)安装包
conda install -n python34 somepackage # -n 安装到指定环境;如果不用-n指定环境名称,则被安装在当前活跃环境;-c 指定通过某个channel安装
2)升级包
提示:pip只是一个包管理器,所以它不能为你管理环境。pip甚至不能升级python,因为它不像conda一样把python当做包来处理。但是它可以安装一些conda安装不了的包。
conda可以用来升级python,anaconda,conda,有木有感觉很强大
conda update -n python34 xxx # 更新package
conda update conda # 更新conda,保持conda最新
conda update anaconda # 更新anaconda
conda update python # 更新python
3)删除包
conda remove -n python34 xxx
4)查询包
conda install xxxx # 安装xxxx
conda list # 查看当前环境下已安装的包
conda list -n python34 # 查看某个指定环境的已安装包
conda search xxx # 查找package信息
5)修改镜像源
a)命令方式
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/ # 添加Anaconda的TUNA镜像,TUNA的help中镜像地址加有引号,需要去掉
conda config --set show_channel_urls yes # 设置搜索时显示通道地址
b)配置文件方式
修改.condarc (Windows) 配置:
channels:
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
- defaults
show_channel_urls: yes
2. conda环境管理
2.1 conda多环境设置
主要用于解决多版本python共存的问题,同时针对不同的项目创建独立的开发环境;除了conda,其他主流的还有virtualenv和pyenv,但是我还是喜欢用conda
1)通过conda命令管理
# 创建一个名为python34的环境,指定Python版本是3.4(不用管是3.4.x,conda会为我们自动寻找3.4.x中的最新版本),新的开发环境会被默认安装在目录~/anaconda/envs下。你可以通过-h指定一个其他的路径;如果我们没有指定安装python的版本,conda会安装我们最初安装conda时所装的那个版本的python。
conda create –name python34 python=3.4
# 安装好后,使用activate激活某个环境
activate python34 # for Windows
source activate python34 # for Linux & Mac
# 激活后,会发现terminal输入的地方多了python34的字样,实际上,此时系统做的事情就是把默认2.7环境从PATH中去除,再把3.4对应的命令加入PATH
# 此时,再次输入
python--version
# 可以得到`Python 3.4.5 :: Anaconda 4.1.1 (64-bit)`,即系统已经切换到了3.4的环境
# 如果想返回默认的python 2.7环境,运行
deactivate python34 # for Windows
source deactivate python34 # for Linux & Mac
# 复制一个环境
conda create -n pyhon34 --clone python34clone
# 删除一个已有的环境
conda remove –name python34 --all
# 查看已安装的环境,当前被激活的环境会显示有一个星号或者括号
conda info -e
activate和deactivate效果如下:
2)pycharm
非常简单
设置环境名字,存放的位置以及环境安装的python版本
2.2 偷偷盗取一篇很牛逼的博文
关于conda和anaconda不可不知的误解和事实——conda必知必会
2012年发布的跨平台包管理软件conda,是在数据分析界和Numpy和Scipy一样受欢迎的python工具。但是普通程序员平时只是会使用conda安装一些第三方包, 对它从哪里来,它是什么,和它要到哪里去所知甚少。今天我们就要讲一下关于conda和anaconda不可不知的误解和事实——conda必知必会的那些事实。
误解 #1:Conda是python的一个发行版,不是一个包管理器。
事实: Conda是一个包管理器;Anaconda才是一个python发行版。虽然conda是用Anaconda打包的,但是它们两个的目标是完全不同的。
软件发行版是在系统上提前编译和配置好的软件包集合, 装好了后就可以直接用。包管理器是自动化软件安装,更新,卸载的一种工具。Conda,有命令”conda install”, “conda update”, “conda remove”, 所以很明显, conda是包管理器。
再来说说, Anaconda 和 Miniconda. Anaconda发行版会预装很多pydata生态圈里的软件,而Miniconda是最小的conda安装环境, 一个干净的conda环境。
但是,conda和Anaconda没有必然关系, 你可以不安装Anaconda的同时, 使用conda安装和管理软件。
误解 #2: Conda是一个python包管理器
事实:Conda是一个通用的包管理器,当初设计来管理任何语言的包。所以用来管理python包当然也是绰绰有余。
$ conda search –canonical | grep -v ‘py\d\d’
这句命令可以帮你找出不是 pip和virtualenv可以管理的python包,而conda可以管理
误解 #3: Conda 和 pip 是直接竞争关系
事实:Conda 和 pip 目标并不相同,只有小部分子集有交集有竞争关系:比如python包的安装和环境隔离。
一句话就可以看出区别:
pip可以允许你在任何环境中安装python包,而conda允许你在conda环境中安装任何语言包(包括c语言或者python)。
如果我们只是关注python包安装,conda和pip也是为不同用户和不同目标定制的。如果你想在一个已有系统快速管理python包,那你应该选择pip,因为conda应该在conda环境中使用,而pip鼓励在任何环境中使用 。而如果,你想要让许多依赖库一起很好地工作(比如数据分析中的Numpy,scipy,Matplotlib等等)那你就应该使用conda,conda很好地整合了包之间的互相依赖。
误解 #4: 使用conda首先是不负责任并且会引起分歧的
事实:Conda作者多年来用python标准创造conda,只有在非常清晰合理的时候,才使用其他工具。
你可能会问,我相信conda是遵循python标准的,但是它们为什么偏偏要撇开pip自己去造一套包管理器呢?为什么他们不直接去pip团队贡献想法呢?
事实上,一开始conda那伙人是想在pip社区贡献想法和代码的,但是像numpy,scipy这样对底层c库有复杂依赖的包管理需求,真的不多,所以社区不接受这样的不常有的需求。所以,他们只能自己去造conda包管理器了。
误解 #5: conda不能和virtualenv一起使用,所以它对我的工作没用
事实上:你可以在virtualenv环境下安装conda,但是最好用conda自己的环境工具,这样会和pip有更好的兼容性
你可以在virtualenv里面安装conda:
$ virtualenv test_conda
$ source test_conda/bin/activate
$ pip install conda
$ conda install numpy
也可以在conda中造虚拟环境:
$ conda create -n yourenvname python=x.x anaconda
$ source activate yourenvname
误解 #6: 现在pip用wheels了,conda没什么用了
事实:wheels只是解决了conda试图克服的许多困难中的一个, conda二进制编排还是有很多wheels没有的优势
wheels和conda都解决了预编译的代码安装问题(不仅仅是源代码安装)。但是wheel没有conda的依赖处理能力,wheels只能跟踪python代码的依赖关系,conda可以跟踪很多c代码的依赖关系,这为许多用numpy和scipy做科学计算优化的科学家省了不少心。
误解 #7: conda不是开源的;它是被盈利公司掌控的,如果有一天公司想收费了,那你就得付钱
Reality: conda (the package manager and build system) is 100% open-source, and Anaconda (the distribution) is nearly there as well.
Anaconda和conda都是standard BSD license开源标准。如果你还不放心,用pip install conda吧,这是完全开源的。
误解 #8: Conda 软件包本身都是闭源的吧?
事实: 虽然conda默认渠道没有完全开源,但是有一个社区牵头的conda-forge,它会推动conda的包和发行版完全开源。
误解 #9: 但是,如果Continuum Analytics公司倒闭,conda就不会存活了吧 ?
事实: conda没有和Continuum Analytics公司有很多牵扯;公司为社区免费提供支持服务,所有软件都有负责人,而不是公司全权负责。
误解 #10: 每个人都应该抛弃(conda | pip)去用(pip | conda) !
事实: pip 和 conda 是为不同目的存在的,我们应该更加关注怎么同时用好这两个工具,而不是只用一个