- 安装支持pip3
首先需要安装支持Python3的pip管理工具,如果是Python2.x可以直接使用如下命令:
sudo apt-get install pip
这样安装的是pip2不支持Python3.x,可以使用如下命令安装pip3
sudo apt-get install python3-pip
可以使用如下命令查看pip3是否安装成功
pip3 --version
- 安装scrapy
scrapy是一个快速高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据,可以用于数据挖掘、检测和自动化测试。
该扩展库具有如下优点:整个爬取过程简单。创建一个类,并定义要删除的项目类型,编写一些从网页中提取数据的规则,结果将以JSON、XML、CSV或其他的格式导出,搜集的数据可以保存在raw,也可以在导入时进行清理。此外scrapy可以扩展允许其他行为例如网站登录处理、会话cookie处理。图像也可被scrapy自动提取并与被抓取的内容进行关联。
总是scrapy是一个很强大的爬虫爬取框架。
可以使用如下命令安装,首先需要安装scrapy依赖项,否则scrapy安装失败,执行如下命令:
sudo apt-get install builld-essential libssl-dev libffi-dev python3-dev
之后取得系统root权限安装scrapy
su
pip3 install scrapy
此时出现如下错误信息
要求升级pip3,针对pip2的升级命令如下:
pip install --upgrade pip
而针对pip3的升级命令如下:
pip3 install --upgrade pip
对,你没看错,最后一个确实是pip!
在root模式下重新执行命令
pip3 install scrapy
安装完成后输入scrapy显示如下信息即安装成功:
- 安装numpy
numpy是一个开源的科学计算和数学工作基础包,包括统计学、线性代数、矩阵等
可使用如下命令安装,同样需要取得root权限
su
pip3 install numpy
- 安装itchat
itchat是一个封装了微信API的Python扩展库,支持Python3.x
su
pip3 install itchat
5.查看当前Python环境安装了什么库可使用如下命令
pip3 list
也可以指定查看某个库是否已经安装,如下命令
pip3 list | grep Scrapy
结果如下
注意区分库名称的大小写