easy_install 安装软件 及BeautifulSoup 中文乱码
安装easy_install工具
使用ez_setup.py脚本方便安装:
wget
-
q http:
//
peak.telecommunity.com/dist/ez_setup.py
python ez_setup.py
安装完后,最好确保easy_install所在目录已经被加到PATH环境变量里:
Windows: C:\Python25\Scripts
Linux: /
usr
/
local
/
bin
安装 Mechanize 和 BeautifulSoup
安装Mechanize 和 BeautifulSoup,可以执行如下命令,系统会自动在pypi网站列表里查找相关软件包:
easy_install Mechanize
easy_install BeatifulSoup
BeautifulSoup中文乱码
简单的一段代码:
from BeautifulSoup import BeautifulSoup
page = "
<a><s>中文</s></a>
"
soup = BeautifulSoup(page, fromEncoding =
"
utf-8
"
)
print
soup
f = open( "
ss.txt
"
,
"
w+
"
)
f.write(str(soup))
f.close()
打印出来的乱码,写入文件却是正常的。查了一下,这个跟shell的编码有关,windows的一般是gbk,所以utf-8出乱码很正常,如果要正常打印,只要把字符串转换成指定编码方式就可以。