64位库资源:

http://www.lfd.uci.edu/~gohlke/pythonlibs/#six

https://nipy.bic.berkeley.edu/scipy_installers/

 

最近折腾python下nltk的学习,在安装科学计算包的时候好纠结。。。官方给的几乎都是win32的包,再者安装的过程由于版本的问题,卸载安装了好几次。。。写下来,大家也能借鉴借鉴。

nltk是一个python工具包, 可以用来处理和自然语言处理相关的东西。

1. 首先,当然是python 64位的安装,个人建议不要用过高的版本,这在后面安装各种包的时候,如果找不到对应的包,会很奔溃的。。

我是用的2.7版本,建议大家也用这个吧。移步下载https://www.python.org/downloads/windows/

我的安装目录是C:\Python27

 

2. 然后,就可以安装nltk(http://www.nltk.org/)的 工具包了。按照nltk安装的指南,他建议先安装Numpy. 那就先来安装Numpy吧。

 

2.1 Numpy的安装:伤脑筋的问题来了。。。哎,32位的好找,可是64为的好烦躁。。。寻找的过程中发现了这个牛逼的网站http://www.lfd.uci.edu/~gohlke/pythonlibs/  (可以存书签啦,这个链接以后会常常用到)。找到线面这个,就可以下载安装。

 

  • view plaincopy  
  1. import numpy  

2.2 接下来是nltk的安装了。移步https://pypi.python.org/pypi/nltk,可以看到悲剧了吧,哈哈,只有win32 的快捷安装哦~~ 

 

这个时候,就只能自己下载nltk-3.0.0.zip (md5) 了。下载完成后,先解压,修改文件名(短一点比较好,之后还要切换目录的,比如我就换成nltk),然后最好拷贝到python的安装目录下。也就是C:\python27下。

接下来就自己安装吧,可以用windows的命令行,也可以用python编辑器。先切换到要安装的文件目录,也就是C:\python27\nltk\。在python编辑器下,默认的工作目录是C:\python27,要切换的话,如下代码:

 

 

1. import os  
2. os.chdir("C:\\python27\\nltk\\")

 

之后,就可以进行安装啦。

 

1. setup.py install

 

如果没报错,那就成功啦。接下来是nltk的数据源下载。

 

1. import nltk  
2. nltk.download()

 

选择all,设置好下载路径(Download Directory),比如我就指定到了E:\nltkdata,然后点击Download,系统就开始下载NLTK的数据包了,下载的时间比较漫长,大家要耐心等待。如果有个别数据包无法下载,你可以切换到All Packages标签页,双击指定的包来进行下载。还有一点要注意:如果下载的时候你选择的下载路径自己选择了一个路径,那么要“通知”下系统,可以去环境变量里面设置下。具体如下:

 

我的电脑-右键-属性-高级系统设置-高级-环境变量-系统变量下新建-变量名为:NLTK_DATA,变量值为你下载的路径如我的就是E:\nltkdata  

下载完成后,可以测试下啦。

 


1. import nltk  
2. from nltk.book import *

 

导入下载的可供实验的数据,如果看到加载了text1-text9,那就成功啦。

 

 

3.scipy的安装:其实安装过之前的numpy后,这个也容易啦,就去这个神奇的网站吧。http://www.lfd.uci.edu/~gohlke/pythonlibs/

  • scipy‑0.14.0.win‑amd64‑py2.7.exe

下载前先看看有没有什么基础包要下载,查看要求,Requires numpy-mkl and optionally pil. Numpy我们之前安装过了,那么就好了(不要管optionally)。下载后,安装好,同样进行测试。


1. import scipy

 

没报错的,就okay啦。

  

4. matplotlib的安装:画图还是要maplotlib 啊。。。同样是进入神奇的网站,下载这个:

 

  • view plaincopy
  1. import matplotlib  

如果没红色提示,那就举手欢庆下,都成功了!!

5.可以开始我们的nltk学习之路了。教程中文版(好多被河蟹了,自己找吧)搜索“PYTHON自然语言处理中文翻译 NLTK 中文版”。按照教程,开始学习吧~~