一、什么是gensim

gensim是一个python的科学库,gensim包含了TF-IDF、随机投影、word2vec和document2vec算法的实现,分层Dirchlet过程(HDP),潜在语义分析(LSA)和潜在Dirichlet分配(LDA),包括分布式并行版本。主要是用来主题建模、文档索引以及使用大规模语料数据的相似性检索,被作者称为“根据纯文本进行监督性建模最健壮、最有效的、最让人放心的软件”。

二、gensim安装的注意事项

gensim可以安装在Windows、Linux和Mac OS以及其他的平台,但是它需要依赖python和numpy以及scipy,如下图

gem安装指定版本的gem gensim安装_gem安装指定版本的gem

至于numpy和scipy的安装我们可以直接安装一个anaconda就可以了,它也是python的一个科学计算库,它包含了python常用的科学计算库。gensim官网http://radimrehurek.com/gensim/

三、安装步骤

1、在安装anaconda之后,找到anaconda的安装路径,将anaconda下的scripts目录添加到,计算机-->属性-->高级系统设置-->高级-->环境变量-->系统变量-->找到path变量,将C:\Users\15053\Anaconda3\Scripts添加到path中,这个目录是我安装anaconda的目录,根据自己电脑的安装目录进行配置。

2、windows+r-->输入cmd-->输入python,如果出现如下图的提示说明配置成功了

gem安装指定版本的gem gensim安装_ci_02

3、找到anaconda的安装目录,在箭头指示的栏中输入cmd,然后打开命令提示符界面之后,输入pip install gensim安装gensim

gem安装指定版本的gem gensim安装_官网_03

4、输入命令可以安装gensim,但是你会发现,貌似下载的进度等了半天都没有变化,就像我这样,如果遇到这种情况情况5,,如果没有可以跳过以下步骤

gem安装指定版本的gem gensim安装_官网_04

5、为了解决这个问题,最后,我是先用IDM在gensim的官网下载了gensim2.3的版本,然后手动安装,将下载好的gensim进行解压,然后打开gensim的解压目录,在3所指向的栏中输入cmd后,然后输入python setup.py install,gensim2.3.0的下载地址

6、验证gensim是否安装成功,打开cmd输入python之后,然后在输入import gensim,出现下图一样,就表示安装成功了

gem安装指定版本的gem gensim安装_ci_05

特别提醒:如果,安装完成之后发现import gensim没有问题,但是使用from gensim import word2vec时报错时,建议去gensim官网下载MS windows install的exe程序进行安装,下载地址https://pypi.python.org/pypi/gensim,需要注意的是,安装的时候请确保gensim要求的环境都有,而且要下载和python的版本以及操作系统的版本一致的gensim进行安装,不然无法安装。安装完成之后,如果有警告可以忽略,如果有看到 ImportError: No module named 'smart_open',我们打开cmd,输入pip install smart_open安装好了,再次导入即可正常运行。

注意:特别需要注意的是,安装的gensim版本必须要和要求的python版本以及numpy、SciPy一致,否则可能会导致安装失败。