1.到coreseek官网 http://www.coreseek.cn/ 找到你需要安装的源码包版本。如:coreseek-4.1-beta.tar.gz

2.在CentOS中下载该源码包。命令如下:

  wget http://www.coreseek.cn/uploads/csft/4.0/coreseek-4.1-beta.tar.gz

3.解压缩该源码包。命令如下:

 tar zxvf coreseek-4.1-beta.tar.gz

4.进入到解压后的文件夹中。

  包中文件结构如下图:

Linux CentOS6.5  Coreseek安装_linux

5.进入到mmseg-3.2.14目录,在该目录中运行./bootstrap 命令。【检查环境是否满足安装coreseek】效果图如下:

Linux CentOS6.5  Coreseek安装_linux_02


6.指定安装coreseek安装路径。命令如下:

./configure --prefix=/usr/local/mmseg3(该名字可以任意取)

 效果图如下:

Linux CentOS6.5  Coreseek安装_centos_03


7.实际安装coreseek。命令如下:

  make && make install


8.在/usr/local/文件夹中生成了mmseg3文件夹,该文件架结构如下图:

Linux CentOS6.5  Coreseek安装_中文分词_04


9.进入到/usr/local/mmseg3/bin 目录中,执行如下命令:

./mmseg -d /usr/local/mmseg3/etc /usr/local/src/coreseek-4.1-beta/mmseg-3.2.14/src/t1.txt


注意了:t1.txt内容如下图:

Linux CentOS6.5  Coreseek安装_linux_05



该命令的作用:运用到/usr/local/mmseg3/etc目录中配置文件(即是coreseek的配置文件),测试coreseek自带的测试文本t1.txt(该文本可以任意自建)的分词效果。

效果图如下:


Linux CentOS6.5  Coreseek安装_centos_06


10.让coreseek与sphinx联系起来。进入到/usr/local/src/coreseek-4.1-beta/csft-4.1(该文件夹就是sphinx源码包)文件夹,在该文件中运行如下命令,检测相关环境是否可行。

sh buildconf.sh

如果没有报任何错误,就可以安装sphinx了。


11.安装coreseek文件夹中sphinx。

 执行如下命令:

./configure --prefix=/usr/local/coreseek --without-unixodbc --with-mmseg --with-mmseg-includes=/usr/local/mmseg3/include/mmseg/ --with-mmseg-libs=/usr/local/mmseg3/lib --with-mysql

执行上面命令后,执行:

 make && make install


至此coreseek安装完成,这样就可以很好的支持中文分词了。(sphinx对中文分词不好,它对英文分词非常的好)。