windows下安装SCWS的中文扩展:
去官网下载php_scws.dll(PHP-5.2.x根据php版本选择) 、XDB 词典文件(简体中文(UTF-8)可选gbk,也可以把两个词典文件都下载)、规则集文件(rules.tgz)
创建c:\Program Files\scws(建议)目录,吧XDB、和规则文件解压后的文件都拷贝到该目录中
把php_scws.dll文件拷贝到php安装目录的\ext\下
在php.ini(通常在c盘下)加入以下几行:
[scws]
extension = php_scws.dll
scws.default.charset = utf8 scws.default.fpath = "c:/Program Files/scws"5. 最后重启Apache,进入phpinfo,若找到scws扩展信息说明安装成功
测试:
<?php $pscws = scws_new(); //建立scws对象 //发送要分词的文本 $pscws->send_text('中文文本在计算分析中一个问题是中文文本在印刷时缺少单词的边界'); //获取分词结果,以关联数组形式返回 $some = $pscws->get_result(); print_r($some); //获取词频排在前5的词,该数组同时包含idf $tops = $pscws->get_tops(5, 'n,v'); print_r($tops); $scws->close(); //关闭释放资源 ?>
官网的安装步骤有些让人摸不着头脑,建议别去看