HanLP是由一系列模型与算法组成的工具包,目标是普及自然语言处理在生产环境中的应用。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点;提供词法分析(中文分词、词性标注、命名实体识别)、句法分析、文本分类和情感分析等功能。

参考了网上的好多资源写了此博文

如果你的pytorch版本和GPU是对应的兼容版本,重要提示不要直接pip install pyhanlp  或者pip install hanlp ,它会让你的pytorch自动更新升级。pytorch自动更新升级的还有torchtext。安装的时候需要注意。安装torchtext需要

conda install -c pytorch torchtext

(安装的时候观察一下,如果出现torch的更新,立马关掉命令)

下面我们开始安装hanlp,首先需要你电脑上配有Visual C++我的是

corenlp 中文词性标注 hanlp词性标注_java

然后就是java中的JDK,一般电脑上安装过neo4j或者Navicat premium过的都会有JDK的插件(这3个软件我安装太久了,忘记了,大家自行搜搜吧)

打开cmd 先执行pip install jpype1(这里是jpype1有一个数字1)

测试jpype是否成功

>>> from jpype import *
>>> startJVM(getDefaultJVMPath(), "-ea")
>>> java.lang.System.out.println("月亮就是被人偷走的")
月亮就是被人偷走的
>>> shutdownJVM()
>>>

这是成功了,我的python是3.9的,在具体哪个网站找到这两个文件的我也忘记了,只记得找了好久(因为自己太菜了)现在分享给有需要的人,在我的主页里面的资源里面hanlp的压缩包。下载保存到你的文件夹,需要注意的就是hanlp文件夹里面的hanlp.properties的文件用记事本打开修改root,root=你保存此文件的路径。我的保存为D盘下的ok文件夹下HANLP的文件夹下了

corenlp 中文词性标注 hanlp词性标注_自动更新_02

 修改之后,在pycharm里面运行测试

from jpype import *

startJVM(getDefaultJVMPath(), "-Djava.class.path=D:\ok\HANLP\hanlp\hanlp-1.8.3.jar;D:\ok\HANLP\hanlp",
         "-Xms1g",
         "-Xmx1g") # 启动JVM,Linux需替换分号;为冒号:

print("=" * 30 + "HanLP分词" + "=" * 30)
HanLP = JClass('com.hankcs.hanlp.HanLP')
        # 中文分词
print(HanLP.segment('月球持续偷走地球的能量,渐渐对地球造成打击,地球将无四季之分'))
print("-" * 70)

shutdownJVM()

结果为

==============================HanLP分词==============================
[月球/n, 持续/vd, 偷走/v, 地球/ns, 的/ude1, 能量/n, ,/w, 渐渐/d, 对/p, 地球/ns, 造成/v, 打击/v, ,/w, 地球/ns, 将/d, 无/v, 四季/n, 之/uzhi, 分/qt]
----------------------------------------------------------------------

具体详细内容访问https://zhuanlan.zhihu.com/p/62766818?utm_source=wechat_session

这个就是可以完整下来hanlp的步骤,其他方法对于我来说都不行。