我又来水博客了,今天我做了关键词提取算法。
代码我会上传到我的github中去,这个算法需要stopword和corpus两个txt格式,导入的时候,会出现下面的错误
gbk' codec can't decode byte 0x80 in position 26: illegal multibyte sequence只需要在里面的open函数里面加一句encoding=“utf-8”即可。
然后把源码一运转就行了,下面是结果。
我又来水博客了,今天我做了关键词提取算法。
代码我会上传到我的github中去,这个算法需要stopword和corpus两个txt格式,导入的时候,会出现下面的错误
gbk' codec can't decode byte 0x80 in position 26: illegal multibyte sequence只需要在里面的open函数里面加一句encoding=“utf-8”即可。
然后把源码一运转就行了,下面是结果。
上一篇:中文文本分类算法大汇总。
用Python开发的小红书采集软件,根据关键词批量爬取笔记链接等。
用python开发的youtub采集软件,根据关键词批量爬取油管的搜索结果。
举报文章
请选择举报类型
补充说明
0/200
上传截图
格式支持JPEG/PNG/JPG,图片不超过1.9M