qq59caeb714a7a4的博客_自然语言处理

第四章-分词

解决问题？分词精确模式搜索引擎模式添加词典调整词典关键词提取词性标注------------------------------------------------------

自然语言处理

词性标注

搜索引擎

ico

原创 2022-08-16 11:49:34 233 阅读

第一章-语言处理与Python

第一章解决的问题：搜索文本搜索单词搜索相似词搜索共同上下文词汇分布图自动生成文章计数词汇重复词密度关

自然语言处理

搜索

自动生成

链表

原创 2022-08-16 11:49:21 94 阅读

第二章-获取文本语料和词汇资源

解决的问题使用古腾堡语料库网络和聊天文本布朗语料库路透社语料库就职演讲语料库其他语料库载入自己的语料库条件频率

自然语言处理

词频

相似度

实例代码

原创 2022-08-16 11:49:08 34 阅读

第三章-处理原始文本

需要解决的问题？txt在线文档下载分词创建text根据内容定义开始与结尾HTML下载HTML解析过滤无关内容读取本地文件正则表

自然语言处理

ico

lua

html

原创 2022-08-16 11:48:48 58 阅读

第五章-词性标注

词性标注器解决的问题？标注语料库名词动词未简化标记搜索已标注的语料库自动标记默认标注器正则表达式标注器查询标注器N

自然语言理解

lua

正则表达式

元模型

原创 2022-08-16 11:48:33 1158 阅读

第七章-文本聚类

加载影片数据数据清洗，获取html代码中的文本内容为每个项目生成索引的全集(在本例中它只是排名),以后我将使用这个得分载入 nltk 的英文

自然语言处理

聚类

html

向量化

原创 2022-08-16 11:48:19 153 阅读

第六章 -文本分类

信息提取分块正则表达式分块探索文本语料库加缝隙开发与评估分块器简单评估和基准使用unigram标注器对名词短语分块训练基于分类器的分块

自然语言处理

分块

lua

正则表达式

原创 2022-08-16 11:47:55 35 阅读

第八章-数据提取

信息提取分块正则表达式分块探索文本语料库加缝隙开发与评估分块器简单评估和基准使用unigram标注器对名词短语分块训练基

自然语言处理

分块

lua

名词短语

原创 2022-08-16 11:47:39 83 阅读

自然语言处理-聊天机器人

rule-based的玩法,以及几个角度的升级。首先，我们看一个最基础版本的rule-base机器人基本就是小学生级别的问什么答什么 In [11]: import random# 打招呼greetings = ['hola', 'hello', 'hi', 'Hi', 'hey!','hey']# 回复打招呼random_greeting = random.choic

自然语言处理

jar

ios

python

原创 2022-07-25 05:44:19 69 阅读

自然语言处理-词向量与相关应用

计算机

自然语言处理

数据

文本分类

权重

原创 2022-07-14 09:49:10 182 阅读

深度学习在自然语言处理中的运用

目录：introAuto-Encoder CNN4Text(卷积)RNNLSTM案

自然语言处理

二维

神经网络

文本分类

原创 2022-07-14 09:38:53 87 阅读

自然语言处理-事件研究

自然语言处理

原创 2022-07-09 00:06:09 30 阅读

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

51CTO博客

13350224

第四章-分词

第一章-语言处理与Python

第二章-获取文本语料和词汇资源

第三章-处理原始文本

第五章-词性标注

第七章-文本聚类

第六章 -文本分类

第八章-数据提取

自然语言处理-聊天机器人

自然语言处理-词向量与相关应用

深度学习在自然语言处理中的运用

自然语言处理-事件研究