最近大创和项目需要把之前学过的知识点总结一下 文章目录RNNLSTMGRUEncoder-DecoderAttentionTransformerELMOBertGPT RNN循环神经网络和LSTM参考July哥的这篇博客,写的非常通俗易懂RNN和LSTM首先看单层神经网络 f为激活函数但是我们做文本一般用到的是序列数据 x1可以看做是第一个单词,x2可以看做是第二个单词,依次类推。我们将RNN展开
转载 2023-08-12 17:16:42
70阅读
![](https://img2020.cnblogs.com/blog/771778/202006/771778-20200621003624587-1787216521.png)
NLP
原创 2022-03-08 10:18:30
157阅读
目录1. 什么是知识图谱2. 知识图谱的应用2.1 搜索引擎2.2 问答系统2.3 智能客服2.4 智能推荐2.5 自然语言处理3. 知识图谱的发展趋势3.1 多模态知识图谱3.2 开放和共享3.3 自主学习3.4 知识推理3.5 去中心化4. 常见的原生知识图谱存储管理方式包括:4.1 图数据库4.2 三元组存储4.3 知识图谱存储框架5. 知识图谱查询语言5.1 SPARQL5.2 Grem
NLP是一个涉及自然语言处理理论、算法和应用的领域。机器翻译算法:如基于统计的机器翻译(如IBM模型、短语翻译模型)和基于神
原创 2024-04-21 00:59:03
139阅读
nlp总结
【问题】项目的主要模块?【答案】数据采集模块:这个模块负责从各种渠道(例如社交媒体、新闻网站、论坛等)收集原始数据。该模块需要支持对多种数据源进行爬取,并对不同类型的数据进行整合和转换。同时,还需要考虑数据存储和过滤的问题。数据预处理模块:在原始数据采集之后,数据往往需要进行清洗、过滤、去重、标准化等预处理操作。该模块需要支持将原始数据转化为可供后续模块处理的格式,并且在处理过程中需要保证数据的质
我们希望把多个单词组成的短语同样在词向量的空间中找到对应的向量,当然你也可以在不同的空间中,但是如果在同一空间中是有好处的 ,我可以利用该空间捕捉到短语与单词之间意思的相似度,比如the man on the snowboard 和 snowboarder。但是你不可能为每一个短语定义一个向量,即使为每一个单词定义一个词向量都不能完全实现,所以为了实现在这个空间中找到这个意思对应的向量,我们要借助
Task6 基于深度学习的文本分类3学习目标Transformer基于预训练语言模型的词表示ELMoGPTBERT总结 这个task仍然是基于深度学习的文本分类。 学习目标了解Transformer的原理和基于预训练语言模型(Bert)的词表示学会Bert的使用,具体包括pretrain和finetuneTransformer模型的编码部分是一组编码器的堆叠(论文中依次堆叠六个编码器),模型的
转载 2024-03-07 09:53:26
224阅读
NLP入门开源实践总结
机会总是留给有准备的人一 基本知识1 python解释下装饰器和生成器的作用以及用法类
原创 2023-05-17 15:26:06
117阅读
数据结构与算法相关1. 快速排序算法请实现快速排序算法,自行设计测试用例来说明算法的准确性,算法的时间和空间复杂度是多少?最坏的时间复杂度是多少?2. 归并排序算法请实现归并排序,自行设计测试用例来说明算法的准确性,算法的时间和空间复杂度是多少?最坏的时间复杂度是多少?3. 面对一个具体的问题,倾向于使用归并还是快排,为什么?数学基础机器学习基础自然语言处理...
Tokenization关于Tokenization,网上有翻译成"分词"的,但是我觉得不是很准确,容易引起误导
回顾时间过的很快,时间过的很快。不知不觉,我们有三A
原创 2022-10-12 21:17:25
80阅读
一、背景介绍很早就想入坑 kaggle NLP 类比赛,记得最初是跟着教程跑入门赛 Bag of Words Meets Bags of Popcorn,被一步步的文本预处理搞得心累,...
转载 2022-12-16 20:17:30
132阅读
2018年 BERT 问世,迅速统治了 kaggle NLP类比赛。鉴于 BERT 及其后继者在 NLP 多个任务上简单且有效,这里的总结也就局限在如何使用 BERT 类模型打比赛。
转载 2022-12-29 16:13:15
287阅读
NLP必备的库上周在给大家介绍了OpenMMlab一系列的CV库后,有很多同学问有没有推荐的NLP库。因此本周我们给大家整理了机器学习和竞赛相关的NLP库,方便大家进行使用,又一篇收藏即学习系列。jiebajieba是Python中的优秀的中文分词第三方库,通过几行代码就可以完成中文句子的分词。jieba的分词精度和性能非常优异,经常用来进行中文分词的实验对比。此外jieba还可以很方便的自定义词
转载 2023-08-04 15:37:21
119阅读
自然语言处理(NLP)资源总结
原创 2022-07-09 00:11:20
197阅读
从事NLP以来,对文本研究领域的标注工具和算法的一些总结,供大家参考
转载 2020-07-08 17:11:45
6263阅读
这是对白的第84期分享作者 l 对白 出品 l 对白的算法屋大家好,我是对白。BERT在工业界落地已经
我是目录摘要CERT,2020CLEAR,2020DeCLUTR,2021 ACLConSERT:ACL 2021Self-Guided Contrastive Learning for BERT Sentence Representations, ACL 2021SimCSE:EMNLP2021Pairwise Supervised Contrastive Learning of Senten
  • 1
  • 2
  • 3
  • 4
  • 5