NLP 基本知识NLP问题主要是对字词、短语、句子、篇章的处理,这一切问题主要包含两个层次:结构、语义。解决这些问题离不开两个基本概念:语言模型、序列标注。  一、语言模型         语言模型是指用数学的方法描述语言规律,统计语言模型是用句子A出现的概率p(a)来刻画句子的合理性,常用的有 n-gram模型二、词
自然语言处理专家elvis在medium博客上发表了关于NLP在2019年的亮点总结。对于自然语言处理(NLP领域而言,2019年是令人印象深刻的一年。在这篇博客文章中,我想重点介绍一些我在2019年遇到的与机器学习和NLP相关的最重要的故事。我将主要关注NLP,但我还将重点介绍一些与AI相关的有趣故事。标题没有特别的顺序。故事可能包括论文,工程工作,年度报告,教育资源的发布等。论文刊物ML /
转载 2023-11-17 17:06:53
61阅读
虽然 NLP 研究领域已经在深度学习的帮助下取得了长足的发展,许多技术也已经商业化落地,但我们也需要知道,这个领域还有几个开放性问题等待解决 —— 如果它们也能比较好地解决,也许我们能迎来 NLP 科研成果与商业落地的一个新的高潮。
转载 2019-09-22 10:05:00
168阅读
语言模型(属于generative model)语言定义为字母表的某一子集 统计学语言模型在概率的角度看语言production,从词汇表分配随机的token序列 P(<w1,w2,…wn>)generative model 不考虑condition,语言模型就是, 回答问题2,3(联合分布等),可以用于发现outlierdescrimitive 例如逻辑回归 classificati
转载 2023-12-07 21:21:37
67阅读
分类是指解决预测样本所属类别的一类问题,即对于给定样本x,输出x所属的类别。当供选择的类别只有2个时,称为二分类,反之称为多分类。而多分类的问题也可以通过二分类来解决。具体来说包含one-vs-one和one-vs-rest两种方案。one-vs-one:进行多轮的二分类,每次比较两个不同的分类,枚举所有的所有的两个分类的组合;理想情况下应该有且仅有一个类别在每一次比较中都被选中,成为预测结果。one-vs-rest:进行多轮的二分类,每次比较某个类别和非该类别,枚举所有的类别;理想情况下应该有一个
原创 2021-08-26 10:52:50
360阅读
分类是指解决预测样本所属类别的一类问题,即对于给定样本x,输出x所属的类别。当供选择的类别只有2个时,称为二分类,反之称为多分类。而多分类的问题也可以通过二分类来解决。具体来说包含one-vs-one和one-vs-rest两种方案。one-vs-one:进行多轮的二分类,每次比较两个不同的分类,枚举所有的所有的两个分类的组合;理想情况下应该有且仅有一个类别在每一次比较中都被选中,成为预测结果。one-vs-rest:进行多轮的二分类,每次比较某个类别和非该类别,枚举所有的类别;理想情况下应该有一个
原创 2022-03-28 15:26:01
190阅读
# 实现 NLP 领域划分的流程指导 自然语言处理(NLP)是人工智能的一个重要分支,旨在使计算机能够理解、解释和生成自然语言。在 NLP 项目中,领域划分是一个重要的步骤,涉及将文本数据根据其主题或内容进行分类。这篇文章将为你提供一个详细的流程指南,以帮助你实现 NLP 领域划分。 ## 流程概述 以下是进行 NLP 领域划分的步骤: | 步骤 | 描述 | |------|------
原创 10月前
27阅读
# NLP领域综述的实现指南 在开始进行NLP(自然语言处理)领域的综述之前,我们需要了解整个流程。这篇文章将指导你如何一步一步实现一个NLP领域的综述,并展示相应的代码示例和状态图。 ## NLP领域综述的流程 以下表格展示了实现NLP领域综述的主要步骤: | 步骤 | 描述
原创 10月前
61阅读
课程秉承了“实战”风,老师简单理了一下NLP模型发展脉络,每个时期代表模型的优缺点,就一猛子扎进了BERT的关键技术——Transformer和Attention工作机制,于是编码解码、Query、Key、Values、Embedding、Softmax、矩阵运算带着满满的优越感向我碾压过来。算了,既然这是实战课,理论的问题就不要深究了吧,只要知道BERT是两步训练,知道如何使用ModelArts
转载 2024-01-19 19:33:05
46阅读
BERTTransformer的原理Transformer是一种完全基于Attention机制来加速深度学习训练过程的算法模型。Transformer最大的优势在于其在并行化处理上做出的贡献。 Transformer抛弃了以往深度学习任务里面使用到的 CNN 和 RNN ,目前大热的Bert就是基于Transformer构建的,这个模型广泛应用于NLP领域,例如机器翻译,问答系统,文本摘要和语音识
1.什么是NLP 2.NLP领域的挑战(1)同一个意思有多种表达方式(2)一词多义(Ambiguity)解决一词多义的问题方法:从数据中学习(结合上下文Context) 3.机器翻译系统的案例 上图的意思:根据表中的12对翻译结果,翻译所给出的一句话。做法:给定语料库,在语料库中做统计,进行匹配(基于统计学)。缺点:<1>慢  <2>
转载 2023-07-25 23:44:30
188阅读
在过去的几年里,深度学习(DL)架构和算法在诸如图像识别和语音处理等领域取得了世人瞩目的进步。然而在最开始的时候,深度学习在自然语言处理(Natural Language Processing, NLP领域的效果一般,但是现在已经被证实深度学习在自然语言处理领域依然能够发挥巨大的作用。并且在一些常见的自然语言处理任务中,基于深度学习的方法已经取得了最佳的结果。神经网络模型在诸如命名实体识别(Na
两个py文件,一个是利用文本训练并保存,另外一个是拼音转汉字,基于隐马尔可夫模型HMM,拼音输入法可以按注音符号与汉语拼音两种汉字拼音方案分成两大类。汉语拼音输入法的编码是依据汉语拼音方案(汉字的读音)进行输入的一类中文输入法。早期只有全拼这种方式,即完全依照汉字的整个音节来输入。随着技术的发展,拼音输入法不仅可以简拼还出现了一种只需两键就能输入整个音节的双拼方案。具体代码和文件在我上传的资源中有
转载 2023-11-24 21:13:35
107阅读
©NLP论文解读 原创•作者 |FLIPPED 研究背景 随着计算算力的不断增加,以transformer为主要架构的预训练模型进入了百花齐放的时代。BERT、RoBERTa等模型的提出为NLP相关问题的解决提供了极大的便利,但也引发了一些新的问题。 首先这些经过海量数据训练的模型相比于一般的深度模型而言,包含更多的参数,动辄数十亿。在针对不同下游
转载 2024-02-06 13:25:36
39阅读
在当今法律领域,利用自然语言处理(NLP)技术来处理大量法律文本已经成为了一个趋势。通过构建相应的“NLP法律领域模型”,可以有效地分析法律文档、辅助法律决策和增强法务工作效率。接下来,我会详细介绍如何构建这样的模型,内容分为环境准备、集成步骤、配置详解、实战应用、排错指南和生态扩展六个部分。 ## 环境准备 在准备环境时,我们需要确保安装好必要的依赖项,包括Python及其相关库。以下是依赖
原创 6月前
19阅读
# NLP领域创新应用 自然语言处理(NLP)作为人工智能的一个重要分支,近年来在多个领域中展现出了惊人的创新应用。这些应用不仅改变了我们与机器的互动方式,还改善了信息获取和处理的效率。本文将介绍几个NLP的创新应用,并通过代码示例进一步说明。 ## 1. 聊天机器人 聊天机器人是NLP领域应用最广泛的例子之一。它们可以模拟人与人之间的对话。下面的示例代码使用Python中的`transfo
原创 2024-09-28 05:28:09
41阅读
在参与Kaggle竞赛的过程中,我主要关注如何高效地解决自然语言处理(NLP领域问题。以下是我在一次竞赛中的详细记录,希望能够对后续的项目开发有所帮助。 ## 问题背景 在Kaggle的一个NLP竞赛中,任务是对法律文本进行分类,目的是帮助小型法律事务所更快地为客户检索相关案件。对于法律专业人员而言,准确率至关重要,因此,该任务的用户体验必须极为顺畅。 > “通过利用机器学习和自然语言处
原创 7月前
60阅读
# NLP领域迁移学习入门指南 迁移学习(Transfer Learning)是机器学习中的一种方法,可以将一个领域中训练好的模型应用到另一个相关领域。在自然语言处理(NLP)中,这种方法尤其有效,因为许多语言特征在不同任务中是共享的。本文将为您详细梳理 NLP领域迁移的流程,并提供具体的代码示例。 ## 整体流程 以下是进行 NLP领域迁移学习的总体步骤: | 步骤 | 描述
原创 8月前
52阅读
大家好,卷王们and懂王们好,我是对白。本次我挑选了ICLR2021中NLP领域下的六篇文章进行解读,包含了文本生成、自然语言理解、预训练语言模型训练和去偏、以及文本匹配和文本检索。从这些论文的思想中借鉴了一些idea用于公司自身的业务中,最终起到了一个不错的效果。1、Contrastive Learning with Adversarial Perturbations for Condition
目录 1.全连接前馈神经网络(MLP)的应用2.卷积神经网络(CNNs)的应用3.循环和递归神经网络(RNNs)的应用1.全连接前馈神经网络(MLP)的应用大部分情况下,全连接前馈神经网络(MLP)能被用来替代线性学习器。这包括二分类或多分类问题,以及更复杂的结构化预测问题。网络的非线性以及易于整合预训练词嵌入的能力经常带来更高的分类精度。一系列工作通过简单地将句法分析器中的线性模型替换
  • 1
  • 2
  • 3
  • 4
  • 5