目录一、Noisy Channel Model二、语言模型1.句子的概率2.马尔科夫假设3.语言模型:N-gram①Unigram②Bigram4.计算语言模型的概率5.评估语言模型6.平滑①拉普拉斯平滑②Interpolation一、Noisy Channel Model该模型就是自然语言处理中常用的模型,它是根据贝叶斯定理得来的,用于把信号源转换成文本,信号源可以是多种,可以适用于多个场景。比
GILLEGBMRO
原创 2013-06-08 11:31:07
205阅读
人工智能(Artificial Intelligence),英文缩写为AI。百度百科是这样介绍的:它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。下面我将用技术的层面解释人工智能的实现:一般人工智能会用到ASR和NLP技术以及其他方面的技术:ASR技术:语音识别技术,也被称为自动语音识别Automatic Speech Recognition,(ASR),
前言:之前我们讲了很多与语音处理有关的任务,这次我们来讲和自然语言处理相关的任务NLP任务大体可以分成两大类,一种是文本序列到文本序列,比如机器翻译,文本风格迁移等,另一种是序列到类别,比如情感分类,实体命名识别,主题分类,槽位填充等。NLP 这个词的用法有点模糊。Language 指的一般是人与人沟通时用的语言。因此 Natural Language 可以是文字也可以是语音。因此语音相关的技术
原创 2021-04-10 19:51:01
961阅读
编者按:这一年就快完了,你还没搞懂Material design吗?是嫌文档太长,还是觉得自己英文不好?都没关系,我们善良热情的@十萬個為什麽  帮同学们通读了一遍官方的设计指南,去糙取精,整理出这篇干货超多的学习笔记,打包票学完基本就掌握90%了,别错过咯!自从Material design发布以来,可乐橙就在一直收集相关素材与资源,研究别人的作品。这套设计风格非常鲜明,带有浓郁的Go
转载 精选 2016-11-08 18:08:17
335阅读
    最近在读信息简史,觉得在非情感方面,人脑和电脑的日常活动是相似的,都是在处理信息,信息通过不同形式的输入,经过一定的处理产生不同种类的输出。把人脑比作CPU,日常任务比作进程和线程,人的任务处理效率往往不如计算机。我们可以借鉴计算机领域在这方面多年的沉淀,帮助自己提高工作效率,从而节省时间去做自己想做的事情,比如锻炼身体、陪陪家人、朋友和孩子,出去旅游看世界啥的。     我煮个栗子。当
自然语言处理(NLP)是人工智能的一个重要应用领域,由于本人主要研究方向为NLP,也由于最近学习的需要,特意搜罗资料,整理了一份简要的NLP的基本任务和研究方向,希望对大家有帮助。自然语言的发展: 一般认为1950 年图灵提出著名的“图灵测试”是自然语言处理思想的开端。20 世纪 50 年代到 70 年代自然语言处理主要采用基于规则的方法。基于规则的方法不可能覆盖所有语句,且对开发者的要求极高。这
NLP,自然语言处理就是用计算机来分析和生成自然语言(文本、语音),目的是让人类可以用自然语言形式跟计算机系统进行人机交互,从而更便捷、有效地进行信息管理。NLP是人工智能领域历史较为悠久的领域,但由于语言的复杂性(语言表达多样性/歧义/模糊等等),如今的发展及收效相对缓慢。比尔·盖茨曾说过,"NLP是 AI 皇冠上的明珠。" 在光鲜绚丽的同时,却可望而不可及(...)。为了揭开NLP的神秘面纱,
2020EMNLP New Task: AMBIGQA背景数据集评估准则基线模型多答案预测问题消歧弱监督联合训练REFERENCE 今年发论文初步决定从这篇新任务入手,任务有价值并且有待开发空间。先挖个坑读一读。(先写这些吧,后续研究研究协同训练和预训练模型再更新想法) 背景该任务提出了AMBIGQA,目的是解决开放域问答系统问题答案模糊的任务。简单来说就是把消歧引入到了QA领域中,且是ope
0.前言:文本分类任务介绍文本分类任务是自然语言处理中最常见的任务,文本分类任务简单来说就是对给定的一个句子或一段文本使用文本分类器进行分类。文本分类任务广泛应用于长短文本分类、情感分析、新闻分类、事件类别分类、政务数据分类、商品信息分类、商品类目预测、文章分类、论文类别分类、专利分类、案件描述分类、罪名分类、意图分类、论文专利分类、邮件自动标签、评论正负识别、药物反应分类、对话分类、税种识别、来
学习时间:2022.04.21自然语言处理(Natural Language Processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。NLP的2大核心任务是:自然语言理解NLU和自然语言生成NLG。NLP常见的应用有:序列标注:譬如命名实体识别(Name
1.词性标注词性标注的输入是一个序列,输出的是每个词的词性,那么标注完以后再进行下游任务效果就会比直接把一段文字丢进去更好。 下图为示例图:2.分词对于英文来说,单词间有空格,所以不需要分词,但是对于中文,在进行各种任务时需要对文本进行分词。 如图所示:3.Coreference Resolution(指代消解)把同一个人或者事物标注出来,如下图例子:4.文本摘要(summarization)1.
classification overview本文是分类任务系列第一篇——概述,主要介绍分类的基本定义和一般流程。overview分类是nlp中常见的任务,例如垃圾邮件分类、情感分析、意图识别、行业分类等,通过一定的方法或手段,对给定样本赋予特定的标签的过程。常见的分类包括二分类:标签只有两个,通常表现为0-1或者[-1, 1],例如是否垃圾邮件、学生性别识别等多分类:标签大于两个,例如不同的舆情
NLP 任务的实现流程 NLP(自然语言处理)是人工智能的一个重要分支,涉及到文本的理解、分析和生成等任务。对于一个刚入行的小白来说,了解并掌握NLP任务的实现流程是非常重要的。下面我将为你详细介绍NLP任务的实现流程,并提供相应的代码以帮助你快速入门。 整个NLP任务的实现流程可以分为以下几个步骤: 1. 数据收集和预处理 2. 特征提取和表示 3. 模型选择和训练 4. 模型评估和优化
原创 8月前
19阅读
对于大多数自然语言处理任务,必须对要处理的文本进行分解、检查,并将结果存储或与规则和数据集交叉引用。这些任务允许程序员推导出文本中术语和单词的含义或意图或仅出现频率。让我们发现用于处理文本的常用技术。结合机器学习,这些技术可帮助您有效地分析大量文本。然而,在将 ML 应用于这些任务之前,让我们先了解一下 NLP 专家遇到的问题。NLP 常见的任务有多种方法可以分析您正在处理的文本。您可以执行一些任
文章目录前言一、NLP任务的特点二、NLP的四大类任务三、介绍三种主流的特征抽取器1. RNN2.CNN3.Transformer4.三大特征抽取器比较 前言参考文献 参考张俊林老师的文章《放弃幻想,全面拥抱Transformer:自然语言处理三大特征抽取器(CNN/RNN/TF)比较》梳理记录一下一、NLP任务的特点预测 特征抽取器:RNN、CNN、Transformer 等NLP任务的特点和图
1、词法分析(Lexical Analysis):对自然语言进行词汇层面的分析,是NLP基础性工作分词(Word Segmentation/Tokenization):对没有明显边界的文本进行切分,得到词序列新词发现(New Words Identification):找出文本中具有新形势、新意义或是新用法的词 形态分析(Morphological Analysis):分析单词的形态组成,包括词干
句法语义分析:对于给定的句子,进行分词、词性标记、命名实体识别和链接、句法分析、语义角色识别和多义词消歧 实体识别(Named Entity Recognition, NER)信息检索(搜索) 对大规模的文档进行索引。可简单对文档中的词汇,赋之以不同的权重来建立索引,也可利用1,2,3的技术来建立更加深层的索引。在查询的时候,对输入的查询表达式比如一个检索词或者一个句子进行分析,然后在
❤️觉得内容不错的话,欢迎点赞收藏加关注???,后续会继续输入更多优质内容❤️ ?有问题欢迎大家加关注私戳或者评论(包括但不限于NLP算法相关,linux学习相关,读研读博相关......)? (封面图由文心一格生成) 深入理解NLP中的文本匹配任务文本匹配是自然语言处理(NLP)领域中的一项重要任务,它可以用于很多应用,比如信息检索、机器翻译、对话系统等。文本匹配的目的是判断两个
数据预处理1.文本分类任务数据预处理方法分词:将句子分割成独立的语义单元组成的序列过程去停用词:识别并删除对分类意义不大且出现频率较高的词词性标注:在分词后判断词性来添加特征2.中文文本分词的方法基于字符串匹配的分词方法基于统计语言模型的分词方法基于统计机器学习的分词方法(统计序列标准模型的代表,生成式模型的代表--隐马尔可夫模型(HMM),判别式模型的代表--线性链条件随机场(CRF))3.基于
  • 1
  • 2
  • 3
  • 4
  • 5