机器学习以及自然语言处理技术的进步,开启了人与人工智能进行语音交互的可能,人们透过对话的方式获取信息、与机器进行交互,将不再只是存在科幻情结当中。语音交互是未来的方向,而智能音箱则是语音交互落地的第一代产品。一、语音交互流程简介AI 对话所需要的技术模块有 4 个部分,分别为:自动语音识别(Automatic Speech Recognition, ASR)自然语言理解(Natural Lan
熵  如果X是一个离散型随机变量, 取值空间为R, 那么X的熵H(X)定义为式  联合熵和条件熵  如果X,Y是一对离散型随机变量X,Y~p(x, y), X, Y的联合熵H(X,Y)定义为     联合熵就是描述一对随机变量平均所需要的信息量  给定随机变量X, 随机变量Y的条件熵    将联合熵中的log函数展开    将上式称为熵的联合规则, 那么在一般情况下就有    
文章目录前言一、神经网络与深度学习二、神经网络的过拟合与正则化三、深度学习的优化算法四、卷积神经网络五、循环神经网络从第五章开始 重点就将在NLP领域了六、长短期记忆网络七、自然语言处理与词向量八、word2vec词向量九、seq2seq与注意力模型十、从Embedding到XLNET:NLP预训练简介1.ELMo2.特征提取器Transformer3.GPT(生成式预训练模型)4.BERT5.
作者&编辑 | 小Dream哥上一篇介绍了隐马尔科夫模型,隐马尔科夫模型引入了马尔科夫假设,即当前时刻的状态只与其前一时刻的状态有关。但是,在序列标注任务中,当前时刻的状态,应该同该时刻的前后的状态均相关。于是,在很多序列标注任务中,引入了条件随机场。今天详细介绍条件随机场的理论和及其在实体识别中的应用和tensorflow中的实现。1 条件随机场是什么?机器学习最重要的任务,是根据一些已
  本文将会详细介绍如何使用tensorflow/serving来实现BERT模型的部署及预测。   我们以Github上的bertNER为例,该项目使用BERT+Bi-LSTM+CRF结构实现中文序列标注,对BERT进行微调,并且提供了模型训练、模型预测的办法。本文将在此基础上,将模型训练后生成的ckpt文件转化为pb文件(tensorflow/serving支持的部署文件格式),并使用tens
# NLP语言生成模型 ## 什么是NLP语言生成模型? 自然语言处理(Natural Language Processing,NLP)是研究计算机与人类自然语言交互的一门学科。NLP语言生成模型NLP领域中的一个重要分支,它致力于使用计算机生成自然语言文本。 NLP语言生成模型可以根据给定的输入,生成与人类自然语言相似的文本。这种技术在机器翻译、文本摘要、对话系统、聊天机器人等领域有广泛
原创 2023-08-29 04:20:37
145阅读
语言模型什么是语言模型语言模型 就是估测一些词的序列的概率,即预测 p(w1, w2, w3 ... wn),一个应用就是句子的生成。2. 语言模型的种类Ngram              ngram是一种统计的方法,它相当于固定了一个窗口,在这个窗口内的词是相关的,也就是第n个词和前n个词相关:P(s) = p(w1) p(
在学习机器学习的过程中我们总会遇见一些模型,而其中的一些模型其实可以归类于生成模型或者是判别模型中去,而这一篇文章我将会简单的概述下我最近所遇到的一些模型,并且按照自己的理解去记录下来,其中肯定会有差错,如果那里不对,还请各位多多指教.1:演变关系 上边的图是 这一篇论文中的一个截图,而第一张图其实讲的是几种模型的演进的一个过程,而这个过程如果加以简单的概括的话,可以归
初学达梦数据库的安装最近利用假期时间,学习了达梦数据库,第一个需要攻克的难题就是虚拟机、国产麒麟系统和MobaXterm的安装。 首先是虚拟机的安装,我们只需打开安装包,进行简单的操作即可。 我们根据使用需求来对每一进行操作,选择自己想要的安装位置,剩下点击下一步安装即可。 接下来我们要进行麒麟系统的安装。 首先我们选择新建虚拟机,然后我们选择自定义(高级),根据自己的需求来进行安装,比如安装的时
转载 2024-04-25 19:49:48
81阅读
基于用户的 CF(User CF)基于用户的 CF 的基本思想相当简单,基于用户对物品的偏好找到相邻邻居用户,然后将邻居用户喜欢的推荐给当前用户。计算上,就是将一个用户对所有物品的偏好作为一个向量 来计算用户之间的相似度,找到 K 邻居后,根据邻居的相似度权重以及他们对物品的偏好,预测当前用户没有偏好的未涉及物品,计算得到一个排序的物品列表作为推荐。图 2 给出了一个例子,对于用户 A,根据用户的
## NLP协同性分析的实现 自然语言处理(Natural Language Processing, NLP)协同性分析是一种用于解析文本数据中关联性的技术。在这篇文章中,我们将介绍如何使用Python和一些常见的NLP库来实现协同性分析,并展示如何将结果可视化。 ### 1. 数据预处理 在进行协同性分析之前,我们首先需要对文本数据进行预处理,包括去除停用词、词干提取等。下面是一个简单的例
原创 2024-05-28 04:41:25
103阅读
 : 1 简介词性(part-of-speech)是词汇基本的语法范畴,通常也称为词类,主要用来描述一个词在上下文的作用。例如,描述一个概念的词就是名词,在下文引用这个名词的词就是代词。有的词性经常会出现一些新的词,例如名词,这样的词性叫做开放式词性。另外一些词性中的词比较固定,例如代词,这样的词性叫做封闭式词性。因为存在一个词对应多个词性的现象,所以给词准确地标注词性并不是很
第3章 线性模型1、线性回归2、逻辑回归(对数几率回归)3、线性判别分析(LDA)4、多分类学习5、类别不平衡 线性模型是神经网络和深度学习的基础,原理比较简单,主要看书就行,重点是线性回归和对数几率回归这两节。1、线性回归求解方法:用最小二乘法使均方误差最小化,可以求出最优解。2、逻辑回归(对数几率回归) 线性模型外面套上一层Sigmoid函数,就可以解决二分类问题。求解方法与线性回归一样,用
# NLP技术在文本转换中的应用 随着自然语言处理(NLP)技术的快速发展,文本转换已经成为一个重要的应用领域。本文将探讨如何利用NLP技术进行文本转换,以解决一个实际问题:将非结构化的客户反馈文本转化为结构化的数据,以便于分析和决策。 ## 实际问题 在客户服务行业,企业通常接收到大量的客户反馈。但是,这些反馈往往以非结构化的文本形式存在,难以进行有效的分析。如何将这些文本信息转化为结构化
原创 2024-10-22 05:58:53
52阅读
什么是Mesh?Mesh是指的模型的网格,3D模型是由多边形拼接而成,而多边形实际上又是由多个三角形拼接而成的。即一个3D模型的表面其实是由多个彼此相连的三角面构成。三维空间中,构成这些三角形的点和边的集合就是Mesh。原理即动态创建一个Mesh,设置三角形和顶点数据,然后赋值给MeshFilter(增加mesh属性),通过MeshRenderer(增加材质并渲染出Mesh)绘制出来理论基础:1、
转载 2024-02-28 13:32:47
633阅读
1.逻辑回归函数        先说明一下,逻辑回归实际上是一种分类方法,主要用于二分类问题,它的输出在0` 1,代表了属于某一类的概率,如下式为输入X属于第1类的概率,记为,一般在概率大于0.5时,将输出结果判为1,否则为0.       &nbs
作者:厚缊何谓“诹图”关于R作图的资料汗牛充栋,数不胜数,既有基于基础graphics包的,也有基于ggplot2等高级绘图系统包的,还有基于其它JavaScript库封装的动态可视化包的,各有各的优势,也各有各的短板。总的来看,基础R包的“纸笔模式”更灵活,可以根据绘图思路在任何地方添加需要的图形标记,好比武学中的“内功”,内功基础扎实能快速修炼各路高深武功招式;高级绘图包用户调用函数更简洁,实
转载 2023-12-26 16:39:54
69阅读
Event-based High Dynamic Range Image and Very High Frame Rate Video Generation using Conditional Generative Adversarial Networks 使用有条件的GAN进行基于事件的高动态性区域图像和极高帧率视频生成摘要: 使用Conditional GAN实现了基于事件摄像机的从一个数据流
转载 2024-06-16 21:39:04
27阅读
NLP发展历史 20 世纪五十年代开始,与计算机的诞生几乎同时 始于机器翻译任务 两种路线:    1.基于规则的理性主义  主张建立符号处理系统,由人工整理和编写初始的  语言知识表示体系,构造相应的推理程序   2.基于统计的经验主义主张通过建立特定的数学模型来学习复杂的、广泛的语言结构,利用统计、模式识别、机器学习等方法来训练模
# Python 实现 Logit 模型的项目方案 ## 项目背景 Logit模型(逻辑回归)是一种广泛使用的分类算法,常用于二分类问题,例如预测消费者是否会购买某个产品、邮件是否为垃圾邮件等。它通过逻辑函数(Sigmoid函数)将线性组合的输入映射到一个概率值,从而可以对事件发生的概率进行建模。 ## 项目目标 本项目旨在使用Python编写一个Logit模型的实现方案,旨在帮助团队快速
原创 10月前
107阅读
  • 1
  • 2
  • 3
  • 4
  • 5