1 简介说话识别是利用说话的语音信号的特征同预先提取的说话人语音特征相比较来确定或鉴别说话的身份。它涉及到说话发音器官上的个性差异、发音声道之间的个性差异、发音习惯之间的个性差异等不同级别上的差异,因此,说话识别是交叉运用心理学、声学、语音学、人工智能、数字信号处理、信息理论、模式识别理论、最优化理论、计算机科学等知识的综合性课题。本章节对说话识别系统基本组成、说话识别
原创 2022-05-31 19:55:20
8172阅读
 1 简介目前,针对说话识别而提出的新的识别技术层出不穷,如结合 GMM-UBM 结构与支持向量机(SupportVectorMachine,SVM)的技术、基于得分规整技术的 HNORM、ZNORM 和 TNORM 技术、潜伏因子分析(LatentFactorAnal⁃ysis,LFA)技术、应用于说话识别的大词汇表连续语音识别(LargeVocabularyContin
原创 2022-05-30 21:18:03
7578阅读
1 简介实现了一个基于高斯混合模型(GMM)的说话辨识系统.GMM是用多个高斯分布的概率密度函数的组合来描述特征矢量在概率空间的分布状况,不同的说话对应了不同的GMM.模型的训练采取了极大似然估计(ML)的EM方法.并在不同的数据集上实验,得到了好的结果.为了说明基于非线性变换 GMM 模型的说话识别方法,首先必须介绍一下 GMM 模型以及传统的基于&
一、获取代码方式获取代码方式1:完整代码已上传我的资源:【语音识别】基于matlab说话识别系统【含
✅作者简介:热爱科研的Matlab仿真开发者,修心和技术同步精进,matlab项目合作可私信。 ?个人主页:Matlab科研工作室?个人信条:格物致知。更多Matlab仿真内容点击?智能优化算法       神经网络预测       雷达通信      无线传感器      
一、获取代码方式获取代码方式1:完整代码已上传我的资源:【语音识别】基于matl%% Input:% test
1 简介小波变换的发展为语音信号提供了新的处理方法与技术,从而使语音处理技术取得了较快的发展。说话识别提取说话的语音特征对说话的身份进行确认或辨认。语音识别研究领域的一个重要研究方向,就是从语音信号中有效地提取个人特征信息进行说话人身份的识别。在说话识别系统中,最重要的是能够从语音片断中提取代表说话独有特征的稳定参数。基于短时傅立叶变换的常规特征参数构造表现出了很多不足,它是在短时平稳假
原创 2021-11-19 23:54:03
473阅读
一、简介1 高斯混合模型概述高斯密度函数估计是一种参数化模型。高斯混合模型(Gaussian Mixture Model, GMM)是单一高斯概率密度函数的延伸,GMM能够平滑地近似任意形状的密度分布。高斯混合模型种类有单高斯模型(Single Gaussian Model, SGM)和高斯混合模型(Gaussian Mixture Model, GMM)两类。类似于聚类,根据高斯概率密度函数(Probability Density Function, PDF)参数不同,每一个高斯模型可以看作一种类别,
原创 2021-08-13 09:08:26
208阅读
一、简介1 高斯混合模型概述高斯密度函数估计是一种参数化模型。高斯混合模型(Gaussian Mixture Model, GMM)是单一高斯概率密度函数的延伸,GMM能够平滑地近似任意形状的密度分布。高斯混合模型种类有单高斯模型(Single Gaussian Model, SGM)和高斯混合模型(Gaussian Mixture Model, GMM)两类。类似于聚类,根据高斯概率密度函数(Probability Density Function, PDF)参数不同,每一个高斯模型可以看作一种类别,
 1 简介设计了基于隐马尔可夫模型(HiddenMarkovModel,HMM)的非特定人汉语语音识别系统,主要 由 录 音、 训练和识别三大模块构成.“录音模块”首先录制一段指定长度的语音信号,然后通过对语音信号的短时能量和过零率进行门限检测,标志出有效语音段并保存.“训 练 模 块”利 用 Ba
原创 2022-05-31 19:01:30
7993阅读
一、简介矢量量化方法,即vector quantization,其具体定义为:将一个向量空间中的点用其中的一个有限子集来进行编码的过程。在矢量量化编码中,关键是码本的建立和码字搜索算法。比如常见的聚类算法,就是一种矢量量化方法。而在ANN近似最近邻搜索中,向量量化方法又以乘积量化(PQ, Product Quantization)最为典型。在之前的博文基于内容的图像检索技术的最后,对PQ乘积量化的方法做过简单的概要。在这一小节里,小白菜结合自己阅读的论文和代码对PQ乘积量化、倒排乘积量化(IVFPQ)做一
原创 2021-08-13 09:08:24
759阅读
一、简介矢量量化方法,即vector quantization,其具体定义为:将一个向量空间中的点用其中的一个有限子集来进行编码的过程。在矢量量化编码中,关键是码本的建立和码字搜索算法。比如常术的最后,对PQ乘积量化的方法做过简单的概要。在这一小节里,小白菜结合自己阅读的论文和代码对PQ乘积量化、倒排乘积量化(IVFPQ)做一
原创 2021-08-20 16:32:24
300阅读
一、简介矢量量化方法,即vector quantization,其具体定义
原创 2022-04-08 10:28:24
1119阅读
一、简介1 高斯混合模型概述高斯密度函数估计是一种参数化模型。高斯混合模型(Gaussian Mixture Model, GMM)是单一高斯概率密度函数的延伸,GMM能够平滑地近似任意形状的密度分布。高斯混合模型种类有单高斯模型(Single Gaussian Model, SGM)和高斯混合模型(Gaussian Mixture Model, GMM)两类。类似于聚类,根据高斯概率密度函数(Probability Density Function, PDF)参数不同,每一个高斯模型可以看作一种类别,
原创 2022-04-08 10:28:47
177阅读
一、简介MFCC(Mel-frequency cepstral coefficients):梅尔频率倒谱系数。梅尔频率是基于人耳听觉特性提出来的, 它与Hz频率成非线性对应关系。梅尔频率倒谱系数(MFCC)则是利用它们之间的这种关系,计算得到的Hz频谱特征。主要用于语音数据特征提取和降低运算维度。例如:对于一帧有512维(采样点)数据,经过MFCC后可以提取出最重要的40维(一般而言)数据同时也达到了将维的目的。MFCC一般会经过这么几个步骤:预加重,分帧,加窗,快速傅里叶变换(FFT),梅尔滤波器组,
原创 2021-08-13 09:06:56
67阅读
一、简介 MFCC(Mel-frequency cepstral coefficients):梅尔频率倒谱系数。梅尔频率是基于人耳听觉特性提出来的, 它与Hz频率成非线性对应关系。梅尔频率倒谱系数(MFCC)则是利用它们之间的这种关系,计算得到的Hz频谱特征。主要用于语音数据特征提取和降低运算维度。 ...
转载 2021-07-23 22:51:00
117阅读
2评论
 1 简介说话识别是利用说话的语音信号的特征同预先提取的说话人语音特征相比较来确定或鉴别说话的身份。它涉及到说话发音器官上的个性差异、发音声道之间的个性差异、发音习惯之间的个性差异等不同级别上的差异,因此,说话识别是交叉运用心理学、声学、语音学、人工智能、数字信号处理、信息理论、模式识别理论、最优化理论、计算机科学等知识的综合性课题。本章节对说话识别系统基本组成、说话识别
原创 2022-05-30 20:23:50
139阅读
一、简介 MFCC(Mel-frequency cepstral coefficients):梅尔频率倒谱系数。梅尔频率是基于人耳听觉特性提出来的, 它与Hz频率成非线性对应关系。梅尔频率倒谱系数(MFCC)则是利用它们之间的这种关系,计算得到的Hz频谱特征。主要用于语音数据特征提取和降低运算维度。 ...
转载 2021-07-23 22:51:00
179阅读
2评论
有时候真诚的人会受人欢迎,但大多时候八面玲珑的人才会左右逢源。因为我们和交谈,往往要考虑整体的环境、别人的心理、事情的效用,否则你很有可能会显得格格不入,尤其是在中国人比较多的企业。这些说话技巧做不是为了虚伪、巧言令色,而是为了更好地处理人际关系,当然,在奉行平等开放交流文化的公司里就没必要这样拘谨了。 提高说话技巧对每一个职场中人来说都是很重要的,一句话可能就关系到你的前程。往往每个人都有一个隐私区域,不愿意被打扰,不愿意被催促,不愿意和陌生的面孔交谈,不愿意被人指责,不愿意按照规定的时限做事,不愿意主动的去关心别人,不愿意去思考别人还有什么没有想到。在工作之后,你要极力改变这一现状。..
原创 2021-08-07 10:41:26
131阅读
  • 1
  • 2
  • 3
  • 4
  • 5