我们都曾经都幻想过,如果有一款机器能预测到未来,看到我们十年后的样子或者老了以后的样子那是不是很有意思。不过今日麻省理工的研究人员研发出了一个更加有意思的人工智能,它有一项独特的功能:仅凭一个人的声音短片就能分析出他们在现实生活中的样子,甚至几年后的样子。人工智能毕竟只是一种复杂的算法,所以结果并不会很完美,但是总体来说效果还是不错,对于通过声音辨识罪犯来说还是轻而易举的,这项研究也从侧面论证了人
一、简介VQ(Vector Quantization)是一个常用的压缩技术,本文主要回顾:1)VQ原理2)基于VQ的说话人识别(SR,speaker recognition)技术〇、分类问题说话人识别其实也是一个分类问题:说话人识别技术,主要有这几
原创
2021-07-05 15:30:36
437阅读
✅作者简介:热爱科研的Matlab仿真开发者,修心和技术同步精进,matlab项目合作可私信。 ?个人主页:Matlab科研工作室?个人信条:格物致知。更多Matlab仿真内容点击?智能优化算法 神经网络预测 雷达通信 无线传感器
原创
精选
2023-05-24 12:04:33
363阅读
1 简介语音识别是让机器自动识别和理解语音信号,并把语音信号转变为相应的文本或命令的技术.通过对特定人孤立词语音特点的研究,在对语音信号进行预处理的过程中,选择过零率与短时平均能量两项指标作为对语音信号端点检测的依据,提取语音线性预测系数,通过计算分析后获得线性预测倒谱系数,作为语音特征参数.选择动态时间规整法为模板匹配算法,并针对传统匹配算法中计算量大的特点,作出改进,采用全局限制的方法以减小匹
原创
2021-11-21 00:10:55
280阅读
一、简介基于matlab特定人的语音识别分辨二、源代码function varargout = yuyinshibie(varargin)% YUYINSHIBIE MATLAB code for yuyinshibie.fig% YUYINSHIBIE, by itself, creates a new YUYINSHIBIE or raises the existing% singleton*.%% H = YUYINSHIBIE returns the h
原创
2022-04-08 11:11:40
233阅读
一、简介基于matlab特定人的语音识别分辨二、源代码function varargout = yuyinshibie(varargin)% YUYINSHIBIE MATLAB code for yuyinshibie.fig% YUYINSHIBIE, by itself, creates a new YUYINSHIBIE or raises the existing% singleton*.%% H = YUYINSHIBIE returns the h
原创
2021-08-13 09:10:53
102阅读
一、简介基于matlab特定人的语音识别分辨二、源代码function varargout = yuyinshibie(varargin)% YUYINSHIBIE MATLAB code for yuyinshibie.fig% YUYINSHIBIE, by itself, creates a new YUYINSHIBIE or raises the existing% singleton*.%% H = YUYINSHIBIE returns the h
原创
2021-08-20 16:42:32
111阅读
DTW(动态时间弯折)算法原理:基于动态规划(DP)的思想,解决发音长短不一的模板匹配问题。相比HMM模型算法,DTW算法的训练几乎不需要额外的计算。所以在孤立词语音识别中,DTW算法仍得到广泛的应用。在...
转载
2016-07-14 16:48:00
227阅读
2评论
一、简介VQ(Vector Quantization)是一个常用的压缩技术,本文主要回顾:1)VQ原理2)基于VQ的说话人识别(SR,speaker recognition)技术〇、分类问题说话人识别其实也是一个分类问题:说话人识别技术,主要有这几大类方法:模板匹配方法这类方法比较成熟,主要原理:特征提取、模板训练、匹配。典型的有:动态时间规整DTW,矢量量化VQ等。DTW利用动态规划的思想,但也有不足:1)过分依赖VAD技术;2)没有充分利用语音的时序动态特性,所以被HMM取代也就容易
原创
2021-08-13 09:10:51
119阅读
一、简介VQ(Vector Quantization)是一个常用
原创
2022-04-08 10:56:08
192阅读
爱美之心人皆有之,从古至今,大部分人都希望自己的容颜相貌完美无缺,都希望自己会被别人夸赞自己长得漂亮或是英俊,但是,容貌是天生的,是父母给的,就算是不太好看我们也只能去接受。随着科技的发展,有一个功能的出现,虽然不能从我们自身将我们的容貌改造变好,但是在拍照或是上网视频时可以将我们的容貌进行优化,让我们的容貌在照片或是视频显现的时候变得美丽,没错,这个功能就是“美颜滤镜功能”,美颜滤
一、简介VQ(Vector Quantization)是一个常用的压缩技术,本文主要回顾:1)VQ原理2)基于VQ的说话人识别(SR,speaker recognition)技术〇、分类问题说话人识别其实也是一个分类问题:说话人识别技术,主要有这几大类方法:模板匹配方法这类方法比较成熟,主要原理:特征提取、模板训练、匹配。典型的有:动态时间规整DTW,矢量量化VQ等。DTW利用动态规划的思想,但也有不足:1)过分依赖VAD技术;2)没有充分利用语音的时序动态特性,所以被HMM取代也就容易
原创
2021-08-20 16:42:27
175阅读
1 简介论文提出 了 一种 基 于 GMM 和 SVM 模型相 结 合的 方法 , 充分利用 了 GMM 模型 的 统 计特性和 SVM 模型 的 良 好的 分类能力
原创
2021-11-18 13:03:13
475阅读
clcclear allclose all t=0:0.01:pi;%%%%测试结果是幅值还原的不太对,频率的分离还可以%%%%可以调用
原创
2021-07-05 13:32:28
364阅读
一、简介
MFCC(Mel-frequency cepstral coefficients):梅尔频率倒谱系数。梅尔频率是基于人耳听觉特性提出来的, 它与Hz频率成非线性对应关系。梅尔频率倒谱系数(MFCC)则是利用它们之间的这种关系,计算得到的Hz频谱特征。主要用于语音数据特征提取和降低运算维度。例如:对于一帧有512维(采样点)数据,经过MFCC后可以提取出最重要的40维(一般而言)数据同时
原创
2021-07-09 16:01:31
506阅读
点赞
目录一、任务背景和分析二、特征抽取librosawavetorchaudio三、数据集commonvoice [ 中文]四、模型训练1、频域信号+LSTM+2DCNN2、频域信号+2DCNN3、时域信号+1DCNN一、任务背景和分析 公司有项目需求,需要识别语音信号是男女性别以及是否是彩铃等。之前一直是做
1、概述学Tensorflow的时候学过怎么用神经网络来做人脸检测和识别,现在看看Opencv怎么做。2、Haar特征Haar-like特征是计算机视觉领域一种常用的特征描述算子,也称为Haar特征,因为Haar-like特征是受一维Haar小波的启示而发明的,所以也称为类Haar特征。 Haar-like特征模板内只有白色和黑色两种矩形,并定义该模板的特征值为白色矩阵像素之和“减去”黑
1 简介设计了基于隐马尔可夫模型(HiddenMarkovModel,HMM)的非特定人汉语语音识别系统,主要 由 录 音、 训练和识别三大模块构成.“录音模块”首先录制一段指定长度的语音信号,然后通过对语音信号的短时能量和过零率进行门限检测,标志出有效语音段并保存.“训 练 模 块”利 用 Ba
原创
2022-05-31 19:01:30
8118阅读
最近需要在CortexM4是做一套非特定人孤立词识别算法,研究了一下语音识别算法,目前较为广泛的是DTW、HMM和ANN,由于MCU算力有限,算法较为简单的DTW显然是不二之选。 DTW(Dynamic TimeWarping)算法是一种模式匹配经典算法,它使用动态规划(DP)的方法成功解决了语音信号特征参数序列时间对准的问题,算法较为简单,有
一、简介MFCC(Mel-frequency cepstral coefficients):梅尔频
原创
2022-04-08 11:12:21
509阅读
点赞