看资料说谷歌的语音只支持英文的,这么一来,语音识别只能看第三方的sdk,查找一下,果然是有实现好了的demo,下面就实现步骤,进行一一推演,一个步骤少了都不行; 这里面需要说一下,只集成录音功能,其他暂不考虑;1、注册科大讯飞,然后创建自己的应用,创建成果后,获取id(集成第三方sdk的一贯流程);2、下载sdk,这里只选取“语音听写”功能,然后下载sdk,等待网页完成集成、下载; 看看自己的安装            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-09-19 17:33:36
                            
                                39阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            使用 Azure Speech Service 进行语音识别Speech recognition using Azure Speech Service01/14/2020本文内容Azure Speech Service 是一种基于云的 API,它提供以下功能:Azure Speech Service is a cloud-based API that offers the following fu            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-01-05 15:37:09
                            
                                85阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
             
    
        
            
            
            
            
            
            
            
            
            
            
            
            Android中            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                            精选
                                                        
                            2013-02-28 19:52:37
                            
                                629阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            一、准备工作1、你需要android手机应用开发基础2、科大讯飞语音识别SDK android版3、科大讯飞语音识别开发API文档4、android手机关于科大讯飞SDK及API文档,请到科大语音官网下载:http://www.xfyun.cn/当然SDK和API有多个版本可选,按照你的需要下载,其次,下载需要填写资料申请注册,申请通过或可获得Appid如下图,申请一个APPID,就可以            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-08-09 15:38:03
                            
                                251阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            本文节选于机械工业出版社推出的《Android应用开发揭秘》一书,作者为杨丰盛。本书内容全面,详细讲解了Android框架、Android组件、用户界面开发、游戏开发、数据存储、多媒体开发和网络开发等基础知识,而且还深入阐述了传感器、语音识别、桌面组件开发、Android游戏引擎设计、Android应用优化、OpenGL等高级知识。另外,本书还全面介绍了如何利用原生的C/C++(NDK)和Pyth            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-09-13 10:47:32
                            
                                127阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            一、常用数据结构:数组,堆,栈,队列,链表,树,图,散列表数组:把具有相同类型的若干变量按有序的形式组织起来。堆:是一个特殊的树形数据结构,每个结点都有一个值。一般说的堆是指二叉堆。他的最大特点就是根节点的值最小或最大,并且根节点的两个子树也是一个堆。栈:只能在某一端插入和删除的特殊线性表。按照先进后出的原则存储数据,先进入的数据被压入栈底,最后的数据在栈顶,需要读数据的时候从栈顶开始弹出数据。队            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-05-17 05:41:23
                            
                                47阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            偶然在网上看到。于是照着网上的例子写了一个例子。很简单,就是实现语音识别。后来的TTS没有做。直接贴代码 /**
 * 语音识别
 * 
 * @author sy
 * 
 */
public class SpeakToActivity extends Activity
{
    /** Called when the activity is first created. */
    pri            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-07-13 20:58:49
                            
                                226阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            语音识别技术最近貌似是越来越火了。再前几天科大讯飞还刚刚发布了讯飞语点——一个据说要挑战siri的应用。……好吧,对这些的东西讨论要说起来就多了。本文主要讲如何在自己的android应用中集成语音识别技术——自然,是使用科大讯飞的sdk。讯飞的语音sdk是需要申请的,地址是:http://dev.voicecloud.cn/developer.php?vt=1 。申请一个讯飞的开发者账号,然后申请            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-01-17 07:11:25
                            
                                65阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            01 语音识别技术现状1、语音成为万物互联时代人机交互关键入口,语音识别市场空间稳步提高近几年来,语音识别技术已经逐步走进了我们的生活和工作中,特别是以 AI 语音助手为代表的语音交互功能也已经得到落地,应用到各类消费级产品当中,比如,智能手机、智能汽车、智能家电以及智能家居等。用户只需要唤醒语音助手,提供相应的指令,就可以使其帮助我们完成打电话、查天气以及导航等常见的功能。根据相关咨询机构的调研            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-08-09 16:40:26
                            
                                85阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            1,语音认别技术发展过程  语音识别技术是指机器自动将人的语音的内容转成文字,又称 Automatic Speech Recognition,即ASR技术。语音识别是一门交叉的、非常复杂的学科,需要具备生理学、声学、信号处理、计算机科学、模式识别、语言学、心理学等相关学科的知识。  语音识别的研究是个漫长而且艰难的过程,它的发展可以追溯到20世纪50年代,1952年贝尔实验室首次实现Audrey英            
                
         
            
            
            
            在我们的生活中,语言是传递信息最重要的方式,它能够让人们之间互相了解。人和机器之间的交互也是相同的道理,让机器人知道人类要做什么、怎么做。交互的方式有动作、文本或语音等等,其中语音交互越来越被重视,因为随着互联网上智能硬件的普及,产生了各种互联网的入口方式,而语音是最简单、最直接的交互方式,是最通用的输入模式。在1952年,贝尔研究所研制了世界上第一个能识别10个英文数字发音的系统。1960年英国            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-03-26 09:58:42
                            
                                69阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            作者:黄辣鸡。隐马尔可夫链HMM模型自从1980年代被用于语音识别以来,一直都是实际语音识别系统的主流方法。1. 声学模型1.1 隐马尔可夫链模型HMM与声学模型根据上一篇博文中提到的,P(X|W)P(X∣W)对应的是声学模型,首先需要考虑的是,语音和文本的不定长关系使得二者的序列之间无法一一对应。隐马尔可夫链模型正好可以解决这个问题。图1 隐马尔可夫链模型(I、E表示开始和结束时间)比如P(X│            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-06-22 21:52:48
                            
                                32阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            接上篇《中文语音识别技术在c#中的应用(一)》………但是,这个方法本身并不知道你给的字符串是什么语言,所以需要我们它这个字符串用什么语言读出。SpVoiceClass 类的Voice 属性就是用来设置语种的,我们可以通过SpVoiceClass 的GetVoices方法得到所有的语种列表,然后在根据参数选择相应的语种,比如设置语种为汉语如下所示:private void SetChinaVoice            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-03-06 06:35:57
                            
                                38阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            一、申请注册科大用户和下载SDK(里面的appid要和自己的一样才可以使用)详细步骤就不写了,注册网址:http://www.xfyun.cn二、注册完之后,点击创建应用-选择要使用的平台和选择自己所要实现的功能,点击下载sdk即可。下载完解压压缩包如下图:三、把sample里面的demo通过我们的开发工具打开,我用的是androidStudio,所以导入步骤为:方法一(导入project方式):            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-07-31 20:10:48
                            
                                182阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            一篇语音情感识别的论文,使用基于CTC的LSTM模型对IEMOCAP数据集中的4类情感进行分类,并对结果进行了分析
    动机(Motivation)在自动语音识别(Automated Speech Recognition, ASR)中,只是把语音内容转成文字,但是人们对话过程中除了文本还有其它重要的信息,比如语调,情感,响度。这些信息对于语音的理解也是很重要            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-09-20 16:56:56
                            
                                508阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            学习源于官方文档 Voice input in Unity 笔记一部分是直接翻译官方文档,部分各人理解不一致的和一些比较浅显的保留英文原文(三)Hololens Unity 开发之 语音识别HoloLens 有三大输入系统,凝视点、手势和声音 ~ 本文主要讲解 语音输入 ~ (测试不支持中文语音输入~)一、概述HoloToolKit Unity 包提供了三种 语音输入的方式 :Phrase Rec            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-04-07 13:38:51
                            
                                93阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            情感语料库大致可以通过以下3个方法获的:(1) 从我们的现实生活中所采集的真实的自然语料,然后再经过人工挑选获得可以使用的语料;            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2022-10-10 16:22:54
                            
                                975阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            作者:louwill 有着多年的R语言和Python编程经验配套视频教程:Python机器学习全流程项目实战精https://edu.hellobi.com/course/284涵盖需求分析->数据采集->数据清洗与预处理->数据分析与可视化->特征工程->机器学习建模->模型调优->报告输出。以Python为工具实现机器学习全流程。在上一节中,笔者对语音            
                
         
            
            
            
            在看kaldi文档中对chain model的介绍时,其中反复提到了MMI、lattice free MMI、DNN-HMM这些关键词,之前一直都没搞懂MMI到底是什么东西,看了很多博客只能大概了解到应该是训练声学模型时的一个准则。而且前几天分别看了GMM和HMM,各自原理大概明白了,但是还不太清楚它们是怎么和语音识别联系起来的,今天特地看了几篇博客去了解了一下GMM、HMM具体是如何和语音识别联            
                
         
            
            
            
            您可能听说过“ Google Now项目” ,在这里您可以发出语音命令,Android会为您获取结果。 
  它可以识别您的声音并将其转换为文本或采取适当的措施。 
  您有没有想过如何做? 
  如果您的答案是语音识别API,那么您绝对正确。 
  最近,在使用Android语音识别API时,我发现了一些有趣的东西。 
  API真的很容易与应用程序一起使用。 
  下面给出的是有关            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-12-11 19:37:09
                            
                                64阅读