一、参考资料那些语音转字幕,转文字的软件平台 - 哔哩哔哩
语音语音语音用 Python 训练自己的语音识别系统利用 AssemblyAI 在 PyTorch 中建立端到端的语音识别模型
原创 2021-08-02 14:21:51
114阅读
语音 声音作为一种机械波,其基本物理属性是频率和振幅。频率指振动的快慢。振幅是指声波在某个位置上的瞬时强弱。有时候,人们用音高、音质和音强来描述声音的基本特征。实际上,这三个特征都归结为频率和振幅这两个基本属性。其中音高、音质与频率相关。 所谓分贝,是指两个相同的物理量(例A1和A0)之比取以10为
转载 2018-12-01 16:18:00
71阅读
2评论
语音识别】⚠️玩转语音识别 1⚠️ 语音识别简介
语音识别】⚠️玩转语音识别 1⚠️ 语音识别简介
一直在想,假如有一天我们生活中的机器人像在很多科幻电影里面看到的那样,能够理解人类的语言,并能完成与人类的自然对话,是多爽的事情。语音的研究一直在试图解决这个问题。例如,语音到文字,即通常所说的语音识别,就试图将语音转换为文字,然后交给计算机进行后续的理解;而文字到语音,即语音合成,则试图将文字转换为声音,让人类可以听到。也许通过全世界语音界的科研和工程人员的努力,在不久的将来,我们真的可以和机器进行自由的对话(其实我一直很期待这一天的到来)。
原创 2011-01-25 05:01:35
1636阅读
 Offline_speech_synthesis 
原创 2021-04-22 21:57:32
497阅读
经过测试的确语音合成的音频的相位图和自然声音的相位图是有区别的比如两侧不均匀等
原创 2021-07-10 09:29:14
392阅读
​ 一、语音加密简介(附课程作业报告) 语音信号处理是研究用数字信号处理技术和语音学知识对语音信号进行处理的新兴的学科,通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息形式。语音加密也显得尤为重要。 Matlab语言是一种数据分析和处理功能十分强大的计算机应用软件,它的信号处理与分析工 ...
vue 语音播报(文字转语音
​  一、语音加密简介(附课程作业报告) 语音信号处理是研究用数字信号处理技术和语音学知识对语音信号进行处理的新兴的学科,通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息形式。语音加密也显得尤为重要。Matlab语言是一种数据分析和处理功能十分强大的计算机应用软件,它的信号处理与分析工具箱为语音信号分析提供了十分丰富的功能函数。通过matlab对语音信号进行AM调制解调,实现对语音
原创 2021-09-12 00:52:42
410阅读
与众不同 windows phone 8.0 之 语音: TTS(Text To Speech), 语音识别, 语音命令
转载 2014-01-02 09:43:00
155阅读
2评论
​ demo下载地址:​​https://fir.im/jy28​​ demo源码:​​https://github.com/wapchief/android-CollectionDemo​​百度网盘:​​https://pan.baidu.com/s/1gvoTlcddstxb7tyS8MvWzw ​​密码:l5gd​​​​​​//blog.csdn.net/halaoda/article/d
转载 2018-06-24 19:39:00
103阅读
2评论
链接:https://pan.baidu.com/s/1z4tK4EToOpdQcVfybFNcaw :801h demo下载地址:https://fir.im/jy28 demo源码查看:https://github.com/wapchief/android-CollectionDemo
转载 2018-06-06 20:28:00
233阅读
2评论
Android语音播报、后台播报、语音识别​程序效果图:简单的XML布局<?xml version="1.0" encoding="utf-8"?><LinearLayout xmlns:android="http://schemas.android.com/apk/res/android" android:layout_width="fill_parent" and
转载 2017-06-05 16:00:00
389阅读
2评论
这里写自定义目录标题语音离线SDK欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注n编辑器
声音的本质是震动,震动的本质是位移关于时间的函数,波形文件(.wav)中记录了不同采样时刻的位移。通过傅里叶变换,可以将时间域的声音函数分解为一系列不同频率的正弦函数的叠加,通过频率谱线的特殊分布,建立音频内容和文本的对应关系,以此作为模型训练的基础。案例:画出语音信号的波形和频率分布# -*- encoding:utf-8 -*-import numpy as npimport numpy.fft as nfimport scipy.io.wavfile as wfimport matplo
转载 2021-07-21 17:52:21
851阅读
目录 语音识别  MFCC  隐马尔科夫模型声音合成 声音的本质是震动,震动的本质是位移关于时间的函数,波形文件(.wav)中记录了不同采样时刻的位移。 通过傅里叶变换,可以将时间域的声音函数分解为一系列不同频率的正弦函数的叠加,通过频率谱线的特殊分布,建立音频内容和文本的对应关系,以此作为模型训练的基础。 案例:画出语音信号的波形和频率分布,(freq.wav数据地址)
转载 2019-09-20 15:29:00
687阅读
2评论
这次给大家带来的是项目的离线语音功能。 讯飞开放平台中的离线语音 首先创建开放平台的账号。这个不必多说 然后创建新应用 选择我的应用,例如以下图,注意下我打马赛克的地方,这个appId非常重要 点击进入 这里要重要提醒下 。讯飞离线语音注冊是要花钱。本项目当然也花了钱买了注冊量 只是大家想熟悉这样的
转载 2017-08-01 08:38:00
334阅读
2评论
  • 1
  • 2
  • 3
  • 4
  • 5