一、数字音频基础知识 Fourier级数: 任何周期的波形可以分解成多个正弦波,这些正弦波的频率都是整数倍。级数中其他正线波的频率是基础频率的整数倍。基础频率称为一级谐波。 PCM: pulse code modulation,脉冲编码调制,即对波形按照固定周期频率采样。为了保证采样后数据质量,采样频率必须是样本声音最高频率的两倍,这就是Nyquist频率。 样本大小:采样后用于存储振幅级的位数,实际就是脉冲编码的阶梯数,位数越大表明精度越高,这一点学过数字逻辑电路的应该清楚。 声音强度: 波形振幅的平方。两个声音强度上的差常以分贝(db)为单位来度量, 计算公式如下: 20*log(A1/A2)分贝。A1,A2为两个声音的振幅。如果采样大小为8位,则采样的动态范围为20*log(256)分贝=48db。如果样本大小为16位,则采样动态范围为20*log(65536)大约是96分贝,接近了人听觉极限和痛苦极限,是再线音乐的理想范围。windows同时支持8位和16位的采样大小。 二、相关API函数,结构,消息 对于录音设备来说,windows 提供了一组wave***的函数,比较重要的有以下几个: 打开录音设备函数 MMRESULT waveInOpen( LPHWAVEIN phwi, //输入设备句柄 UINT uDeviceID, //输入设备ID LPWAVEFORMATEX pwfx, //录音格式指针 DWORD dwCallback, //处理MM_WIM_***消息的回调函数或窗口句柄,线程ID DWORD dwCallbackInstance, DWORD fdwOpen //处理消息方式的符号位 ); 为录音设备准备缓存函数 MMRESULT waveInPrepareHeader( HWAVEIN hwi, LPWAVEHDR pwh, UINT bwh ); 给输入设备增加一个缓存 MMRESULT waveInAddBuffer( HWAVEIN hwi, LPWAVEHDR pwh, UINT cbwh ); 开始录音 MMRESULT waveInStart( HWAVEIN hwi ); 清除缓存 MMRESULT waveInUnprepareHeader( HWAVEIN hwi,LPWAVEHDR pwh, UINT cbwh); 停止录音 MMRESULT waveInReset( HWAVEIN hwi ); 关闭录音设备 MMRESULT waveInClose( HWAVEIN hwi ); Wave_audio数据格式 typedef struct { WORD wFormatTag; //数据格式,一般为WAVE_FORMAT_PCM即脉冲编码 WORD nChannels; //声道 DWORD nSamplesPerSec; //采样频率 DWORD nAvgBytesPerSec; //每秒数据量 WORD nBlockAlign; WORD wBitsPerSample;//样本大小 WORD cbSize; } WAVEFORMATEX; waveform-audio 缓存格式 typedef struct { LPSTR lpData; //内存指针 DWORD dwBufferLength;//长度 DWORD dwBytesRecorded; //已录音的字节长度 DWORD dwUser; DWORD dwFlags; DWORD dwLoops; //循环次数 struct wavehdr_tag * lpNext; DWORD reserved; } WAVEHDR; 相关消息 MM_WIM_OPEN:打开设备时消息,在此期间我们可以进行一些初始化工作 MM_WIM_DATA:当缓存已满或者停止录音时的消息,处理这个消息可以对缓存进行重新分配,实现不限长度录音 MM_WIM_CLOSE:关闭录音设备时的消息。 相对于录音来说,回放就简单的多了,用到的函数主要有以下几个: 打开回放设备 MMRESULT waveOutOpen( LPHWAVEOUT phwo, UINT uDeviceID, LPWAVEFORMATEX pwfx, DWORD dwCallback, DWORD dwCallbackInstance, DWORD fdwOpen ); 为回放设备准备内存块 MMRESULT waveOutPrepareHeader( HWAVEOUT hwo, LPWAVEHDR pwh, UINT cbwh ); 写数据(放音) MMRESULT waveOutWrite( HWAVEOUT hwo, LPWAVEHDR pwh, UINT cbwh ); 相应的也有三个消息,用法跟录音的类似: 三、程序设计 一个录音程序的简单流程: 打开录音设备waveInOpen===>准备wave数据头waveInPrepareHeader===> 准备数据块waveInAddBuffer===>开始录音waveInStart===>停止录音(waveInReset) ===> 关闭录音设备(waveInClose) 当开始录音后当buffer已满时,将收到MM_WIM_DATA消息,处理该消息可以保存已录好数据。 回放程序比这个要简单的多: 打开回放设备waveOutOpen===>准备wave数据头waveOutPrepareHeader===>写wave数据waveOutWrite===> 停止放音(waveOutRest) ===>关闭回放设备(waveOutClose) 如何处理MM消息: MSDN告诉我们主要有 CALLBACK_FUNCTION、CALL_BACKTHREAD、CALLBACK_WINDOW 三种方式,常用的是 Thread,window方式。 线程模式 waveInOpen(&hWaveIn,WAVE_MAPPER,&waveform,m_ThreadID,NULL,CALLBACK_THREAD),我们可以继承MFC的CwinThread类,只要相应的处理线程消息即可。 MFC线程消息的宏为: ON_THREAD_MESSAGE, 可以这样添加消息映射: ON_THREAD_MESSAGE(MM_WIM_CLOSE, OnMM_WIM_CLOSE) 窗口模式 类似于线程模式,参见源程序即可。 |
Android 录音机波形 录音波形大小
转载本文章为转载内容,我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题,欢迎原作者联系我们进行内容更正或删除文章。
提问和评论都可以,用心的回复会被更多人看到
评论
发布评论
相关文章
-
Android录音波形图绘制 录音机波形图
Naudio是集录音、播放的源码库。https://github.com/naudio/NAudio,这是基于.net的框架。 在这链接的源码里有各种.net 框架的例子,对于基于.net wpf/universal 的程序,还提供了波形图的绘制。我从没接触过音频类的技术,有个基于wpf 的项目需要快速提供实时绘制录音的图形。因为源码库提供的wpf例子是基于文件播放的,其还中包括了比较多参数设置,
Android录音波形图绘制 NAudio 录音波形图 wpf录音波形图 WaveRenderer wpf实时和回放波形图 -
android 录音的波型 录音波形大小
简 介: 测量了台式计算机声卡采集信号的频带宽度,这位之后的实验打下基础。关键词: 声卡,截止频率,低频,高频 声卡录音 目 录 Contents 1.1 采集数据典型数据 1.2 测量低频截止频率 1.3 测量高频截止频
android 录音的波型 声卡 高频截止频率 低频截止频率 台式计算机 -
kafka 推送json文件node
介绍服务端采集嵌入式设备发送的报文信息,做入库,部分报文处理后推送设备,校时推送,及后期扩展的业务操作。简单说明嵌入式设备和服务端采用websocket的通信方式。为什么选用websocket?我觉得主要原因是由于websockt的两个特点,第一是长连接,第二是服务端可以主动向客户端发起推送。实际的业务场景也正是设备需要一直向服务端发送数据,而服务端需要判断某些报文后来做推送。设备首先要经过认证服
kafka 推送json文件node websocket kafka springboot springcloud