0.音频信号
在时间和幅度都连续的是模拟音频信号。
在计算机中,只能用有限的数字去表示一个音频信号,所以有了数字音频信号。
从模拟音频到数字音频,需要经过一些转换过程:
- 选择采样频率
- 进行采样
- 选择分辨率
- 进行量化
- 编码
- 形成声音文件
1.采样
采样频率/采样周期表示计算机每秒采集样本的个数,值越高,样本数越多,则得到的声音波形越接近原始声音的波形,声音质量就越好。
至于采样频率具体多高,要根据奈奎斯特理论和音频本身的最高频率决定的,奈奎斯特理论指出:采样频率不应低于输入信号最高频率的两倍,公式如下:(f为被采样信号的最高频率)
一般人耳所能听到的声音频率范围为:20HZ~20KHZ,所以采样频率要达到40KHZ才能获得好的听觉效果。
采样常用的三个频率为:
- AM广播---11.025KHZ
- FM广播---22.05KHZ
- CD保真音质---44.1KHZ (之前的录音就是用到了这个采样频率)
现在声卡的采样频率一般为48KHZ或96KHZ
2.量化
模拟电压的幅值是连续的,而用数字表示音频幅度时,只能把无穷多个电压幅度用有限个数字表示,即把某一幅度范围内的电压用一个数字表示,这称之为量化。这个数字在计算机中是二进制,称为量化位数,通常是8位或16位。所用位数越多,声音质量越好。
量化又分为均匀量化和非均匀量化。
3.编码
编码是将量化后的采样信号值转换成一个二进制码序列输出。常用的就是脉冲编码调制(PCM编码)。
4.音频数据传输速率
数据传输速率(比特率)指每秒钟传输的数据位数,记为 bit/s 。
未经压缩的数字音频数据传输率的计算公式如下:
- 数据传输率(bit/s) = 采样频率(HZ)* 量化位数 * 声道数
如果采用PCM编码,经过数字化后音频文件所需占用的存储空间的计算公式如下:
- 文件数据量(B) = 数据传输率(bit/s) * 采样时间(s) / 8
常用的声音数字化指标表如下:
质量 | 频率范围 HZ | 采样频率 KHZ | 量化位数 bit | 声道数 | 数据传输率(未压缩)kbit/s |
AM | 50~7000 | 11.025 | 8 | 单声道 | 88.2 |
FM | 20~15000 | 22.05 | 16 | 立体声 | 705.6 |
CD | 20~20000 | 44.1 | 16 | 立体声 | 1411.2 = (44.1*16*2) |
5.音频文件格式
见百度详细说明:
https://baike.baidu.com/item/%E9%9F%B3%E9%A2%91%E6%A0%BC%E5%BC%8F/3234139?fr=aladdin