我们在这里的目标是:我们希望PC在发生任何事情时拨打指定的电话号码,并以易于理解的口头语音片段进行报告,这些片段以预先录制的波形文件的形式保存。
第一部分:了解调制解调器的功能。
大多数调制解调器可以归类为具有以下特征:
数据/传真
数据/传真/语音
数据/传真/语音/扬声器
在我们这里的情况下,调制解调器至少必须支持语音功能。 找出调制解调器是否支持语音的最简单方法是运行超级终端以使用AT命令。
运行超级终端并使用以下命令:
ATZ
调制解调器应以“确定”响应
AT + FCLASS = 8
如果您的调制解调器支持语音,则应返回“确定”。 否则为“错误”。
如果您有兴趣,可以输入
AT + FCLASS =?
调制解调器应响应以下内容:0,1、2、8。
0:数据
1,2:传真
8:语音
如果事实证明您没有语音调制解调器,那么我们将陷入困境。 如果您想进一步采用这种方法,则需要安装具有语音功能的调制解调器。
现在,如果您确实有语音调制解调器,则需要了解有关其可以处理的语音数据格式的功能。 使用以下AT命令来查找:
AT + VSM =?
(请记住,在发送此命令之前必须先发送AT + FCLASS = 8。)
我们的调制解调器返回以下内容:
AT + VSM =?
128,“ 8位线性”,(7200,8000,11025)
129,“ 16位线性”,(7200,8000,11025)
130,“ 8位ALAW”,(8000)
131,“ 8位ULAW”,(8000)
132,“ IMA ADPCM”,(7200,8000,11025)
好
我们将其解释为:我们的调制解调器支持5种不同的语音数据编码方法。 如果您想了解更多有关这些方法的信息,请使用Google。 在此示例中,我们将重点介绍第一种方法(最简单的方法)。 此方法使用8位线性(带符号数字)并支持以下采样率:
每秒7200、8000或11025个样本。
从理论上讲,大多数人的语音频率介于1kHz至4kHz之间。 采样理论(奈奎斯特)表明,您必须至少采用8kHz才能重建高达4kHz的语音内容。 高于8kHz会更好地避免抗混叠。 但是,更高的采样率会带来更大的数据负载。
现在,回到我们的示例,我们将选择:每秒8000个采样,即8kHz。 我们通过键入以下命令告诉调制解调器我们的选择:
AT + VSM = 128,8000 (应返回“ OK”。)
按照上述步骤,您现在应该知道调制解调器是否支持语音,如果支持,则使用哪种语音数据格式。 您现在必须选择数据格式才能准备wave文件,该文件将是
第二部分 。