我们在这里的目标是:我们希望PC在发生任何事情时拨打指定的电话号码,并以易于理解的口头语音片段进行报告,这些片段以预先录制的波形文件的形式保存。


第一部分:了解调制解调器的功能。


大多数调制解调器可以归类为具有以下特征:

数据/传真

数据/传真/语音

数据/传真/语音/扬声器

在我们这里的情况下,调制解调器至少必须支持语音功能。 找出调制解调器是否支持语音的最简单方法是运行超级终端以使用AT命令。

运行超级终端并使用以下命令:


ATZ


调制解调器应以“确定”响应


AT + FCLASS = 8


如果您的调制解调器支持语音,则应返回“确定”。 否则为“错误”。

如果您有兴趣,可以输入


AT + FCLASS =?


调制解调器应响应以下内容:0,1、2、8。

0:数据

1,2:传真

8:语音

如果事实证明您没有语音调制解调器,那么我们将陷入困境。 如果您想进一步采用这种方法,则需要安装具有语音功能的调制解调器。

现在,如果您确实有语音调制解调器,则需要了解有关其可以处理的语音数据格式的功能。 使用以下AT命令来查找:


AT + VSM =?

(请记住,在发送此命令之前必须先发送AT + FCLASS = 8。)

我们的调制解调器返回以下内容:


AT + VSM =? 
 
 
 128,“ 8位线性”,(7200,8000,11025) 
 
 
 129,“ 16位线性”,(7200,8000,11025) 
 
 
 130,“ 8位ALAW”,(8000) 
 
 
 131,“ 8位ULAW”,(8000) 
 
 
 132,“ IMA ADPCM”,(7200,8000,11025)


我们将其解释为:我们的调制解调器支持5种不同的语音数据编码方法。 如果您想了解更多有关这些方法的信息,请使用Google。 在此示例中,我们将重点介绍第一种方法(最简单的方法)。 此方法使用8位线性(带符号数字)并支持以下采样率:

每秒7200、8000或11025个样本。

从理论上讲,大多数人的语音频率介于1kHz至4kHz之间。 采样理论(奈奎斯特)表明,您必须至少采用8kHz才能重建高达4kHz的语音内容。 高于8kHz会更好地避免抗混叠。 但是,更高的采样率会带来更大的数据负载。

现在,回到我们的示例,我们将选择:每秒8000个采样,即8kHz。 我们通过键入以下命令告诉调制解调器我们的选择:


AT + VSM = 128,8000 (应返回“ OK”。)


按照上述步骤,您现在应该知道调制解调器是否支持语音,如果支持,则使用哪种语音数据格式。 您现在必须选择数据格式才能准备wave文件,该文件将是


第二部分