一个智能语音机器人由多个模块组成,具体如下:
1、 ASR(语音识别)
2、 TTS(文本转语音)
3、 CTI(计算机电话集成)
4、 IVR(交互语回应)
5、 Freeswitch(软交换)
语音识别技术是通过机器人的理解和识别把人类的语言信号转换成机器能理解的相应文本或者命令的高新技术。例如文本或者命令,是一种多维模式识别和智能计算机接口的范畴。语音识别技术主要包括模式匹配准则、特征提取技术、以及模型训练技术3个方面,所涉及的领域很广泛,包括模式识别、信号处理等。
文本转语音技术是通过内置芯片的支持下,将文字转化成自然语音流。文本转语音技术主要包含3个核心技术:
ⅰ文本分析-对文本进行语言学分析,逐句进行词汇的、语法的和语义的分析,以确定句子的低层结构和每个字的音素的组成,包括文本的断句、字词切分、多音字的处理、数字的处理、缩略语的处理等。
ⅱ语音合成-把处理好的文本所对应的单字或短语从语音合成库中提取,把语言学描述转化成语言波形。
ⅲ韵律处理-合成音质(Qualityof Synthetic Speech)是指语音合成的质量,一般关注清晰度、自然度、流畅度。
CTI技术最初是想将计算机技术应用到电话系统中,能够自动地对电话中的信令信息进行识别处理,并通过建立有关的话路连接,而向用户传送预定的录音文件、转接来话等。
IVR技术就是互动式语音应答技术,可以根据用户输入的内容播放有关的信息。
FreeSWITCH 相当于是一个电话的软交换解决方案,包括一个软电话和软交换机用以提供语音和聊天的产品驱动。
  智能语音机器人在业务上需要具备的功能:批量外呼、业务流程的配置、中继的配置、软件换的配置。