语音合成技术是将任意文本转换成语音的技术,是人与计算机语音交互必不可少的模块。如果说语音识别技术是让计算机学会“听”人的话,那么语音合成技术就是让计算机程序把文字“说”出来。

从地图导航、语音助手、新闻朗读、到各种大大小小的客服、呼叫中心、甚至机场广播、地铁公交车报站都少不了语音合成技术的身影。

而且不仅仅是文字转语音,语音合成技术研究范围还包括:歌唱语音合成、耳语语音合成、方言合成、动物叫声合成等等。目前语音合成技术,已经成功应用在很多领域。

区别于传统TTS刻板播音式合成表现,个性化TTS应用场景越来越丰富。数据堂基于海量语音文本数据标注经验与领先的人工智能语音合成技术,可以提供高音质、多场景、多类别的语音合成数据解决方案。

语音合成数据解决方案

中文通用平均音色合成库

由中文母语发音人参与录制,发音纯正,语料音素覆盖均衡,专业语音学家参与标注,文字准确率不低于99.9%,音素准确率不低于99%,韵律准确率不低于98%,精准匹配语音合成的研发需求。

美式英语女声合成库

由美国母语发音人参与录制,发音纯正,音色甜美,语料音素覆盖均衡,专业语音学家参与标注,文字准确率不低于99%,词性准确率不低于98%,音素准确率不低于98%,精准匹配语音合成的研发需求。

中英混读客服平均音色合成库

由中文母语发音人录制,客服场景的录音文本,语料音素覆盖均衡,专业语音学家参与标注,音字准确率不低于99.8%,韵律标注准确率不低于98%,精准匹配语音合成的研发需求。

中文女声客服合成库

由中文母语发音人录制,声音活泼亲切,语料音素覆盖均衡,专业语音学家参与标注,音字准确率不低于99.8%,韵律准确率不低于98%,精准匹配语音合成的研发需求。

中文女声模仿童声合成库

由中文母语发音人录制,发音纯正,音色甜美,语料音素覆盖均衡,专业语音学家参与标注,字准确率达99%,精准匹配语音合成的研发需求。

随着语音合成技术的快速发展,所生成的语音会越来越自然生动,也会越来越有情感表现力。我们坚信,技术的进步,会不断冲破原有的障碍,满足越来越多的用户需求,使得更好的应用不断涌现,实现用科技改变生活的美好愿景!