3 月 5 日,标贝科技推出全新 「留声机」,该方案具有高原度复刻效果,用户只需 5 分钟左右即可完成录制,训练过程全自动化处理,大约 2 小时后,即可拥有媲美原声声音的个性化模型,轻松实现文本转语音功能。该产品可应广泛用于车载交互、泛娱乐、智慧教育、智能家居、陪伴机器人等众多场景。
据了解,本次标贝科技打造「留声机」产品方案,依托神经网络技术和迁移学习等技术,实现了很高的音色还原度,Mos 值(语音质量的重要指标)接近 4 分,达到行业领先水平。用户可选择线上录音或线下上传语料包等形式完成留声机声音复刻,通过本地和云端调用的形式使用。
标贝科技语音技术相关负责人表示,随着 AI 语音技术不断发展,智能语音市场将迎来爆发增长点。个性化、情感化是语音交互趋势。标贝科技推出的留声机方案,正是以个性化的 AI 技术为纽带,用有温度的声音,传递情感,让生活更美好。
创新 AI 语音技术应用「留声机」打造高还原度复刻效果
「亲情、个性化、有趣味的声音体验,与传统的、标准化的商用合成路线是完全不同的,具有门槛低、效果好、有亲切感等新的特点,可能会为我们打开一个全新的领域。个性化的声音,与用户的生活、工作、出行等重要场景结合,具有很大的想象空间。」标贝语音技术相关负责人说。
标贝科技专注高质量与专业的 AI 语音合成与数据服务提供,以 AI 语音技术创新为增长力,拥有业内领先的语音技术, 打造了包括多语种语音合成、离在线语音合成、多音色合成、本地化部署等在内的高音质语音方案,以及众多的声音 IP、标贝悦读工具平台、声音复刻平台等。
标贝本次推出「留声机」,基于 attention 语音合成系统,录制 5 分钟,10 句话语音内容,系统经过录音采集、自动化训练系统,云授权服务及语音合成等系列步骤后,2 小时左右实现声音复刻,MOS 值 4,兼顾合成效果与效率。
据标贝技术相关负责人介绍,这一技术处理,相比标准化的 TTS 语音包,标贝个性化语音技术在情感合成上让声音更自然更真实。
多场景触达 「留声机」传递美好
标贝「留声机」,经过声音录制 → 模型训练 → 声音应用等步骤,可广泛使用于应用于车载交互、泛娱乐、智慧教育、智能家居、陪伴机器人等众多场景。用户可在线录音通过 API 接口传输到标贝技术云后台;也可通过线下传输已有语料库,标贝通过 API/SDK 合成返回语音包。
试想一下,家长忙碌无法陪伴孩子、生活起居专属语音助手提醒、远方亲人不在身边等情况,通过标贝「留声机」,用户均可定制个性化语音,将声音角色及关系体验与文本信息相互结合,获得一种前所未有的独特体验,从而为产品注入独特的个性化魅力。
以儿童慧读教育产品—恐龙贝克 App 为例,该产品主打亲子陪伴教育, 采用标贝留声机声音复刻功能,基于标贝提供的领先 AI 语音技术,结合海量故事内容文本,家长只需录制上传声音,即可获得复刻自己声音给孩子讲故事并实现分享,增强亲子熟悉度。
据了解,恐龙贝克打造了包括超级飞侠—乐迪、孙悟空、龙妈妈等在内的多个 AI 卡通明星主播,配合经典卡通、国学启蒙、童话寓言、睡前故事等众多早教题材音频内容,寓教于乐,带给孩子美好童年。
据悉,恐龙贝克最新版本 iOS1.3.6 与 Android1.3.8,已上线各大安卓平台和 iOS 平台,家长用户可下载体验留声机功能,给孩子讲故事。
随着 AIOT 与 5G 的不断融合,语音技术与场景结合度更紧密,个性化语音交互是必然趋势。而标贝留声机功能,把技术、情感与用户串联一起,生活无处不是爱,感受美好。未来,标贝科技将加大研发投入力度,携手合作伙伴一起,将留声机、标贝悦读等智能语音技术应用到更多场景中,带来前所未有的「视听盛宴」。