关于语音发送/接收方法和装置发明专利正式发布

原创

LiveVideoStack 2023-06-13 16:13:34 ©著作权

文章标签 网络深度学习人工智能 python 神经网络 文章分类 Python 后端开发

©著作权归作者所有：来自51CTO博客作者LiveVideoStack的原创作品，请联系作者获取转载授权，否则将追究法律责任

北京时间，6月1日，三星电子申请专利：《语音发送方法和装置以及语音接收方法和装置、电子设备》，正式发布！

该专利的发布旨在解决现有技术中，终端发送和接收语音时进行采样率转换的效果较差，无法向用户提供优质的听觉体验。此外，此项专利的核心特点是基于神经网络的语音发送方法和装置以及语音接收方法和装置。

语音发送/接收方法

一方面，该专利提供一种语音发送方法，包括利用第一特征提取网络从输入的语音信号中提取低频特征信息，并将所述的低频特信息所对应的语音信号发送给接收端等。通过上述操作可降低基于AI的降采样过程中的低频信息的损失，同时给语音接收装置更多的信息以及在语音接收装置获得更好的升采样性能。

另一方面，提供语音接收方法：将所述语音接收发送端发送的语音信号，利用第二特征提取网络从接收到的语音信号中提取低频特征信息并回复高频特征信息，输出包含所述低频特征信息和所述高频特征信息的语音信号。

语音发送/接收装置

在语音发送装置方面包括：低频特征信息提取单元，被配置为利用第一特征提取网络从输入的语音信号中提取低频信息；以及发送单元，被配置为将与所述低频特征信息对应的语音信号发送给接收端。而在语音接收装置方面包括：接收单元，被配置为接收所述接收端发送的语音信号；高频特征信息恢复单元，被配置为利用第二特征提取网络从接收到的语音信号中提取低频特征信息并恢复高频特征信息；输出单元，被配置为输出包含所述低频特征信息和所述高频特征信息的语音信号。

X-net 网络架构

该专利还提出了一种适用于语音通话的联合 Scale Down 和 Scale Up 的网络架构——X-net，可在语音通话中充分利用设备上的降采样的行为来提升语音通话质量。模型的训练采用两步训练方法。另外，Scale Down 和 Scale Up 网络分别部署在发送端和接收端，以完成语音信号的降采样和升采样（带宽扩展）。

电子设备

该专利所提供的电子设备包括存储器和处理器。存储器中存储有计算机程序；处理器用于在运行所述计算机程序时执行所述的语音发送方法和/或语音接收方法。