android 过滤杂音过滤音频

转载

幸福的地图 2023-07-25 15:22:26

文章标签 android 过滤杂音麻省计算机音乐博士人工智能数据集 Computer 文章分类 Android 移动开发

一般利用均衡器可以将音乐中的低音部分调出来，但是麻省理工学院的计算机科学和人工智能实验室(Computer Science and Artificial Intelligence Lab，CSAIL)的研究人员发现了更好的解决方案。他们所研发的新系统PixelPlayer，能够利用人工智能来区分和过滤声音，让音乐听起来更洪亮或更柔和。

将指定视频录入经过充分训练的PixelPlayer，系统随机能够过滤伴奏，同时识别音源，接着计算图像中每个像素的音量，然后通过“空间定位”确定产生相似音波的片段。

今年9月，德国慕尼黑即将举行欧洲计算机视觉会议(European Conference on Computer Vision)，会议中要发表的一篇新论文则详细论述了“像素的声音(The Sound of Pixels)”。麻省理工学院计算机科学和人工智能实验室的博士生，同时也是这篇论文的合著者Zhao Hang同学表示，“最好的情况就是，我们能识别出哪种乐器发出怎样的声音。”

android 过滤杂音过滤音频_Computer

PixelPlayer的核心是一种基于乐器组合多模态训练的神经网络，数据集采用了Youtube上714条未经修剪且未经标记的视频。其中，总时长为60小时的500条视频用于训练，剩余的则用于验证和测试。在训练过程中，研究人员分别根据原声吉他、大提琴、单簧管、长笛和其他乐器向系统馈入了算法。

这只是PixelPlayer多重机器学习框架的一个部分。经过训练后的视频分析算法将从剪辑帧中提取出视觉特征，这就是系统的第二个神经网络，即音频分析网络。音频分析网络将声音拆分为片段，并从中提取特征。最后，音频合成网络将把上述两个网络输出的特定像素和声波关联起来。

PixelPlayer进行完全自监督的学习，人们无需对数据注释，而且系统目前已经能识别20种乐器。Zhao Hang说，较大的数据集增强了系统的识别量，但识别乐器子类的能力却不佳。系统也可以识别音乐元素，例如小提琴的谐波频率。

研究人员认为PixelPlayer可以进行声音剪辑，或者帮助机器人理解动物、车辆和其他物体所制造的环境声音。他们写到，“我们希望我们的工作能够开辟新的研究途径，从视觉和听觉信号角度实现声源分离”。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：docker k8s 部署爬虫使用docker部署k8s项目

下一篇：ios json 免费接口 json接口测试工具

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

android 过滤杂音 过滤音频

android 过滤杂音 过滤音频

51CTO博客

android 过滤杂音过滤音频

android 过滤杂音过滤音频