Crossin的编程教室 2020-07-07

以下文章来源于Python实用宝典 ,作者Ckend

简单的音乐可视化_PythonPython实用宝典

如此Python,怎能不爱

简单的音乐可视化_Python_02



你有没有经常好奇一些音乐软件的频谱特效是怎么做的,为什么做得这么好看?有没有想试试自己提取音乐频谱并可视化展现出来?简单的音乐可视化_Python_03

今天,咱就来简单粗暴地可视化下面这首歌曲的频谱!

Soon Goodbye, Now LoveTom Rosenthal - Fenn简单的音乐可视化_Python_041.准备

开始之前,你要确保 Python 和 pip 已经成功安装在电脑上了。

Windows环境下打开 CMD (开始—运行—CMD),苹果系统环境下请打开 Terminal (command+空格输入Terminal),在命令行输入以下命令安装我们所需要的依赖模块:

pip install pydubpip install librosa

看到 Successfully installed xxx 则说明安装成功。

2.频谱展示

使用librosa和matplot,我们可以用10行代码完整地展示整个频谱:

简单的音乐可视化_Python_05

import matplotlib.pyplot as pltimport librosa.display# 音乐文件载入audio_path = 'Fenn.mp3'music, sr = librosa.load(audio_path)# 宽高比为14:5的图plt.figure(figsize=(14, 5))librosa.display.waveplot(music, sr=sr)# 显示图plt.show()


不过,这样的频谱是整段音乐的,看起来非常难看,接下来我们使用 pydub 切割频谱,以获得更佳的效果。我们细分到0到1秒的区段来查看频谱:

简单的音乐可视化_Python_06

import matplotlib.pyplot as pltimport librosa.displayimport numpy as npfrom pydub import AudioSegment
# 1秒=1000毫秒SECOND = 1000# 音乐文件AUDIO_PATH = 'Fenn.mp3'
def split_music(begin, end, filepath):    # 导入音乐    song = AudioSegment.from_mp3(filepath)
   # 取begin秒到end秒间的片段    song = song[begin*SECOND: end*SECOND]
   # 存储为临时文件做备份    temp_path = 'backup/'+filepath    song.export(temp_path)
   return temp_path
music, sr = librosa.load(split_music(0, 1, AUDIO_PATH))
# 宽高比为14:5的图plt.figure(figsize=(14, 5))librosa.display.waveplot(music, sr=sr)plt.show()


这下细是细了,但是还是太复杂了,其实我们做频谱的展示,或许只需要正值即可:

简单的音乐可视化_Python_07


然后我们还可以进一步放大,比如说0.9秒到1秒之间的频谱:

简单的音乐可视化_Python_08

# 放大n0 = 9000n1 = 10000
music = np.array([mic for mic in music if mic > 0])plt.figure(figsize=(14, 5))plt.plot(music[n0:n1])plt.grid()
# 显示图plt.show()


这样好看许多,不过如果要达成QQ音乐那种效果,还是需要进行大量改造。

比如用精美的图像元素来填充替代、然后零值如何处理?如何让频谱更加平稳?此外,我们是静态的图像,还需要根据事件动态地延续波段(可以用matplotlib的Animation类进行动态展示)。实际APP中的代码肯定比我们这简易的代码更加复杂。这些有兴趣的读者可以自行研究啦。

作者:Ckend

来源:Python实用宝典