python自动录音

原创

mob649e815a6b81 2023-07-21 11:10:09 ©著作权

文章标签 Python 数据输入流 文章分类 Python 后端开发

©著作权归作者所有：来自51CTO博客作者mob649e815a6b81的原创作品，请联系作者获取转载授权，否则将追究法律责任

Python自动录音

在很多情况下，我们需要使用到录音功能。例如，录制语音备忘录、制作语音识别模型的训练数据等。Python提供了许多库和工具，使得自动录音变得非常简单。

录音的基本原理

录音的基本原理是使用麦克风采集声音信号，并将其保存为音频文件。麦克风采集的声音信号是模拟信号，需要经过模数转换器（ADC）转换为数字信号。在Python中，我们可以使用pyaudio库来访问麦克风并进行录音操作。

安装`pyaudio`

在开始录音之前，我们需要先安装pyaudio库。如果你使用的是pip包管理器，可以通过以下命令进行安装：

pip install pyaudio

如果你使用的是conda包管理器，可以通过以下命令进行安装：

conda install pyaudio

录音示例

下面是一个简单的Python程序，演示了如何使用pyaudio库进行录音：

import pyaudio
import wave

def record_audio(output_file, duration):
    CHUNK = 1024
    FORMAT = pyaudio.paInt16
    CHANNELS = 1
    RATE = 44100

    p = pyaudio.PyAudio()

    stream = p.open(format=FORMAT,
                    channels=CHANNELS,
                    rate=RATE,
                    input=True,
                    frames_per_buffer=CHUNK)

    frames = []

    print("Start recording...")

    for i in range(0, int(RATE / CHUNK * duration)):
        data = stream.read(CHUNK)
        frames.append(data)

    print("Recording finished.")

    stream.stop_stream()
    stream.close()

    p.terminate()

    wf = wave.open(output_file, 'wb')
    wf.setnchannels(CHANNELS)
    wf.setsampwidth(p.get_sample_size(FORMAT))
    wf.setframerate(RATE)
    wf.writeframes(b''.join(frames))
    wf.close()

# 使用示例
record_audio("output.wav", 5)  # 录制5秒钟的音频并保存为output.wav文件

在这个示例中，record_audio函数接受两个参数：output_file表示输出文件的路径，duration表示录音的时长（以秒为单位）。在函数内部，我们首先定义了一些常量，如CHUNK表示每次读取的音频数据大小，FORMAT表示采样位数，CHANNELS表示声道数，RATE表示采样率。

然后，我们创建了PyAudio对象，并调用open方法打开麦克风输入流。通过循环读取音频数据，并将其保存在frames列表中。最后，我们停止麦克风输入流，并将frames列表中的音频数据写入到输出文件中。