python 录音输入 python录音代码

转载

mob6454cc6f4a4e 2023-08-05 13:39:52

文章标签 python 录音输入音频流读取数据输入流 文章分类 Python 后端开发

用python 读取并写入音频：

import scipy.io.wavfile as wav
filepath = "sound/origin.wav"
filepath_write =  "sound/generate.wav"
rate, data = wav.read(filepath)
wav.write(filepath_write, rate, data)

用 python 录音、播放语音：

record_test.py:

# coding=utf-8
import  pyaudio
import  wavio
import  wave

def type_audio():
    # 语音文件 shape、rate
    wav_s=wavio.read("./data/test/D4_750.wav")     # 16000Hz
    print(wav_s)    # Wav(data.shape=(154000, 1), data.dtype=int16, rate=16000, sampwidth=2)

def record_audio():
    # 录音
    CHUNK = 1024
    FORMAT = pyaudio.paInt16
    CHANNELS = 2    # 通道数
    RATE = 16000
    RECORD_SECONDS = 5   # 录音时间
    WAVE_OUTPUT_FILENAME = "record.wav"

    p = pyaudio.PyAudio()
    stream = p.open(format=FORMAT, channels=CHANNELS,
                    rate=RATE, input=True,
                    frames_per_buffer=CHUNK)
    print("* recording")

    frames = []
    for i in range(0, int(RATE/CHUNK*RECORD_SECONDS)):
        data = stream.read(CHUNK)
        frames.append(data)

    print("* done recording")

    stream.stop_stream()
    stream.close()
    p.terminate()

    wf = wave.open(WAVE_OUTPUT_FILENAME, 'wb')
    wf.setnchannels(CHANNELS)
    wf.setsampwidth(p.get_sample_size(FORMAT))
    wf.setframerate(RATE)
    wf.writeframes(b''.join(frames))
    wf.close()

def play_audio():
    # 播放语音
    #定义数据流块
    CHUNK = 1024
    #只读方式打开WAV文件
    wf = wave.open(r"./record.wav",'rb')
    p = pyaudio.PyAudio()

    #打开数据流
    stream = p.open(format=p.get_format_from_width(wf.getsampwidth()),
                    channels=wf.getnchannels(), rate=wf.getframerate(),
                    output=True)
    #读取数据流
    data = wf.readframes(CHUNK)
    # print(len(data))    #4096

    #播放
    print("播放语音：")
    #while data != '':
    while data != b'':
    # while len(data) != 0:
        stream.write(data)               #从wf中读数据，然后写到stream中,就是从文件中读取数据然后写到声卡里.
        data = wf.readframes(CHUNK)      #从音频流中读取CHUNK个采样数据
        #print(data)                     #查看语音数据
        #print(len(data))

    # 停止数据流
    stream.stop_stream()
    stream.close()
    #关闭 Pyaudio
    p.terminate()

    print("done play")

if __name__=="__main__":
    record_audio()
    play_audio()
    type_audio()

record.py:

# coding=utf-8
# 
# 
# 
# PyAudio：使用这个可以进行录音、播放、生成wav文件等等

# 查看语音文件的shape、rate等
import  wavio
import os
## wav_s=wave.open("./data/test/D4_750.wav")      # 不好
wav_s=wavio.read("./data/test/D4_750.wav")     # 16000Hz
print(wav_s)    # Wav(data.shape=(154000, 1), data.dtype=int16, rate=16000, sampwidth=2)
# os.system("pause")

# 一，录音
import pyaudio, wave

CHUNK = 1024
FORMAT = pyaudio.paInt16
CHANNELS = 2
RATE = 16000
RECORD_SECONDS = 5
WAVE_OUTPUT_FILENAME = "record.wav"

p = pyaudio.PyAudio()
stream = p.open(format=FORMAT, channels=CHANNELS,
                rate=RATE, input=True,
                frames_per_buffer=CHUNK)
print("* recording")

frames = []
for i in range(0, int(RATE/CHUNK*RECORD_SECONDS)):
    data = stream.read(CHUNK)
    frames.append(data)

print("* done recording")

stream.stop_stream()
stream.close()
p.terminate()

wf = wave.open(WAVE_OUTPUT_FILENAME, 'wb')
wf.setnchannels(CHANNELS)
wf.setsampwidth(p.get_sample_size(FORMAT))
wf.setframerate(RATE)
wf.writeframes(b''.join(frames))
wf.close()


# 二，播放声音
import pyaudio
import  wavio,wave
# import  sys

#定义数据流块
CHUNK = 1024
#只读方式打开WAV文件
wf = wave.open(r"./record.wav",'rb')
p = pyaudio.PyAudio()

#打开数据流
stream = p.open(format=p.get_format_from_width(wf.getsampwidth()),
                channels=wf.getnchannels(), rate=wf.getframerate(),
                output=True)
#读取数据流
data = wf.readframes(CHUNK)

#播放
print("播放语音：")
while data != '':
    stream.write(data)               #从wf中读数据，然后写到stream中,就是从文件中读取数据然后写到声卡里.
    data = wf.readframes(CHUNK)      #从音频流中读取CHUNK个采样数据

# 停止数据流
stream.stop_stream()
stream.close()
#关闭 Pyaudio
p.terminate()


# 
# 三.解析
# 通过wave模块从音频文件中读取数据，返回wave类。然后把读取的str数据通过pyaduio模块写到声卡里。
# 1. wave模块
# wf =wave.open(filenanme, mode’)此处读取音频文件，返回instance对象类
# 对wave类操作如下：
# wf.setnchannels(1) 设置音频文件的声道数，用在写音频流时
# wf.setsampwidth(2) 设置音频文件每个采样值得保存位数，用在写音频流时
# wf.setframerate(8000)设置采样率，用在写音频流时
# wf.getnchannels() 获得音频文件的声道数，用在读音频流时
# wf.getsampwidth() 获得音频文件每个采样值得保存位数，用在读音频流时
# wf.getframerate()获得采样率，用在读音频流时
# 2. pyaudio模块
# 通过p = pyaudio.PyAudio()返回pyaudio类instance，通过此类可以操作声音输出输入
# PyAudio类的open函数有许多参数：
# rate - 取样频率
# channels - 声道数
# format - 取样值的量化格式 (paFloat32, paInt32, paInt24, paInt16, paInt8 …)。在上面的例子中，使用 get_format_from_width方法将wf.sampwidth()的返回值2转换为paInt16
# input - 输入流标志，如果为True的话则开启输入流
# output - 输出流标志，如果为True的话则开启输出流
# input_device_index - 输入流所使用的设备的编号，如果不指定的话，则使用系统的缺省设备
# output_device_index - 输出流所使用的设备的编号，如果不指定的话，则使用系统的缺省设备
# frames_per_buffer - 底层的缓存的块的大小，底层的缓存由N个同样大小的块组成
# start - 指定是否立即开启输入输出流，缺省值为True

python 录音输入 python录音代码_读取数据