python 读取蓝牙麦克风 python调用麦克风

转载

编程小达 2023-08-24 10:41:33

文章标签 python 读取蓝牙麦克风 wav Python python 文本输出 文章分类 Python 后端开发

**事出有因：**我想调用科大讯飞的语音听写SDK包，但是这个包对输入音频有一定的要求，格式工厂毕竟不是个办法——网上找来找去，有用信息也是零零散散，所幸还是有所收获——请将以下代码写入get_audio.py文件中。
特别说明在代码后，看了还是有用的
特别说明在代码后，看了还是有用的

# -*- coding：utf-8 -*-
# -*- author：zzZ_CMing  CSDN address:
# -*- 2018/07/12; 15:19
# -*- python3.5
import pyaudio
import wave
input_filename = "input.wav"               # 麦克风采集的语音输入
input_filepath = "音频存储位置"              # 输入文件的path
in_path = input_filepath + input_filename

def get_audio(filepath):
    aa = str(input("是否开始录音？   （是/否）"))
    if aa == str("是") :
        CHUNK = 256
        FORMAT = pyaudio.paInt16
        CHANNELS = 1                # 声道数
        RATE = 11025                # 采样率
        RECORD_SECONDS = 5
        WAVE_OUTPUT_FILENAME = filepath
        p = pyaudio.PyAudio()

        stream = p.open(format=FORMAT,
                        channels=CHANNELS,
                        rate=RATE,
                        input=True,
                        frames_per_buffer=CHUNK)

        print("*"*10, "开始录音：请在5秒内输入语音")
        frames = []
        for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)):
            data = stream.read(CHUNK)
            frames.append(data)
        print("*"*10, "录音结束\n")

        stream.stop_stream()
        stream.close()
        p.terminate()

        wf = wave.open(WAVE_OUTPUT_FILENAME, 'wb')
        wf.setnchannels(CHANNELS)
        wf.setsampwidth(p.get_sample_size(FORMAT))
        wf.setframerate(RATE)
        wf.writeframes(b''.join(frames))
        wf.close()
    elif aa == str("否"):
        exit()
    else:
        print("无效输入，请重新选择")
        get_audio(in_path)

# 联合上一篇博客代码使用，就注释掉下面，单独使用就不注释
get_audio(in_path)

特别说明：
一、这是一个可循环采样的脚本，介于输出文件名都是input.wav，所以在你保存音频的path下永远只生成一个音频文件(后一个会覆盖前一个)，你可以自己改成不循环的——但是循环的脚本用处更大，比如说做人机对话不能说一句就挂了吧，哈哈哈

二、调用的时候，也要先在你的python主程序开始处导入这个.py文件。怎么导入！！！上一篇也说了你没学会？—— 就像你导入其他外置包一样——from get_audio import get_audio；

三、你可以结合我上一篇博客Python调用科大讯飞语音听写的SDK包，把这两个代码联合使用，怎么联合使用：

注释掉本篇博客最后一行；
将两篇博客中的录音文件地址(本篇path是in_path，上一篇path是filepath)指向同一个目录下的同一个文件，两个的作用分别是：本篇博客代码用来采集音频，将音频存入path中，上篇博客代码通过path调用该音频，转为文本输出；
主函数大致代码如下：

# 采集音频
get_audio(in_path)
sys.stdout.write("you ask>> ")

# 科大语音听写：语音转文本输出   请参考上一篇博客
input_seqs = keda_API.XF_text(in_path, audio_rate)

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：Java final 和const 区别 java里的final是什么意思

下一篇：mysql 优化 json 类型 mysql json操作

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

python 读取蓝牙麦克风 python调用麦克风

python 读取蓝牙麦克风 python调用麦克风

51CTO博客