文章目录
- :rose: python 如何提取视频/音频中的文字
- :four_leaf_clover: 讯飞认证
- :four_leaf_clover: 视频转换为音频
- :four_leaf_clover: 利用讯飞接口提取音频文字
- :four_leaf_clover:文字保存到本地
🌹 python 如何提取视频/音频中的文字
最近在观看学习视频,做笔记时遇到一个痛点,需要反复一段一段的去看视频,再手敲整理笔记 😠 。想着有没有可以免费的转换工具或者软件,就去网上搜了一下,发现大多数软件都会限定视频时长,超出收费。
本意白嫖,收费就太见外了。几经周转,了解到讯飞语音有语音解析的功能,在 讯飞开发平台中找到了语音转文字的接口,关键免费。
梳理一下需求:
- 讯飞认证
- 视频转换为音频
- 利用讯飞接口提取音频文字
- 结果保存到本地
🍀 讯飞认证
- 注册用户
进入 讯飞开发平台主页,注册登录后。点击语音转写。
- 领取时长
领取免费时长,期限一年(企业50小时、个人5小时)
5小时不够用的话可换个账号。
- 创建应用
创建应用后会得到APPID和密钥
该 id 和密钥在接口代码中需要使用
- 了解API使用
- 新版本API文档(本次使用)
- 老版本API文档
准备就绪…
🍀 视频转换为音频
采用python中moviepy.editor包中的AudioFileClip类,将视频文件转换为音频文件。
from moviepy.editor import AudioFileClip
dataMovieMp4 = AudioFileClip(r"*****.mp4")
dataMovieMp4.write_audiofile(r"*****.mp3")
🍀 利用讯飞接口提取音频文字
- 下载接口 demo 代码
语音转写(新版) demo java语言语音转写(新版) demo python语言 (本次采用)
- 替换代码中的 APPID、密钥
api = RequestApi(appid="xxxxx", secret_key="xxx", upload_file_path=r"xxxxx.mp3")
- 自定义结果解析
# 自定义解析函数
data_str = api.analysis_json_lattice2(data_voice_to_str_result)
🍀文字保存到本地
- 存到本地txt
# 数据存储到本地
with open(r"xxxxx\CDP.txt", 'w') as f:
f.write(data_str)