linux系统安装Paraformer语音识别 linux 语音助手

转载

网猴儿 2024-06-24 21:16:06

文章标签 ai 人工智能语音识别 python bash 文章分类 NLP 人工智能

写在前面

本文关注于使用层面，主要分享如何快速上手自建自己的语音识别服务，而不会关注更底层的原理层面，如有需要，后续再写专文研究。

什么是语音识别

语音识别，通常称为自动语音识别（AutomaticSpeechRecognition，ASR），主要是将人类语音中的词汇内容转换为计算机可读的输入，一般都是可以理解的文本内容，也有可能是二进制编码或者字符序列。但是，我们一般理解的语音识别其实都是狭义的语音转文字的过程，简称语音转文本识别（Speech-To-Text,STT）更合适，这样就能与语音合成（Text-To-Speech,TTS）对应起来。简单来说，就是将语音转变为可读的文字。

linux系统安装Paraformer语音识别 linux 语音助手_ai

模型测试

测试环境

Linux (ubuntu 20.04)

Standard D4s v3 (4 vcpus, 16 GiB memory)

linux系统安装Paraformer语音识别 linux 语音助手_人工智能_02

模型：阿里达摩院ModelScope

linux系统安装Paraformer语音识别 linux 语音助手_python_03

环境安装

安装后，可快速使用阿里云达摩院其他模型

第一步：安装Anaconda

Anaconda是一个开源的 Python 发行版本，用来管理管理不同的包，切换不同的环境

下载anaconda.sh

curl --output anaconda.sh https://repo.anaconda.com/archive/Anaconda3-2022.05-Linux-x86_64.sh

安装anaconda.sh

bash anaconda.sh

遇见如下信息按Enter继续

bash anaconda.sh
Welcome to Anaconda3 2022.05
In order to continue the installation process, please review the license
agreement.
Please, press ENTER to continue
>>>

阅读完协议并同意

linux系统安装Paraformer语音识别 linux 语音助手_ai_04

linux系统安装Paraformer语音识别 linux 语音助手_人工智能_05

确认安装位置，并按Enter继续

linux系统安装Paraformer语音识别 linux 语音助手_bash_06

等待几分钟后将看到以下信息，输入yes并按Enter继续

linux系统安装Paraformer语音识别 linux 语音助手_语音识别_07

出现如下信息代表安装完成

linux系统安装Paraformer语音识别 linux 语音助手_bash_08

注意：关闭当前命令行，并重新打开，刚刚安装和初始化Anaconda设置才可以生效。

重连后看到用户名前出现（base）即算成功

linux系统安装Paraformer语音识别 linux 语音助手_python_09

第二步：执行如下命令为modelscope library创建对应的python环境

conda create -n modelscope python=3.7
conda activate modelscope

linux系统安装Paraformer语音识别 linux 语音助手_人工智能_10

linux系统安装Paraformer语音识别 linux 语音助手_python_11

出现下图即为安装成功

linux系统安装Paraformer语音识别 linux 语音助手_bash_12

第三步：安装Tensorflow

# 仅支持 CPU 的版本
pip install --upgrade tensorflow==1.15 -i https://pypi.tuna.tsinghua.edu.cn/simple

出现下图即为安装成功

linux系统安装Paraformer语音识别 linux 语音助手_人工智能_13

语音模型安装

模型文件：Paraformer语音识别-中文-通用-16k-离线-large-pytorch
其他模型可自行在modelscope选择：ModelScope 魔搭社区

第一步：安装 PyTorch

这是一个开源的 Python 机器学习库，基于 Torch，用于自然语言处理等应用程序。

pip install torch torchvision torchaudio -i https://pypi.tuna.tsinghua.edu.cn/simple

linux系统安装Paraformer语音识别 linux 语音助手_bash_14

第二步：下载并安装ModelScope library

pip install setuptools-scm  -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install modelscope -i https://pypi.tuna.tsinghua.edu.cn/simple

pip install "modelscope[audio]" -f https://modelscope.oss-cn-beijing.aliyuncs.com/releases/repo.html -i https://pypi.tuna.tsinghua.edu.cn/simple

linux系统安装Paraformer语音识别 linux 语音助手_bash_15

linux系统安装Paraformer语音识别 linux 语音助手_人工智能_16

出现如下信息即算安装成功，有部分异常无需关心

linux系统安装Paraformer语音识别 linux 语音助手_ai_17

注意：当前大部分语音模型需要在Linux环境上使用，并且推荐使用python3.7 + tensorflow 1.x的组合。

第三步：验证

创建test.py文件并执行命令python test.py

from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks

p = pipeline('auto-speech-recognition', 'damo/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-pytorch')
result = p('https://isv-data.oss-cn-hangzhou.aliyuncs.com/ics/MaaS/ASR/test_audio/asr_example_zh.wav',)
print(result)

出现ModuleNotFoundError: AutomaticSpeechRecognitionPipeline: No module named 'funasr’异常可使用如下方式解决

git clone https://github.com/alibaba/FunASR.git && cd FunASR
pip install -e ./

获取推理结果

linux系统安装Paraformer语音识别 linux 语音助手_语音识别_18

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：python在一个文件中调用另一个文件进行运算 python调用另一个py文件的类

下一篇：redission锁需要主动设置过期时间么 redis实现锁机制的方式

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯