【数字人直播间】打造本地环境开源数字人直播间需要什么步骤？

原创

爱学2学习 2024-07-05 11:25:45 ©著作权

文章标签 python AIGC ai 人工智能自然语言处理 文章分类 Python 后端开发

©著作权归作者所有：来自51CTO博客作者爱学2学习的原创作品，请联系作者获取转载授权，否则将追究法律责任

文章目录

概要

整体架构流程

技术细节

1. Luna AI 内置直播弹幕工具能对主流直播平台弹幕抓取，并且包含了文字转语音的接口。如要其他文字转语音的接口在页面上方导航配置想用的接口（未启动语言大模型，这里复读机作为演示）：

2.SadTalker上篇文章已经提到如何安装使用，这篇文章就配置上去以便使用，Luna AI界面上方导航虚拟身体配置想要用的接口，数字人播放器选项也在其中配置：

3.数字人播放器在Luna AI已经配置好了，启动服务还需要安装一下：

4. Luna AI通用配置，配置上目前用的模型，打开直播间页面就可以连接了：

小结

概要

数字人直播间来源可以是通过摄像头拍摄现场直播，也可以是预先录制好的视频进行直播。技术实现方面，可以利用直播平台的技术设施，如云服务器、流媒体服务器等，通过网络传输视频数据，实现直播功能。

数字人直播间可以实现各种内容，例如演唱会、体育赛事、游戏直播、教育课程等等。通过直播平台的互动功能，观众可以与主播进行实时互动交流，如发送弹幕、点赞、送礼物等。数字人直播间也可以提供一键预定、购买商品等商业化功能，为主播提供收入来源。

整体架构流程

我这里使用 edge-tts+SadTalker+数字人播放器+直播间弹幕工具，obs、直播姬等推流构成实时的数字人直播间。

edge-tts：提供文字转语音API
SadTalker：提供照片转视频API
数字人播放器：实时显示出来
弹幕工具：抓取直播弹幕

技术细节

1. Luna AI 内置直播弹幕工具能对主流直播平台弹幕抓取，并且包含了文字转语音的接口。如要其他文字转语音的接口在页面上方导航配置想用的接口（未启动语言大模型，这里复读机作为演示）：

【数字人直播间】打造本地环境开源数字人直播间需要什么步骤？_人工智能

2.SadTalker上篇文章已经提到如何安装使用，这篇文章就配置上去以便使用，Luna AI界面上方导航虚拟身体配置想要用的接口，数字人播放器选项也在其中配置：

3.数字人播放器在Luna AI已经配置好了，启动服务还需要安装一下：

# 安装
git clone https://github.com/Ikaros-521/digital_human_video_player.git

cd digital_human_video_player

pip install -r requirements.txt

# 启动
1.双击bat文件启动

2.python api_server.py

鼠标右键，选择画中画），播放没问题就可以了：

【数字人直播间】打造本地环境开源数字人直播间需要什么步骤？_自然语言处理_02

4. Luna AI通用配置，配置上目前用的模型，打开直播间页面就可以连接了：

注意通用配置下弹幕过滤，否则任意弹幕都会触发：

【数字人直播间】打造本地环境开源数字人直播间需要什么步骤？_AIGC_03

如了解不详可以参考视频：

AI Vtuber + SadTalker搭建直播间

【数字人直播间】打造本地环境开源数字人直播间需要什么步骤？_AIGC_04

小结

这个组合使用了一系列技术来实现数字人直播间。首先，通过edge-tts技术，可以将文本转换为语音，为数字人提供发声能力。然后，SadTalker技术可以为数字人提供自然语言处理和对话生成的能力，使得数字人可以与观众进行交互。接下来，使用数字人播放器可以将数字人的声音和视频进行同步播放，提供更加真实的直播体验。最后，弹幕工具可以让观众在直播间中发送弹幕，与数字人进行互动。这个组合让数字人直播间能够实现多样化的内容，包括语音互动、演讲、教学等。它为数字人直播提供了丰富的功能和互动方式，带来了更好的用户体验。