音视频 | 音视频学习1

1.简单介绍一下你做过的项目

这里的话我主要简单介绍了公司的项目,然后我把每个知识点都讲解出来。这里大家根据自己的项目去介绍就行。

2.说一下播放器的设计过程

这里的话主要分以下几步完成:

音视频 | 音视频学习-01_数据

开启一个线程进行解封装操作 。读取音频、视频的压缩数据,并进行区分。若视频数据则插入视频队列,音频数据则插入音频队列。

再开启两个解码线程分别对音频、视频的压缩数据进行解码处理,比方说:视频解码线程主要从视频队列拿数据并进行解码。音频解码线程主要从音频压缩队列拿数据并进行音频解码,并进行音频时钟的计算。音频时钟的计算就是音频PTS的计算,而视频pts则跟音频pts进行校准,进行音视频的同步。

3.如何解决卡顿,花屏问题

花屏:

花屏的本质是数据包不完整,要保证视频不出现花屏就要保证整个视频不能出现丢包情况。下面有几种方式能够防止花屏:

3.1.高分辨率的情况下,若出现花屏则说明FFMPEG发送的数据超过了默认值,需要扩大接收端的缓冲区,防止丢包。在FFMPEG源码之中,找到udp.c并修改UDP_MAX_PKT_SIZE默认值。一般这个默认值扩大10倍,则播放器就基本上不会出现花屏。

音视频 | 音视频学习-01_数据_02

3.2.可能是YUV数据出错,在采集的时候要保证YUV准确无误

卡顿:
码率问题:
编码器输出码率超过实际网络带宽,此时网络可能突然变的很差,预估带宽很小,但其实解码出来的画面很复杂。而此时就会容易出现发送码率大于实际码率的情况。
解决方法:
最好使用CBR把码率严格控制起来,从而保证输出码率更好地贴合带宽。VBR的话输出码率会随着画面复杂程度,所以容易造成网络带宽的浪费

机器性能不够:
若机器本身性能不够,画面分辨率很高,若使用CPU处理则会导致耗时很严重。在这种情况下,则考虑用GPU进行前处理,并使用硬件进行编解码的工作加快处理速度。

4.对H264的结构有什么了解

H264一般分为VCL和NAL层。

VCL(Video Coding Layer)视频编码层:包括了压缩引擎和块、片语法的定义,并设计目标独立于网络高效编码,它的作用是有效表示视频数据的内容。

NAL(NetWork Abstraction Layer)网络提取层:它主要负责的是将VCL产生的比特字符串适配到各种各样的网络和多源环境中,覆盖了片级别的语法;通常一个NALU单元是由[NALU HEADER] + [NALU Payload]组成。NAL本质上是对VCL进行封装包裹。

音视频 | 音视频学习-01_音视频_03

StartCode(0x000001或0x00000001)作为起始码。
NALU就是H264的实际数据部分。NALU = NALU Header + EBSP组成;
EBSP = 防竞争码 + RBSP;
RBSP = SODB + RBSP尾部

我们来看看NALU HEADER和NALU Payload的结构:

4.1.NALU HEADER解析:

NALU Header一般分为两种流格式,一种是Annex-B格式,另外一种是RTP包流格式。
Annex-B格式是默认输出格式。数据单元的分割是通过[StartCode] (0x000001或0x00000001)作为起始码。

音视频 | 音视频学习-01_数据_04

F:禁止位,占1bit
forbidden_zero_bit:F禁止位,占用NALU Header的第一个位,值默认0,值为1表示错误。

R:指示位,占2bit
Nal_refreence_bit(2bits):NRI重要性指示位,占用NALU Header第二位、三位,用来表示NAL单元,取值越大,NAL越重要。

T:负荷数据类型,占5BIT
nal_unit_type(5bits):
Type类型,占用NALU Header第四到第八位,用来表示NAL单元类型,下面是具体的表格:

音视频 | 音视频学习-01_ffmpeg_05

4.2 NALU Payload:

NALU的主体涉及到几个重要的名词,分别为EBSP、RBSP和SODB。其中EBSP基本上是NALU主体,这三者的关系式EBSP包含RBSP,RBSP包含SODB。
4.2.SODB:String of Data Bits原始数据比特流,就是原始的编码/压缩得到的数据
4.3.RBSP:Raw Byte Sequence Payload,也称之为字节序列载荷
RBSP = SODB +RBSP Trailing Bits引入RBSP Trailing Bits做8位字节补齐
4.4.EBSP:Encapsulated Byte Sequence Payload 扩展字节序列载荷
下面这张图是SODB、RBSP、EBSP的结结构图

音视频 | 音视频学习-01_ffmpeg_06

另外一张图是整体的H264比特流框图:

音视频 | 音视频学习-01_ffmpeg_07