最近的任务是做ogg的demux,一直在研究ogg格式,积累了一些资料和知识,在这里做一记录。

ogg是一种多媒体容器,可以包含很多种音视频格式,他是xiph提供的免费开源的音视频格式,官网可以看看http://www.xiph.org/

        大家可能所见的.ogg的文件大都ogg的vorbis音频格式,是一种效果和MP3相媲美的音频,我最初接触ogg的时候,以为是纯音频,看过官网的介绍发现他是一个很强大的容器结构,xiph提供的免费的视频Theora和音频vorbis都是开源免费的,都包含在ogg的容器中,此外ogg也能包含很多其他音视频,如:flac,MP3等,大家可以看看我官网链接,便豁然开朗。

<一>ogg的标准容器格式

       ogg是以页(page)为单位将逻辑流组织链接起来,每个页都有pageheader和pagedata。页头中有如下的定义:

O'   0x67  'g'   0x67  'g'  0x53 'S',4个字节大小,它标识着一个页的开始。

1个字节。

1个字节,

              0x01:本页媒体编码数据与前一页属于同一个逻辑流的同一个packet,若此位没有设,表示本页是以一个新的packet开始的;

bos标识,如果此位未设置,那表示不是第一页;

eos标识,如果此位未设置,那表示本页不是最后一页。

8个字节,对于音频流来说,它存储着到本页为止逻辑流在PCM输出中采样码的数目,可以由它来算得时间戳。对于视频流来说,它存储着到本页为止视频帧编码的数目。若此值为-1,那表示截止到本页,逻辑流的packet未结束。(小端)

4个字节,它是区分本页所属逻辑流与其他逻辑流的序号,我们可以通过这个值来划分流。(小端)

4个字节。

4个字节,用来效验每页的有效性。

1个字节。

0~255。

          由segment可以得到packet的值,每个packet的大小是以最后一个不等于255的segment结束的,从页头中的segment_table可以得到每个packet长度,举例:如果一组segment依次顺序为FF 45 FF FFFF 40 FF 5 FF FF FF 66,那么第一个packet的长度为255+69 = 324,第二个packet大小829,同理。

        页头基本上就是由上述的参数组成,由此我们可以得到页头的长度和整个页的长度:

header_size  = 27+number_page_segments

page_size = header_size +segment_table中每个segment的大小;