本文记录SDL播放音频的技术。在这里使用的版本是SDL2。实际上SDL本身并不提供视音频播放的功能,它只是封装了视音频播放的底层API。在Windows平台下,SDL封装了Direct3D这类的API用于播放视频;封装了DirectSound这类的API用于播放音频。因为SDL的编写目的就是简化视音频播放的开发难度,所以使用SDL播放视频(YUV/RGB)和音频(PCM)数据非常的容易。

最简单的视音频播放示例9:SDL2播放PCM_ide

SDL简介

SDL(Simple DirectMedia Layer)是一套开放源代码的跨平台多媒体开发库,使用C语言写成。SDL提供了数种控制图像、声音、输出入的函数,让开发者只要用相同或是相似的代码就可以开发出跨多个平台(Linux、Windows、Mac OS X等)的应用软件。目前SDL多用于开发游戏、模拟器、媒体播放器等多媒体应用领域。用下面这张图可以很明确地说明SDL的用途。


 最简单的视音频播放示例9:SDL2播放PCM_数据_02


SDL实际上并不限于视音频的播放,它将功能分成下列数个子系统(subsystem):

Video(图像):图像控制以及线程(thread)和事件管理(event)。

Audio(声音):声音控制

Joystick(摇杆):游戏摇杆控制

CD-ROM(光盘驱动器):光盘媒体控制

Window Management(视窗管理):与视窗程序设计集成

Event(事件驱动):处理事件驱动

在Windows下,SDL与DirectX的对应关系如下。



SDL



DirectX



SDL_Video、SDL_Image



DirectDraw、Direct3D



SDL_Audio、SDL_Mixer



DirectSound



SDL_Joystick、SDL_Base



DirectInput



SDL_Net



DirectPlay




注:上文内容在《使用SDL播放视频》的文章中已经介绍,这里再次重复贴一遍。

SDL播放音频的流程

SDL播放音频的流程狠简单,分为以下步骤。

1. 初始化

1) 初始化SDL。

2) 根据参数(SDL_AudioSpec)打开音频设备

2. 循环播放数据

1) 播放音频数据。

2) 延时等待播放完成。


下面详细分析一下上文流程。



1. 初始化

1) 初始化SDL。

使用SDL_Init()初始化SDL。该函数可以确定希望激活的子系统。SDL_Init()函数原型如下:




[cpp] ​​view plain​​​​copy​

 


  1. int SDLCALL SDL_Init(Uint32 flags)  


其中,flags可以取下列值:

SDL_INIT_TIMER:定时器SDL_INIT_AUDIO:音频SDL_INIT_VIDEO:视频SDL_INIT_JOYSTICK:摇杆SDL_INIT_HAPTIC:触摸屏SDL_INIT_GAMECONTROLLER:游戏控制器SDL_INIT_EVENTS:事件SDL_INIT_NOPARACHUTE:不捕获关键信号(这个不理解)SDL_INIT_EVERYTHING:包含上述所有选项

 

有关SDL_Init()有一点需要注意:初始化的时候尽量做到“够用就好”,而不要用SDL_INIT_EVERYTHING。因为有些情况下使用SDL_INIT_EVERYTHING会出现一些不可预知的问题。例如,在MFC应用程序中播放纯音频,如果初始化SDL的时候使用SDL_INIT_EVERYTHING,那么就会出现听不到声音的情况。后来发现,去掉了SDL_INIT_VIDEO之后,问题才得以解决。

2) 根据参数(SDL_AudioSpec)打开音频设备

使用SDL_OpenAudio()打开音频设备。该函数需要传入一个SDL_AudioSpec的结构体。DL_OpenAudio()的原型如下。




[cpp] ​​view plain​​​​copy​​​

 


  1. int SDLCALL SDL_OpenAudio(SDL_AudioSpec * desired,  
  2.                                           SDL_AudioSpec * obtained);  


它的参数是两个SDL_AudioSpec结构体,它们的含义:

desired:期望的参数。

obtained:实际音频设备的参数,一般情况下设置为NULL即可。



SDL_AudioSpec结构体的定义如下。




[cpp] ​​view plain​​​​copy​​​

 


  1. typedef struct SDL_AudioSpec  
  2. {  
  3.     int freq;                   /**< DSP frequency -- samples per second */  
  4.     SDL_AudioFormat format;     /**< Audio data format */  
  5.     Uint8 channels;             /**< Number of channels: 1 mono, 2 stereo */  
  6.     Uint8 silence;              /**< Audio buffer silence value (calculated) */  
  7.     Uint16 samples;             /**< Audio buffer size in samples (power of 2) */  
  8.     Uint16 padding;             /**< Necessary for some compile environments */  
  9.     Uint32 size;                /**< Audio buffer size in bytes (calculated) */  
  10.     SDL_AudioCallback callback;  
  11.     void *userdata;  
  12. } SDL_AudioSpec;  


其中包含了关于音频各种参数:

freq:音频数据的采样率。常用的有48000,44100等。

format:音频数据的格式。举例几种格式:

AUDIO_U16SYS:Unsigned 16-bit samples

AUDIO_S16SYS:Signed 16-bit samples

AUDIO_S32SYS:32-bit integer samples

AUDIO_F32SYS:32-bit floating point samples

channels:声道数。例如单声道取值为1,立体声取值为2。

silence:设置静音的值。

samples:音频缓冲区中的采样个数,要求必须是2的n次方。

padding:考虑到兼容性的一个参数。

size:音频缓冲区的大小,以字节为单位。

callback:填充音频缓冲区的回调函数。

userdata:用户自定义的数据。

在这里记录一下填充音频缓冲区的回调函数的作用。当音频设备需要更多数据的时候会调用该回调函数。回调函数的格式要求如下。




[cpp] ​​view plain​​​​copy​​​

 


  1. void (SDLCALL * SDL_AudioCallback) (void *userdata, Uint8 * stream,  
  2.                                             int len);  


回调函数的参数含义如下所示。

userdata:SDL_AudioSpec结构中的用户自定义数据,一般情况下可以不用。

stream:该指针指向需要填充的音频缓冲区。

len:音频缓冲区的大小(以字节为单位)。

在回调函数中可以使用SDL_MixAudio()完成混音等工作。众所周知SDL2和SDL1.x关于视频方面的API差别很大。但是SDL2和SDL1.x关于音频方面的API是一模一样的。唯独在回调函数中,SDL2有一个地方和SDL1.x不一样:SDL2中必须首先使用SDL_memset()将stream中的数据设置为0。



2. 循环播放数据
1) 播放音频数据。

使用SDL_PauseAudio()可以播放音频数据。SDL_PauseAudio()的原型如下。




[cpp] ​​view plain​​​​copy​​​

 


  1. void SDLCALL SDL_PauseAudio(int pause_on)  


当pause_on设置为0的时候即可开始播放音频数据。设置为1的时候,将会播放静音的值。


2) 延时等待播放完成。

这一步就是延时等待音频播放完毕了。使用像SDL_Delay()这样的延时函数即可。