最近需要对多个WAV文件进行拼接,这就涉及到WAV文件头的创建和修改更新。之前的方式是利用第一个WAV的文件头,在最后全部拼接完后再修改文件头中的文件长度及音频数据长度。这个长度如果不修改,最后拼接的文件虽然大小是各WAV文件大小之和,但播放的时候只播放第一段的WAV文件,因为WAV文件头中的大小就是第一段WAV的大小,播放器读取文件头会根据这个大小来显示时长和播放。
现在需求有变,第一段文件可能是静音空数据,这就导致第一段没有文件头,其实也可以从WAV文件中拷贝头44字节出来,但为搞清楚文件头各字节含义,以及便于统一程序控制(拼装各WAV文件,不用判断该WAV是否需要跳过44字节头)。看代码:
Android Audio Wav 文件读写操作的封装
/**
* @param sampleRate 采样率,如44100
* @param channels 通道数,如立体声为2
* @param bitsPerSample 采样精度,即每个采样所占数据位数,如16,表示每个采样16bit数据,即2个字节
* @param bytePerSecond 音频数据传送速率, 单位是字节。其值为采样率×每次采样大小。播放软件利用此值可以估计缓冲区的大小。
* bytePerSecond = sampleRate * (bitsPerSample / 8) * channels
* @param fileLenIncludeHeader wav文件总数据大小,包括44字节wave文件头大小
* @return wavHeader
*/
private byte[] getWaveFileHeader(int sampleRate, int channels, int bitsPerSample,
int bytePerSecond, long fileLenIncludeHeader) {
byte[] wavHeader = new byte[44];
long totalDataLen = fileLenIncludeHeader - 8;
long audioDataLen = totalDataLen - 36;
//ckid:4字节 RIFF 标志,大写
wavHeader[0] = 'R';
wavHeader[1] = 'I';
wavHeader[2] = 'F';
wavHeader[3] = 'F';
//cksize:4字节文件长度,这个长度不包括"RIFF"标志(4字节)和文件长度本身所占字节(4字节),即该长度等于整个文件长度 - 8
wavHeader[4] = (byte)(totalDataLen & 0xff);
wavHeader[5] = (byte)((totalDataLen >> 8) & 0xff);
wavHeader[6] = (byte)((totalDataLen >> 16) & 0xff);
wavHeader[7] = (byte)((totalDataLen >> 24) & 0xff);
//fcc type:4字节 "WAVE" 类型块标识, 大写
wavHeader[8] = 'W';
wavHeader[9] = 'A';
wavHeader[10] = 'V';
wavHeader[11] = 'E';
//ckid:4字节 表示"fmt" chunk的开始,此块中包括文件内部格式信息,小写, 最后一个字符是空格
wavHeader[12] = 'f';
wavHeader[13] = 'm';
wavHeader[14] = 't';
wavHeader[15] = ' ';
//cksize:4字节,文件内部格式信息数据的大小,过滤字节(一般为00000010H)
wavHeader[16] = 0x10;
wavHeader[17] = 0;
wavHeader[18] = 0;
wavHeader[19] = 0;
//FormatTag:2字节,音频数据的编码方式,1:表示是PCM 编码
wavHeader[20] = 1;
wavHeader[21] = 0;
//Channels:2字节,声道数,单声道为1,双声道为2
wavHeader[22] = (byte) channels;
wavHeader[23] = 0;
//SamplesPerSec:4字节,采样率,如44100
wavHeader[24] = (byte)(sampleRate & 0xff);
wavHeader[25] = (byte)((sampleRate >> 8) & 0xff);
wavHeader[26] = (byte)((sampleRate >> 16) & 0xff);
wavHeader[27] = (byte)((sampleRate >> 24) & 0xff);
//BytesPerSec:4字节,音频数据传送速率, 单位是字节。其值为采样率×每次采样大小。播放软件利用此值可以估计缓冲区的大小;
//bytePerSecond = sampleRate * (bitsPerSample / 8) * channels
wavHeader[28] = (byte)(bytePerSecond & 0xff);
wavHeader[29] = (byte)((bytePerSecond >> 8) & 0xff);
wavHeader[30] = (byte)((bytePerSecond >> 16) & 0xff);
wavHeader[31] = (byte)((bytePerSecond >> 24) & 0xff);
//BlockAlign:2字节,每次采样的大小 = 采样精度*声道数/8(单位是字节); 这也是字节对齐的最小单位, 譬如 16bit 立体声在这里的值是 4 字节。
//播放软件需要一次处理多个该值大小的字节数据,以便将其值用于缓冲区的调整
wavHeader[32] = (byte)(bitsPerSample * channels / 8);
wavHeader[33] = 0;
//BitsPerSample:2字节,每个声道的采样精度; 譬如 16bit 在这里的值就是16。如果有多个声道,则每个声道的采样精度大小都一样的;
wavHeader[34] = (byte) bitsPerSample;
wavHeader[35] = 0;
//ckid:4字节,数据标志符(data),表示 "data" chunk的开始。此块中包含音频数据,小写;
wavHeader[36] = 'd';
wavHeader[37] = 'a';
wavHeader[38] = 't';
wavHeader[39] = 'a';
//cksize:音频数据的长度,4字节,audioDataLen = totalDataLen - 36 = fileLenIncludeHeader - 44
wavHeader[40] = (byte)(audioDataLen & 0xff);
wavHeader[41] = (byte)((audioDataLen >> 8) & 0xff);
wavHeader[42] = (byte)((audioDataLen >> 16) & 0xff);
wavHeader[43] = (byte)((audioDataLen >> 24) & 0xff);
return wavHeader;
}
修改文件头中的文件长度及音频PCM数据长度:
/**
* 更新wav文件头
*
* @param totalFileLen 包含44字节wav头及所有PCM数据总和
*/
private void updateWavFileHeader(String finalVoiceFilePath, long totalFileLen) {
Log.e(TAG, "updateWavFileHeader()--->>totalFileLen = " + totalFileLen);
try {
RandomAccessFile randomAccessFile = new RandomAccessFile(finalVoiceFilePath, "rw");
//更新wav文件头04H— 08H的数据长度:该长度 = 文件总长 - 8
randomAccessFile.seek(4);
randomAccessFile.write(long2bytes(totalFileLen - 8));
//更新wav文件头28H— 2CH,实际PCM采样数据长度
randomAccessFile.seek(40);
randomAccessFile.write(long2bytes(totalFileLen - 44));
} catch (FileNotFoundException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
}