语音处理:常用术语及英文缩写整理

  • 专业术语
  • 基本
  • 通用
  • 带宽类
  • 音频音质类
  • 编解码
  • 领域
  • 音频
  • 技术
  • 开发
  • 其他
  • 待处理
  • 参考资料


专业术语


dmesg 清除消息_音频编码解码

基本


简称

全称

中文

解释

备注

PCM

Pulse Code Modulation

脉冲编码调制

根据采样频率得到不同时刻的信号幅值

裸流音频信号

通用


简称

全称

中文

解释

备注

TTS

Text To Speech

文本合成语音

将一段自然语言文本转化为语音形式,与声码器相关

CELP

Code Excited Linear Prediction

码激励线性预测

LPC

Linear Prediction Coefficient/Coding

线性预测编码器

SBC

Subband Coding

子带编码

断去划分频带,然后对结果进行量化、编码压缩

具体实现见QMF

TCX

Transform Coded eXcitation

变换码激励

TC

Transform Coding

变换域编码

从时域转到其他域编码对应信息,如FFT/MDCT/MELP

常见技术

  • ASR: Auto Speech Recognition,智能语音识别
  • AEC:Acoustic Echo Cancellation,声学回声消除
  • ANC:Active Noise Control,主动降噪

带宽类


简称

全称

中文

采样率

解释

备注

NB

Narrow Band

窄带

8kHz

(4 kHz audio bandwidth)

WB

Wide Band

宽带

16kHz

(8 kHz audio bandwidth)

人发声极限(通话够用)

SSWB

Semi Super Wide Band

半超宽带

24kHz

(12 kHz audio bandwidth)

SWB

Super Wide Band

超宽带

32kHz

(16 kHz audio bandwidth)

FB

Full Band

全带

48kHz

20 kHz audio bandwidth, sample rate greater than 44.1kHz;

音频信号频率可达20k,采样率不低于44.1k

人听觉极限(音乐够用)

音频音质类


简称

全称

中文

解释

备注

HQA

High Quality Audio

高清品质音乐

MP3格式的话是码率320kbps以上

SQA

Super Quality Audio

超清品质音乐

一般是无损

编解码


简称

全称

中文

解释

备注

TNS

Temporal Noise Shaping

时域噪声整形

根据LPC分析,将量化噪声对时域的影响进行整形

SNS

Spectral Noise Shaping

频域噪声整形/谱噪声整形

将量化噪声对频域的影响进行整形

QMF

Quadrature Mirror Filter

正交镜像滤波

将时域信号转成独立的各频带信号,属于SBC的一部分

AF

Analysis Filters

分析滤波器

时域转成不同带的频域信号,属于QMF的编码侧子操作

SF

Synthesis Filters

综合滤波器

恢复成时域信号,属于QMF的解码侧子操作

ABR

Adaptive Bit Rate

自适应码率

LTP

Long Time Prediction

长时预测

LTPF

Long Term Postfilter

长时后处理滤波器

检测低频基音,

LC3

PLC

Packet Loss Concealment

丢包补偿

主要在解码侧恢复

BFI

Bad Frame Indication

坏帧标识

提醒解码侧当前帧损坏,需补包或跳帧

BWE

Bandwidth Extension

带宽扩展

把包含有用信息的频带,扩展到其他频带,SBR是该思想的一种具体实现

SBR

Spectral Band Replication

频带复制

复制中低频谐波到高频,将高频包络作为边信息,解码用边信息减少音调成分

IGF

Intelligent Gap Filling

智能带宽填充

低频补高频,补充低码率时量化引起的高频带区域大量频谱空洞

NF

Noise Filling

噪声填充

随机填补噪声,让频谱更好看,不会影响音质

MS

M/S Coding Sum/Difference Coding

多声道联合编码

编码侧:M = (L + R) / 2 => 解码侧:L = M + S

编码侧:S = (L - R) / 2 => 解码侧:R = M - S

M代表middle,S代表side

  • MPEGH:Moving Picture Expert Group,音视频编解码专家工作组
  • TWS:True Wireless Stereo,真无线耳机
  • JSCC:Joint source-channel coding,联合声源编码
  • SBR:Spectral Band Replication,频段复制(注意与IGF技术相区分)
  • PS:Parametric Stereo, 参数立体声

心理声学模型缩略语

  • narrowband noise masking tone (NMT),
  • tone masking tone (TMT),
  • narrowband noise masking narrowband noise (NMN),
  • tone masking narrowband noise (TMN)

常见音频编解码器

  • LHDC,全称Low-Latency Hi-Definition Audio Codec,低延迟高解析音频编解码器。台湾盛威私有。
  • LDAC,全称至今是谜,猜测是 Low Delay Audio Codec?主打高清、无损、CD音质。日本SONY私有。
  • LC3,全称Low Complexity Communication Codec,低复杂度音频编解码器
  • AAC,全称Advanced Audio Codec,高级音频编解码器
  • MP3, 全称Moving Picture Expert Group Layer 3,暂无中文简称
  • AVS,Audio Video Coding Standard,音视频编码标准
  • AVS3,The Third Generation AVS, China Working Group
  • CUVA,中国超高清视频产业联盟,China Ultra High Definition Video Association,当前已升级注册成为世界超高清视频产业联盟(UWA 联盟)

语音评价指标

  • ODG:Objective Difference Grade,客观差异等级
  • MOS:Mean Opinion Score,即平均意见分数。它是一种用于衡量语音质量的评估方法,通常用于评估电话、网络电话、视频会议等通信系统的语音质量。MOS评分通常从1到5分,分数越高表示语音质量越好。
  • PEAQ:Perceptual Evaluation of Audio Quality,音频感知质量评估,它是一种用于评估音频质量的客观测量方法,旨在模拟人类听觉系统对音频质量的感知。PEAQ是国际标准化组织(ISO)和欧洲电信标准化协会(ETSI)共同制定的标准。

领域


音频领域你需要知道的100个关键词,整理如下。

音频

  • EQ,Equalizer,均衡器,特点:本质是个数字滤波器
  • SE/AE,Sound Effecs/ Audio Effects,音效
  • THD,Total Harmonic Distortion,总谐波失真,详解:link

技术

  • FOA,First Order Ambisonics,ambisonic, full-sphere surround sound format,默认是一阶的
  • HOA,Higher Order Ambisonics

开发

  • OOB: Out of bounds, 越界
  • DTS, Defect Tracking System,缺陷跟踪系统
  • DFX,Design for X,面向产品生命周期各/某环节的设计,现多指软件的插件,即软件周期的补充
  • ARM公司的套件
  • RVDS,RealView Development Suite,实时仿真开发套件,范围:RVDS > RVCT
  • RVCT,RealView Compilation Tools,实时仿真编译工具
  • NDK,Native Development Kit,安卓原生开发套件
  • SIMD,Simple Instruction Multiple Data,单一指令多数据运算
  • A2DP,Advanced Audio Distribution Profile,蓝牙音频传输模型协定

其他

  • MWC,Mobile World Congress,世界移动通信大会,特点:一年一度的通信行业大会,在西班牙巴塞罗那举行,俗称巴展

待处理


ALU  Arithmetic Logic Unit
BEC  Bit Error Condition
BW  Bandwidth

FIR  Finite Impulse Response
IIR  Infinite Impulse Response

IDCT  Inverse DCT
DCT  Discrete Cosine Transform
LD-MDCT  Low Delay Modified Discrete Cosine Transform
MDCT  Modified Discrete Cosine Transform
LFCB  Low Frequency Code Book (part of SNS VQ)

LSB  Least Significant Bit
MSB  Most Significant Bit

VQ  Vector Quantizer
HFCB  High Frequency Code Book (part of SNS VQ)
MPVQ  Modular Pyramid Vector Quantizer index (a partial PVQ index)
PVQ  Pyramid Vector Quantizer

PDU  Protocol Data Unit

参考资料


  1. LC3 _Specification_v1.0.pdf, Page149