音频编解码器是现代媒体系统的基础核心之一。没有音频编解码器,就不会有现在的数字广播、流媒体服务及音乐发行。首个同时也仍是最主流的MPEG音频编解码器是于1998年面市的mp3。此后,Fraunhofer IIS和其他ISO-MPEG成员参与者开发并制定了多个音频编解码器。 每个MPEG音频编解码器已经或将会改变我们消费媒体的方式。本文介绍了MPEG音频编解码器及其应用,并展现现代音频编码方案最成功的创建者Fraunhofer IIS。
MPEG L3: mp3
mp3彻底改变了音乐产业,也改变了消费者购买和享受音乐的方式。mp3目前仍然是音乐发行的主要格式,因为mp3文件可以在任何设备上随时随地播放。mp3技术于上世纪80年代末开始开发,1995年,随着以 “.mp3”为后缀的文件的诞生,该技术达到了顶峰。同年,Fraunhofer IIS推出了第一个mp3播放器的硬件原型。该文件后缀mp3很快成为 “MPEG Layer 3”标准名称的替称,但是直到三年后,即1998年,第一款mp3播放器才投放市场。
mp3是一种感知型音频编解码器,这类编解码器基于人类听觉系统的感知模型。这些模型描述了人耳能够感知以及无法感知的音频信号元素,无论听众的耳朵是否经受过训练。通过分析音频信号,mp3和其他感知型音频编解码器确认了以上事实,即音质各指标可按人耳的感知优先排序,并在最终音频文件中精细的表现出来。因此,如果比特率(即至少192 kbps)选择得当,听众则无法辨别mp3文件与源文件之间的差别。
不仅mp3基于感知模型,目前大部分的MPEG系列的音频编解码器也能够明智的利用人类听觉系统,来降低数据速率和文件大小。AAC系列的音频编解码器也不例外。
AAC系列
AAC-LC
在市场大规模采用mp3之前,MPEG就已开发另一款音频编解码器。目的是在显著降低数据速率的同时实现与mp3同样高品质的音频质量。自此,开启了研发序幕,从1994年的AAC ,至2012年的扩展型HE-AAC。整个编解码器系列序幕。
1994年,根据MPEG-2格式制定了首款新型AAC编解码器,命名为高级音频编码(Advanced Audio Coding,AAC)。根据mp3和其他编解码器专利的开发经验,AT&T、Dolby、Fraunhofer IIS以及Sony等主要参与者从头开始设计一款最先进的新型音频编解码器。通过增加感知噪声建模(Perceptual Noise Shaping,PNS)、频带复制(Spectral Band ReplicaTIon,SBR),以及参数立体声编码(Parametric Stereo,PS)等工具,将MPEG-2 AAC编解码器扩展至MPEG-4标准。
基本的MPEG-4 AAC配置被称为AAC-LC(低复杂性)的配置。它能提供“水晶般”的音频质量。在音频编码域中,“水晶般”音频的编码信号虽然在数学上与源文件有差异,但即便是拥有“金耳朵”的听力专家也无法辨别其与源文件的区别。因此,AAC-LC可以满足广播公司最高的音频质量要求。立体声AAC-LC比特率通常为128-192 kbps,5.1多声道AAC-LC比特率为320 kbps,两种AAC均以立声道进行编码。AAC-LC是目前最灵活的音频编解码器之一,采样率从8 kHz到192 kHz,每声道的比特率高达256 kbps,并支持48声道。该配置最著名的应用就是Apple iTunes,并已用于日本ISDB数字电视标准。
图1: MPEG AAC音频编解码器系列概览
HE-AAC 和 HE-AACv2
MPEG-4“高效配置(High Efficiency Profile, HE-AAC)”结合了MPEG-4 AAC-LC和参量频谱复制(Spectral Band ReplicaTIon,SBR)工具,从而可以进一步降低总比特率,同时保持出色的音频质量。当立体声信号的比特率低于128 kbps时,HE-AAC与同音频质量的AAC-LC相比,比特率降低了30%。对于HE-AAC,低音频频谱使用AAC-LC进行编码,高频谱通过SBR工具编码。频谱复制是一种参数方法,可使用该频谱的高低重新创建该信号的整个音频频谱。为了进一步降低比特率,AAC-LC编码使用总信号50%的采样进行低频率编码。HE-AAC立体声所用的典型数据速率为48-64kbps,HE-AAC 5.1多声道的典型数据速率为160 kbps。同AAC-LC一样,HE-AAC支持8至 192kHz的采样率、高达48个声道以及音频特定的元数据。
图2: HE-AAC编码器解码器工作原理
“高效AAC v2配置(HE-AACv2)”在HE-AAC基础上添加了参数声音(Parametric Sound,PS)工具。HE-AACv2 应用参数进行立体声信号编码,并进一步降低了比特率。参数声音编码器不是发送两个声道,而是从立体声信号中提取参数,在解码器侧重建立体声信号,然后生成一个HE-AAC编码的单声道混音。参数数据与频谱数据在AAC比特流的辅助数据字段中传输。解码器解码单声道信号,参数解码器重建立体声。对于立体声来说,采用参数数据传输HE-AAC编码的单声道信号比传输双声道 、HE-AAC编码信号的效率更高。对于立体声信号来说,HE-AACv2典型比特率为24至32 kbps。
图3: HE-AAC v2编码器解码器工作原理
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)