MPEG音频编解码器:从mp3到xHE-AAC_技术

音频编解码器是现代媒体系统的基础核心之一。没有音频编解码器，就不会有现在的数字广播、流媒体服务及音乐发行。首个同时也仍是最主流的MPEG音频编解码器是于1998年面市的mp3。此后，Fraunhofer IIS和其他ISO-MPEG成员参与者开发并制定了多个音频编解码器。每个MPEG音频编解码器已经或将会改变我们消费媒体的方式。本文介绍了MPEG音频编解码器及其应用，并展现现代音频编码方案最成功的创建者Fraunhofer IIS。

MPEG L3： mp3

mp3彻底改变了音乐产业，也改变了消费者购买和享受音乐的方式。mp3目前仍然是音乐发行的主要格式，因为mp3文件可以在任何设备上随时随地播放。mp3技术于上世纪80年代末开始开发，1995年，随着以 “.mp3”为后缀的文件的诞生，该技术达到了顶峰。同年，Fraunhofer IIS推出了第一个mp3播放器的硬件原型。该文件后缀mp3很快成为 “MPEG Layer 3”标准名称的替称，但是直到三年后，即1998年，第一款mp3播放器才投放市场。

mp3是一种感知型音频编解码器，这类编解码器基于人类听觉系统的感知模型。这些模型描述了人耳能够感知以及无法感知的音频信号元素，无论听众的耳朵是否经受过训练。通过分析音频信号，mp3和其他感知型音频编解码器确认了以上事实，即音质各指标可按人耳的感知优先排序，并在最终音频文件中精细的表现出来。因此，如果比特率（即至少192 kbps）选择得当，听众则无法辨别mp3文件与源文件之间的差别。

不仅mp3基于感知模型，目前大部分的MPEG系列的音频编解码器也能够明智的利用人类听觉系统，来降低数据速率和文件大小。AAC系列的音频编解码器也不例外。

AAC系列

AAC-LC

在市场大规模采用mp3之前，MPEG就已开发另一款音频编解码器。目的是在显著降低数据速率的同时实现与mp3同样高品质的音频质量。自此，开启了研发序幕，从1994年的AAC ，至2012年的扩展型HE-AAC。整个编解码器系列序幕。

1994年，根据MPEG-2格式制定了首款新型AAC编解码器，命名为高级音频编码（Advanced Audio Coding，AAC）。根据mp3和其他编解码器专利的开发经验，AT&T、Dolby、Fraunhofer IIS以及Sony等主要参与者从头开始设计一款最先进的新型音频编解码器。通过增加感知噪声建模（Perceptual Noise Shaping，PNS）、频带复制（Spectral Band ReplicaTIon，SBR），以及参数立体声编码（Parametric Stereo，PS）等工具，将MPEG-2 AAC编解码器扩展至MPEG-4标准。

基本的MPEG-4 AAC配置被称为AAC-LC（低复杂性）的配置。它能提供“水晶般”的音频质量。在音频编码域中，“水晶般”音频的编码信号虽然在数学上与源文件有差异，但即便是拥有“金耳朵”的听力专家也无法辨别其与源文件的区别。因此，AAC-LC可以满足广播公司最高的音频质量要求。立体声AAC-LC比特率通常为128-192 kbps，5.1多声道AAC-LC比特率为320 kbps，两种AAC均以立声道进行编码。AAC-LC是目前最灵活的音频编解码器之一，采样率从8 kHz到192 kHz，每声道的比特率高达256 kbps，并支持48声道。该配置最著名的应用就是Apple iTunes，并已用于日本ISDB数字电视标准。

图1： MPEG AAC音频编解码器系列概览

HE-AAC 和 HE-AACv2

MPEG-4“高效配置（High Efficiency Profile， HE-AAC）”结合了MPEG-4 AAC-LC和参量频谱复制（Spectral Band ReplicaTIon，SBR）工具，从而可以进一步降低总比特率，同时保持出色的音频质量。当立体声信号的比特率低于128 kbps时，HE-AAC与同音频质量的AAC-LC相比，比特率降低了30%。对于HE-AAC，低音频频谱使用AAC-LC进行编码，高频谱通过SBR工具编码。频谱复制是一种参数方法，可使用该频谱的高低重新创建该信号的整个音频频谱。为了进一步降低比特率，AAC-LC编码使用总信号50%的采样进行低频率编码。HE-AAC立体声所用的典型数据速率为48-64kbps，HE-AAC 5.1多声道的典型数据速率为160 kbps。同AAC-LC一样，HE-AAC支持8至 192kHz的采样率、高达48个声道以及音频特定的元数据。

图2： HE-AAC编码器解码器工作原理

“高效AAC v2配置（HE-AACv2）”在HE-AAC基础上添加了参数声音（Parametric Sound，PS）工具。HE-AACv2 应用参数进行立体声信号编码，并进一步降低了比特率。参数声音编码器不是发送两个声道，而是从立体声信号中提取参数，在解码器侧重建立体声信号，然后生成一个HE-AAC编码的单声道混音。参数数据与频谱数据在AAC比特流的辅助数据字段中传输。解码器解码单声道信号，参数解码器重建立体声。对于立体声来说，采用参数数据传输HE-AAC编码的单声道信号比传输双声道、HE-AAC编码信号的效率更高。对于立体声信号来说，HE-AACv2典型比特率为24至32 kbps。

图3： HE-AAC v2编码器解码器工作原理

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/dianzi/2438074.html

MPEG音频编解码器:从mp3到xHE-AAC

发表评论

评论列表（0条）