视音频编解码技术及其实现_技术

关键词：音频 , 视频 , 编解码

一、视音频编码国际标准化组织及其压缩标准介绍
国际上有两个负责视音频编码的标准化组织，一个是VCEG（Video code Expert Group），是国际电信联合会下的视频编码专家组，一个是MPEG（MoTIon Picture Expert Group），是国际标准化组织下的运动图象专家组。这两个视音频编码标准化组织都对视音频的编解码做出了非常重要的贡献：一是推动视音频编码技术的发展，一是推动视音频编解码的应用。
视音频编解码涉及很多项视频和音频处理技术，每一项技术的改进都对视音频编码做出贡献，但作为一套完整、高效的编码方案，需要集中全人类在视音频编解码方面的最新智慧。个人或公司的研究成果，都希望被标准化组织，其经济回报是标准使用费。
这两个标准化组织制定的相关编码标准都获得了广泛的应用，VCEG制定的标准有H.261（被国际电信联合会选定为电视会议的视频压缩标准）、H.262（该标准同MPEG-2完全一样，是VCEG同MPEG组成的联合编码专家组JVT制定的压缩标准，VCEG发布的是H.262，MPEG发布的是MPEG-2）、H.263（该标准被国际电信联合会选定为可视电话的视频压缩标准，有增强型版本H.263+、H.263++）、H.264（该标准是2002年5月VCEG为新一代交互式视频通讯制定的标准）。MPEG名气要大得多，制定的标准有MPEG-1、MPEG-2、MPEG-4、MPEG-7和MPEG-21 ，MPEG-1压缩标准为VCD所采纳，MPEG-2的压缩标准为DVD采纳，MPEG-4是为交互式多媒体通讯制定的压缩标准，MPEG-7是为互联网视频检索制定的压缩标准。
VCEG制定的压缩标准H.26X都是针对单一矩形视频对象，其追求的是更高的压缩效率。MPEG-4在目前之所以很热，是因为MPEG-4是基于多个视音频对象的压缩编码标准，这非常适合于互联网上的多媒体应用。在互联网上传播的多媒体信息，很多是可以划分为多个视频对象的，如电脑制作的动画节目、电视新闻节目等，而在实时视频图象编码中，在一个图象矩形框中很难实时识别多个视频对象，还是把一个视频源当作一个矩形视频对象进行编码。
VCEG在97年发布H.263的压缩标准后，制定了短期开发计划H.26N和长期开发计划H.26L，H.26N发展成H.263+和H.263++，H.26L经过5年时间的发展，在2002年5月作为H.264压缩标准进行发布。
MPEG在VCEG发布H.263之后，发布了MPEG-4 SP（即MPEG-4第一板），在该版本中引入了两个非常重要的概念：一个是一个视频源多个视音频对象编码，一个是码流传输异常处理（特别是无线传输应用）。从这里可以看出，VCEG致力于高效率的视频编码技术，MPEG更侧重系统和框架。
在2001年第四季度，VCEG H.26L发展到TML9.0时，MPEG同VCEG再次组成联合联合视频编码专家组JVT，对H.26L的算法进行了改进和完善，在2003年5月VCEG发布了H.264的压缩标准。MPEG在JVT对H.26L压缩算法修改的基础上，将该技术规范纳入到MPEG-4的标准中，作为MPEG-4 PART10发布，即MPEG-4的第三版，MPEG-4 AVC。H.264和MPEG-4 AVC代表了全人类在视音频编解码方面的最新成果。
针对单一矩形视频对象，MPEG-4 AVC比MPEG-4第二版MPEG-4 ACE的压缩效率提高30%以上。

二、 H.264与MPEG-4 PART10的技术说明
同以前的视频压缩标准H.263++和MPEG-4 ACE相比，H.264与MPEG-4 PART10采用了一些新的算法，主要表现在以下几个方面：
1、运动搜索
a、引入多参考帧
引入多达5个参考帧。
b、多种BLOCK形状
有16*16、16*8、8*16、8*8、8*4、4*8、4*4七种BLOCK形状。
c、运动搜索精度更高
1/2象素精度搜索采用了6阶滤波器，搜索精度有很大提高。也引入了1/4象素精度搜索和1/8象素精度搜索。
2、残余编码
a、采用整型4*4 DCT变换
b、量化技术改进
c、采用DE-BLOCK技术
d、 SP帧技术
这些技术的改变，一方面提高了压缩效率，另一方面运算强度大幅提高，大大地提高了实现的难度。

欢迎分享，转载请注明来源：内存溢出

原文地址: https://outofmemory.cn/dianzi/2627530.html

视音频编解码技术及其实现

发表评论

评论列表（0条）