找到了一个,我尽力了。
超级管理员
摘要:作为保护音频文件版权的有效方法,数字音频水印已逐渐成为研究的热点。系统地介绍了数字音频水印的相关概念,数字音频的特点和人类心理声学模型,音频水印中用到的各种技术方法,水印的攻击与评价。最后探讨了目前存在的问题及今后的发展方向。
关键字:数字音频;水印;人类听觉系统
Digital Audio Watermarking Techniques
ChaoJiGuanLiYuan
Abstract:As a valid method of protecting the copyright of audio files,audio watermarking has been studied by many people. This paper introduces the background and concept of watermark,the features of digital audio and human audio system (HAS),and the techniques that have been used.Attack and evaluation of watermarking schemes are introduced. The existing problems and future development are also discussed.
Key words:digital audio;watermarking;Human Audio System(HAS)
1 引言
多媒体数据的数字化为多媒体信息的存取提供了极大的便利,极大地提高了信息表达的效率和准确性,其发布形式也愈加丰富。然而这也导致大量多媒体数据的非法扩散。因此如何既充分利用因特网的便利,又能有效地保护知识产权,已受到人们的高度重视。由于数字水印(digital watermarking)是实现版权保护的有效办法,因此如今已成为多媒体信息安全研究领域的一个热点。该技术即是通过在原始数据中嵌入秘密信息——水印(watermark)来证实该数据的所有权。数字水印技术必须具有较强的鲁棒性、安全性和透明性。数字水印的研究对象可以是文本、图像、音频、视频等。目前关于图像的数字水印的研究较多。MPEG-1第三层(mp3)格式已经成为现在音频标准格式之一,然而许多map3文件来自盗版CD, Internet上肆无忌惮的复制和传播盗版音乐制品,使得艺术作品的作者和发行者的利益受到极大损害,所以对音所有权的保护日益重要。音频数字水印有广泛的应用前景,然而目前数字音频水印的研究刚刚起步。
2 音频数字水印基本概念
图1 音频水印嵌入过程
加水印的过程是将含有版权或其它相关信息的水印W 以某种方式嵌入原始音频文件A,并且原始音频及水印可以被提取出来。从图l可看到,原始音频与水印和一个可选的密码K相结台,产生加入水印的音频文件。提取时分非盲水印和盲水印的提取过程,即水印的提取是否需要用到原始音频文件。
数字音频水印技术就是在不影响原始音频质量的条件下向其中嵌入具有特定意义且易于提取的信息的过程。根据应用目的不同,被嵌入的信息可以是版权标识符、作品序列号、文字(如艺术家和歌曲的名字),甚至是一个小的图像]或一小段音频等。水印与原始音频数据紧密结合并隐藏在其中,通常是不可听到的,而且能够抵抗一般音频信号处理和盗版者的某些恶意攻击。理论上,一个成功的数字音频水印算法需要具备以下一些性质:
1) 水印必须嵌入到宿主音频数据中,而不能存储于文件头或单独的文件,否则可以很轻易地被除去或改变。
2) 水印不应对原始音频的声音质量产生可听到的失真,即应具有透明性。
3) 水印必须具有一定的顽健性,能抵抗宿主音频信号上的压缩、滤波、重采样、重量化、剪切、加噪声等一般信号处理。
4) 水印应易于提取,嵌入和检测的计算量要低,以方便其集成到一般电子产品中。
5) 水印算法必须具备某种同步机制,以对抗时间域上的同步攻击。
6) 原则上水印的检测不应需要原始音频,即盲检测,因为寻找原始音频是十分困难的。
7) 水印算法应该公开,安全性最好依赖于密钥而不是算法的秘密性。
设计一个音频水印系统使以上所有目标都达到最优很困难,有些性质如顽健性和透明性之间就是互相冲突的。水印系统试图平衡这些要求,尽量使每一个都得到足够的满足,而不显著地影响其它要求。与其它媒体上的水印应用类似,数字音频水印的应用主要有三个:版权保护、盗版跟踪和认证,其中版权保护是最迫切和重要的。有的水印技术还可以通过嵌入顽健性水印和脆弱性水印来同时用于多种用途。
3 数字音频水印技术方法
数字音频水印的分类方法有多种。一般根据嵌入水印时对音频信号的处理方式不同,将水印算法分为时域水印算法和变换域水印算法。前者直接将水印信息嵌人到音频信号的时域选定的采样数据中;后者首先对音频信号的采样数据进行适当的变换(既可以全局进行也可以分段进行1,然后将水印信息嵌入到变换域选定的系数上,最后通过相应的反变换重构出含有水印信息的媒体信号。
3.1 时间域算法
时域水印算法在时间域上将水印直接隐藏入数字音频信号,与频域水印算法相比相对容易实现且需要较少的计算资源,但对一般信号处理如音频压缩和滤波等的抵抗能力较差。最低比特位LSB 方法是把数据植入其它数据最简单的方法。通过把每个采样点的最低比特位用一个水印比特来代替,可以把大量的数据植入到音频信号中。这种方法的主要缺点是顽健性较差。如果不采用冗余技术,则水印信息很容易被噪声、重采样等所破坏。实际上,这种技术只是在封闭的、点对点的环境中才有用。为此需要采用一些冗余技术对它编码,从而需要额外的比特开销,如有的空域方法在原始数据上加入带有扩谱性质的伪随机序列,可以提高水印性能。Patchwork法任意选择N对数据,在增大一个数据的同时减小另一个数据。回声隐藏算法也是一种时域水印算法。
3.2 变换域数字音频水印算法
变换域水印技术是通过修改变换域系数来隐藏水印。常用变换域方法有DFT,DCT,小波变换和KLT等。
DFT方法对某一帧信号频域系数的修改被扩散到该帧所有的时域采样点。而且,如果水印的频域嵌入只影响频域系数的幅度,检测/提取水印时可不要求水印信号的精确同步。因为帧起始位置的偏差会引起频域系数的相位发生变化,对幅度影响不大,故只要检测/提取时的一帧信号与嵌入时的一帧信号绝大部分重合就可以正确恢复水印信号。将水印隐藏在低频部分有较好的稳健性,而隐藏在高频部分则有更好的隐蔽性。因为人的视觉和听觉对低频更敏感,而压缩和低通滤波会损伤更多的高频部分。现在有人提出了一些新的变换域的算法,如基于变换一加密一编码的数字音频信号的水印算法、基于分段离散余弦变换的数字音频水印嵌入算法、一种基于离散余弦变换的语音数字水印算法,为提高算法的安全性,采用线性移位寄存器进行类似加密处理、一种基于小波变换的水印隐藏和检测算法,把高斯白噪声作为水印信号嵌入到原始音频信号小波变换域,等等。从综合性能上讲,变换域的方法更优越一些,是以后的发展方向。
3.3 扩频方法(Spread Sprectrum Encoding)
此方法是将编码数据分布到尽可能多的频谱中对信息流进行编码。常用的有直接序列扩频编码(DSSS),它通常结合性能优良的m序列进行编码和解码。为了利用HAS的掩蔽效应,一般需要对所采用的序列进行若干级的滤波处理,水印的检测则结合相关性假设检验检测方法。该方法对MP3音频编码、PCM量化以及附加噪声有一定的稳健性。
3.4 相位编码
利用人耳听觉系统的特性,即对绝对相位不敏感以及对相对相位敏感的特性,使用代表水印信息的参考相位替代原始音频段的绝对相位,并调整其余音频段以保持相对相位的不变。其编码步骤简述如下:
① 将音频序列 分割成 等长的小段 ,
② 对第 段进行K点的DFT,生成相位矩阵 和幅度矩阵 ,(0≤ )
③计算并记录相邻段的相位差
④ 记水印序列 , 修正首段相位值如下:
⑤ 对0<n<N,根据相位差重构相位矩阵:
⑥根据修改后得到的相位矩阵和原始幅度矩阵,进行IDFT逆变换,生成含有水印的音频信号。
3.5 回声隐藏
通过引入回声将水印数据嵌入到音频信号,其中利用了HAS的另一特性:音频信号在时域的向后屏蔽作用,即弱信号在强信号消失之后被屏蔽,大约在强信号消失之后的50ms~200ms之内继续作用而不被人耳所察觉。时域掩蔽分为前掩蔽和后掩蔽,后掩蔽作用比前掩蔽更明显,掩蔽声愈强,掩蔽作用就愈大。频域掩蔽效应指当2个频率足够接近的信号同时发生时,弱音会被强音所掩蔽而变得不可觉察。同样,掩蔽声对较高频信号的掩蔽作用要强于对较低频信号的掩蔽作用。
由于回声隐藏是将水印信息作为载体数据的环境而非随机噪声嵌入到载体数据中,因此对一些有损压缩的算法有令人满意的稳健性。
4 音频数字水印的攻击与评价
4.1 音频水印攻击
任何可能减弱水印性能的 *** 作都被称为“攻击”。攻击主要分为去除攻击、几何攻击、密码攻击、协议攻击4种。对数字音频水印技术进行的攻击通常有滤波、重采样、重量化、剪切、加噪声、时间缩放、变调、混频和有损压缩等,此外还有针对某种水印技术专门设计的攻击以及协议层的解释攻击,而且已经出现了顽健性标准测试工具Stirmark for Audio。根据对音频信号同步结构的影响一般把攻击分为两类:
类型一:MPEG 压缩、低通/带通滤波、加性/乘性噪声、加入回声和重采样/重量化。这种类型的攻击不显著影响音频信号的同步结构。
类型二:抖动攻击(jittering) 、时间尺度变形(time-scale warping)、变调(pitch-shift warping)以及上下采样(up/down sampling)。这种类型的攻击会损坏音频信号的同步结构,比第一种类型的攻击更具挑战性。同步问题对任何数据隐藏技术都是一个严重的问题,尤其是对一维的音频信号。剪切掉不想要的音频片段或随机向音频数据中添加和删除样本,都会引起这个问题。扩频技术中采用的相关检测器依赖于待检测信号和水印信号之间精确的对齐,同步错误会对检测性能产生严重的影响。大多数的音频水印算法都是基于位置的,即水印嵌入到特定位置再从该位置检测,而同步攻击引起的位移将会使水印检测不在嵌入位置上进行,这就需要在检测前恢复同步。
4.2 评价标准
(1)信噪比( )
评价水印嵌入后原始音频信号的被影响程度,除了利用人耳定性的评价以外,还可采用定量的评价标准。对含水印的音频信号进行定量评价的标准——信噪比( )定义:设 为音频数据段长度, 为原始音频采样数据, 为嵌入水印后的音频采样数据,则 = (2)
式中 , , 。
(2)相关系数
如果在音频信号中嵌入的水印为图像,则为定量的评价提取的水印与原始水印的相似性,采用归一化相关系数(NC)作为评价标准,其定义为
式中, 为原始水印, 为提取的水印,大小为 。
5 结论与展望
互联网的飞速发展和音频压缩技术的成熟使得对数字音频水印技术的需求越来越迫切。应该说这种技术尚处于比较初级的阶段,还有许多技术层和协议层的问题需要进一步解决。时域水印技术相对容易实现且计算量较小,但抵抗攻击的能力较差。频域水印技术通常利用音频掩蔽效应和扩频技术的思想,具有较强抵抗攻击的能力,但实现较复杂。基于内容的水印技术更加强调将水印信息嵌入到音频信号的重要特征上,其与HAS 相结合代表了今后水印技术的发展方向。对一维的音频信号来说,同步攻击引起的后果是极其严重的,需要给予特别的注意。总而言之,到目前为止,还没有一种音频水印算法是完美和真正实用的。虽然数字水印技术已取得诸多进展,但仍有许多挑战性的研究难题等待解决,例如水印嵌入和检测的数学模型、可靠的水印恢复、水印容量估计、最佳水印检测、信道编码在数字水印中的应用、错误概率的界限、攻击模型及反攻击、大规模实验测试和比较、新的统计和感知模型、数字水印的新型应用、水印系统安全性、时间/空间域的同步问题等等。水印技术必须与密码学、多媒体技术、通信理论、编码理论、心理声学、信号处理、模式识别等多个学科有效结合,才能产生新的思路并实现可实际应用的水印系统。
水印是向数据多媒体(如图像、声音、视频信号等)中添加某些数字信息以达到文件真伪鉴别、版权保护等功能。水印是无法去除的。
嵌入的水印信息隐藏于宿主文件中,不影响原始文件的可观性和完整性。水印能为受到版权保护的信息产品的归属提供完全和可靠的证据。
水印的分类
1、按特性划分
可以将数字水印分为鲁棒数字水印和脆弱数字水印两类。鲁棒数字水印主要用于在数字作品中标识着作权信息,如作者、作品序号等,它要求嵌入的水印能够经受各种常用的编辑处理;脆弱数字水印主要用于完整性保护,与鲁棒水印的要求相反,脆弱水印必须对信号的改动很敏感,人们根据脆弱水印的状态就可以判断数据是否被篡改过。
2、按水印所附载的媒体划分
可以将数字水印划分为图像水印、音频水印、视频水印、文本水印以及用于三维网格模型的网格水印等。
3、按检测过程划分
可以将数字水印划分为明文水印和盲水印。明文水印在检测过程中需要原始数据,而盲水印的检测只需要密钥,不需要原始数据。一般来说,明文水印的鲁棒性比较强,但其应用受到存储成本的限制。
4、按内容划分
可以将水印划分为有意义水印和无意义水印。有意义水印是指水印本身也是某个数字图像(如商标图像)或数字音频片段的编码;无意义水印则只对应于一个序列号。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)