语音识别原理
语音识别系统的本质就是一种模式识别系统,它也包括特征提取、模式匹配、参考模式库等基本单元。由于语音信号是一种典型的非平稳信号,加之呼吸气流、外部噪音、电流干扰等使得语音信号不能直接用于提取特征,而要进行前期的预处理。预处理过程包括预滤波、采样和量化、分帧、加窗、预加重、端点检测等。经过预处理的语音数据就可以进行特征参数提取。在训练阶段,将特征参数进行一定的处理之后,为每个词条得到一个模型,保存为模板库。在识别阶段,语音信号经过相同的通道得到语音参数,生成测试模板,与参考模板进行匹配,将匹配分数最高的参考模板作为识别结果。后续的处理过程还可能包括更高层次的词法、句法和文法处理等,从而最终将输入的语音信号转变成文本或命令。
DTW算法原理
DTW是把时间规整和距离测度计算结合起来的一种非线性规整技术,它寻找一个规整函数im=Ф(in) ,将测试矢量的时间轴n非线性地映射到参考模板的时间轴m上,并使该函数满足:
D就是处于最优时间规整情况下两矢量的距离。由于DTW不断地计算两矢量的距离以寻找最优的匹配路径,所以得到的是两矢量匹配时累积距离最小所对应的规整函数,这就保证了它们之间存在的最大声学相似性。
DTW算法的实质就是运用动态规划的思想,利用局部最佳化的处理来自动寻找一条路径,沿着这条路径,两个特征矢量之间的累积失真量最小,从而避免由于时长不同而可能引入的误差。
我看了一下你的链接和程序.这是你没定义dtwOptSet,当然dtw和dtwOptSet都是作者自定义的函数,不在matlab的标准库里,这个图也是明显用了3个subplot画的
如果你想运行这个,请去作者推荐的
http://mirlab.org/jang/books/dcpr/introMatlabProgram.asp?title=1-2%20Example%20Programs%20(%A6p%A6%F3%A8%FA%B1o%B5{%A6%A1%BDX)
下载example就可以了.
一、嵌入水印信息的MATLAB程序首先读入原始图象并设置参数,然后嵌入水印信息,程序代码如下:
clear
%
%读入原图象
trueImage=imread('C:\Documents and Settings\ks001\My Documents\My Pictures\lean.tif')
alfa=.1
LENGTH=2500
subplot(2,2,1)
imshow(trueImage)
title('原始图象')
%
%对原图象进行DCT变换
dctF1=dct2('C:\Documents and Settings\ks001\My Documents\My Pictures\lean.tif')
subplot(2,2,2)
imshow(log(abs(dctF1)),[ ])
title('DCT cofficient matrix')
[m,n]=size(dctF1)
%
%产生水印序列并对其排序
radon('copyright',10)
watermark1=radon(LENGTH,1)
subplot(2,2,3)
title('watermark seqence')
[Y0,I0]=sort(watermark1)
%
%找出水印嵌入位置(幅值较大的n个频域成分)
A=dctF1(:)
[Y1,I1]=sort(A)
x=m*n
k=LENGTH
M=zeros(x,1)
%
%修改幅值较大的n个频域成分的幅值,嵌入水印(因为两个问题不同,所以有两个注释符)
for i=1:x
if k>=1
M(x)=Y1(x)*(1+alfa*Y0(k))
k=k-1
else
M(x)=Y1(x)
end
x=x-1
end
N=zeros(x,1)
x=m*n
for i=1:x
N(I1(i))=M(i)
end
a=1
for j=1:n
for i=1:m
dctF2(i,j)=N(a)
a=a+1
end
end
%
%DCT反变换,得到嵌入水印的图象
idctF1=idct2(dctF2)
subplot(2,2,4)
imshow(idctF1,[ ])
title('嵌入水印后的图象')
end
二、提取恢复水印信息的MATLAB程序
水印提取过程是水印嵌入过程的逆过程,相对嵌入过程来说比较复杂,难度较大,下面是水印提取检测的MATLAB程序代码:
function watermark_detect(image,Y1,I0,waterMark1)
%image:嵌入水印的图象
%Y1:原始图象的序列排序
%I0:原始水印的序列排序
%waterMark1:原始水印序列
%
%对嵌入水印图象进行DCT变化
dctW1=dct2(image)
%
%找出幅值较大的系数
B=dtW1(:)
[Y1,I2]=sort(B)
[m1,n1]=size(dctW1)
y=m1*n1
k=length(waterMark1)
N0=zeros(k,1)
%
%提取水印序列
while k>=1
N0(k)=(Y2(y)-Y1(y))/alfa/Y1(y)
k=k-1
y=y-1
end
k=length(waterMark1)
waterMark2=zeros(k,1)
for i=1:k
waterMark2(I0(i))=N0(i)
end
%
%选取50个测试序列,其中第10个为提取出的水印
figure
for i=150
if i==10
waterMark=waterMark2
else
waterMark=rand(k,1)
end
%计算各个序列与原来水印序列的相关值
c=waterMark'*waterMark1/sqrt(waterMark'*waterMark)
stem(i,c)
hold on
end
%
三、接下来对嵌入水印的图象进行不同的攻击,用以测试水印的鲁棒性。
程序的目的和程序代码如下:
%
%攻击实验
disp('input you choice according to the following
image processing operation:')
disp('0--exit')
disp('1--smoothing patterns')
%添加噪音
disp('2--adding uniorm noise 添加噪音')
%滤波
disp('3--adding filter [10 10] 滤波')
%剪切
disp('4--cutting part of the image 剪切')
%压缩
disp('5--10 quality JPEG compressing 压缩')
%旋转45度
disp('6--rotate 45 旋转')
%
d=input('please input you choice(请输入您的选择):')
while d~=0
switch d
case 1
watermark_detect(idctF1,Y1,I0,waterMark1)
case 2
WImage2=idctF1
noise0=10*rand(size(WImage2))
WImage2=WImage2+noise0
figure
imshow(WImage2,[ ])
title('adding uniform noise 添加噪音')
watemark_detect(WImage2,Y1,I0,waterMark1)
case 3
WImage3=idctF1
H=fspcial('gaussian高斯',[10,10],5)
WImage3=imfilter(WImage3,H)
figure
imshow(WImage3,[ ])
title(through filter [10,10] 滤波')
watemark_detect(WImage3,Y1,I0,waterMark1)
case 4
WImage4=idctF1 WImage4(1:128,1128)=256
figure
imshow(WImage4)
title('cutting part of the image 剪切')
watemark_detect(WImage4,Y1,I0,waterMark1)
case 5
WImage5=idctF1
WImage5=im2double(WImage5)
cnum=10
dctm=dctmtx(8)
p1=dctm
p2=dctm.'
imageDCT=blkproc(WImage5,[8,8],'p1*p2*x',dctm,dctm.')
DCTvar=im2col(imageDCT,[8,8],'distinct').'
n=size(DCTvar,1)
DCTvar=(sum(DCTvar.*DCTvar)-(sum(DCTvar)/n).^2)/n
[dum,order]=sort(DCTvar)
cnum=64-cnum
mask=ones(8,8)
mask(order(1:cnum))=zeros(1,cnum)
im88=zeros(9,9)
im88(1:8,1:8)=mask
im128128=kron(im88(1:8,1:8),ones(16))
dctm=dctmtx(8)
p1=dctm.'
p2=mask(18,1:8)
p3=dctm
Wimage5=bikproc(imageDCT,[8,8],'p1*(x.8p2)*p3',dctm.',mask(1:8,1:8),dctm)
figure
imshow(Wimage5)
title('JPEG Image 压缩')
watemark_detect(WImage5,Y1,I0,waterMark1)
case 6 WImage6=idctF1
WImage6=imrotate(WImage6,45,'bilinear','corp')
figure
imshow(Wimage6)
title('rotate 45 旋转')
watemark_detect(WImage6,Y1,I0,waterMark1)
case 0
break
otherwise
error('you have a valid value(您的输入错误)')
end
d=input('please input you choice(请输入您的选择):')
end
%结束
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)