matlab中的特定人语音识别算法DTW算法的应用例程

matlab中的特定人语音识别算法DTW算法的应用例程,第1张

语音识别原理

语音识别系统的本质就是一种模式识别系统,它也包括特征提取、模式匹配、参考模式库等基本单元。由于语音信号是一种典型的非平稳信号,加之呼吸气流、外部噪音、电流干扰等使得语音信号不能直接用于提取特征,而要进行前期的预处理。预处理过程包括预滤波、采样和量化、分帧、加窗、预加重、端点检测等。经过预处理的语音数据就可以进行特征参数提取。在训练阶段,将特征参数进行一定的处理之后,为每个词条得到一个模型,保存为模板库。在识别阶段,语音信号经过相同的通道得到语音参数,生成测试模板,与参考模板进行匹配,将匹配分数最高的参考模板作为识别结果。后续的处理过程还可能包括更高层次的词法、句法和文法处理等,从而最终将输入的语音信号转变成文本或命令。

DTW算法原理

DTW是把时间规整和距离测度计算结合起来的一种非线性规整技术,它寻找一个规整函数im=Ф(in) ,将测试矢量的时间轴n非线性地映射到参考模板的时间轴m上,并使该函数满足:

D就是处于最优时间规整情况下两矢量的距离。由于DTW不断地计算两矢量的距离以寻找最优的匹配路径,所以得到的是两矢量匹配时累积距离最小所对应的规整函数,这就保证了它们之间存在的最大声学相似性。

DTW算法的实质就是运用动态规划的思想,利用局部最佳化的处理来自动寻找一条路径,沿着这条路径,两个特征矢量之间的累积失真量最小,从而避免由于时长不同而可能引入的误差。

我看了一下你的链接和程序.

这是你没定义dtwOptSet,当然dtw和dtwOptSet都是作者自定义的函数,不在matlab的标准库里,这个图也是明显用了3个subplot画的

如果你想运行这个,请去作者推荐的

http://mirlab.org/jang/books/dcpr/introMatlabProgram.asp?title=1-2%20Example%20Programs%20(%A6p%A6%F3%A8%FA%B1o%B5{%A6%A1%BDX)

下载example就可以了.

一、嵌入水印信息的MATLAB程序

首先读入原始图象并设置参数,然后嵌入水印信息,程序代码如下:

clear

%

%读入原图象

trueImage=imread('C:\Documents and Settings\ks001\My Documents\My Pictures\lean.tif')

alfa=.1

LENGTH=2500

subplot(2,2,1)

imshow(trueImage)

title('原始图象')

%

%对原图象进行DCT变换

dctF1=dct2('C:\Documents and Settings\ks001\My Documents\My Pictures\lean.tif')

subplot(2,2,2)

imshow(log(abs(dctF1)),[ ])

title('DCT cofficient matrix')

[m,n]=size(dctF1)

%

%产生水印序列并对其排序

radon('copyright',10)

watermark1=radon(LENGTH,1)

subplot(2,2,3)

title('watermark seqence')

[Y0,I0]=sort(watermark1)

%

%找出水印嵌入位置(幅值较大的n个频域成分)

A=dctF1(:)

[Y1,I1]=sort(A)

x=m*n

k=LENGTH

M=zeros(x,1)

%

%修改幅值较大的n个频域成分的幅值,嵌入水印(因为两个问题不同,所以有两个注释符)

for i=1:x

  if k>=1

  M(x)=Y1(x)*(1+alfa*Y0(k))

  k=k-1

  else

  M(x)=Y1(x)

  end

  x=x-1

end

N=zeros(x,1)

x=m*n

for i=1:x

  N(I1(i))=M(i)

end

a=1

for j=1:n

for i=1:m

  dctF2(i,j)=N(a)

  a=a+1

end

end

%

%DCT反变换,得到嵌入水印的图象

idctF1=idct2(dctF2)

subplot(2,2,4)

imshow(idctF1,[ ])

title('嵌入水印后的图象')

end

二、提取恢复水印信息的MATLAB程序

水印提取过程是水印嵌入过程的逆过程,相对嵌入过程来说比较复杂,难度较大,下面是水印提取检测的MATLAB程序代码:

function watermark_detect(image,Y1,I0,waterMark1)

%image:嵌入水印的图象

%Y1:原始图象的序列排序

%I0:原始水印的序列排序

%waterMark1:原始水印序列

%

%对嵌入水印图象进行DCT变化

dctW1=dct2(image)

%

%找出幅值较大的系数

B=dtW1(:)

[Y1,I2]=sort(B)

[m1,n1]=size(dctW1)

y=m1*n1

k=length(waterMark1)

N0=zeros(k,1)

%

%提取水印序列

while k>=1

    N0(k)=(Y2(y)-Y1(y))/alfa/Y1(y)

    k=k-1

    y=y-1

end

k=length(waterMark1)

waterMark2=zeros(k,1)

for i=1:k

  waterMark2(I0(i))=N0(i)

end

%

%选取50个测试序列,其中第10个为提取出的水印

figure

for i=150

  if i==10

    waterMark=waterMark2

  else

    waterMark=rand(k,1)

  end

%计算各个序列与原来水印序列的相关值

  c=waterMark'*waterMark1/sqrt(waterMark'*waterMark)

  stem(i,c)

  hold on

end

%

三、接下来对嵌入水印的图象进行不同的攻击,用以测试水印的鲁棒性。

程序的目的和程序代码如下:

%

%攻击实验

disp('input you choice according to the following

image processing operation:')

disp('0--exit')

disp('1--smoothing patterns')

%添加噪音

disp('2--adding uniorm noise 添加噪音')

%滤波

disp('3--adding filter [10 10] 滤波')

%剪切

disp('4--cutting part of the image 剪切')

%压缩

disp('5--10 quality JPEG compressing 压缩')

%旋转45度

disp('6--rotate 45 旋转')

%

d=input('please input you choice(请输入您的选择):')

while d~=0

switch d

case 1

watermark_detect(idctF1,Y1,I0,waterMark1)

case 2

  WImage2=idctF1

  noise0=10*rand(size(WImage2))

  WImage2=WImage2+noise0

  figure

imshow(WImage2,[ ])

title('adding uniform noise 添加噪音')

  watemark_detect(WImage2,Y1,I0,waterMark1)

case 3

  WImage3=idctF1

  H=fspcial('gaussian高斯',[10,10],5)

  WImage3=imfilter(WImage3,H)

  figure

  imshow(WImage3,[ ])

  title(through filter [10,10] 滤波')

  watemark_detect(WImage3,Y1,I0,waterMark1)

case 4

  WImage4=idctF1                                    WImage4(1:128,1128)=256

  figure

  imshow(WImage4)

  title('cutting part of the image 剪切')

  watemark_detect(WImage4,Y1,I0,waterMark1)

case 5

  WImage5=idctF1   

  WImage5=im2double(WImage5)

  cnum=10

  dctm=dctmtx(8)

  p1=dctm

  p2=dctm.'

  imageDCT=blkproc(WImage5,[8,8],'p1*p2*x',dctm,dctm.')

  DCTvar=im2col(imageDCT,[8,8],'distinct').'

  n=size(DCTvar,1)

  DCTvar=(sum(DCTvar.*DCTvar)-(sum(DCTvar)/n).^2)/n

  [dum,order]=sort(DCTvar)

  cnum=64-cnum

  mask=ones(8,8)

  mask(order(1:cnum))=zeros(1,cnum)

  im88=zeros(9,9)

  im88(1:8,1:8)=mask

  im128128=kron(im88(1:8,1:8),ones(16))

  dctm=dctmtx(8)

  p1=dctm.'

  p2=mask(18,1:8)

  p3=dctm

Wimage5=bikproc(imageDCT,[8,8],'p1*(x.8p2)*p3',dctm.',mask(1:8,1:8),dctm)

  figure

  imshow(Wimage5)

  title('JPEG Image 压缩')

  watemark_detect(WImage5,Y1,I0,waterMark1)

case 6                                             WImage6=idctF1         

  WImage6=imrotate(WImage6,45,'bilinear','corp')

  figure

  imshow(Wimage6)

  title('rotate 45 旋转')

  watemark_detect(WImage6,Y1,I0,waterMark1)

case 0

  break

otherwise

  error('you have a valid value(您的输入错误)')

end

d=input('please input you choice(请输入您的选择):')

end

%结束


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/8121461.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-13
下一篇 2023-04-13

发表评论

登录后才能评论

评论列表(0条)

保存