哪位大神帮小弟写一段MATLAB提取语音信号共振峰程序

哪位大神帮小弟写一段MATLAB提取语音信号共振峰程序,第1张

function [fmt] = seekfmts1(sig,Nt,fs,Nlpc)

if nargin<4, Nlpc = round(fs/1000)+2end

ls=length(sig) % 数据长度

Nwin = floor(ls/Nt) % 帧长

for m=1:Nt,

lpcsig = sig((Nwin*(m-1)+1):min([(Nwin*m) ls]))% 取来一帧信号

if ~isempty(lpcsig),

a = lpc(lpcsig,Nlpc)% 计算LPC系数

const=fs/(2*pi) % 常数

rts=roots(a)% 求根

k=1 % 初始化

yf = []

bandw=[]

for i=1:length(a)-1

re=real(rts(i)) % 取根之实部

im=imag(rts(i)) % 取根之虚部

formn=const*atan2(im,re)% 计算共振峰频率

bw=-2*const*log(abs(rts(i)))% 计算带宽

if formn>150 &bw <700 &formn<fs/圆冲2 % 满足条件方能成共振峰和带宽

yf(k)=formn

bandw(k)=bw

k=k+1

end

end

[y, ind]=sort(yf) % 排序

bw=bandw(ind)

F = [NaN NaN NaN] % 初始化

F(1:min(3,length(y))) = y(1:min(3,length(y)))% 输出最多三个

F = F(:)% 按列输出

fmt(:,m)=F/(fs/2) % 归一化频率

end

end

from 《matlab在语音信号猜腔慎分析与穗敬合成中的应用》

%% 清空环境变量

clc

clear

%% 训练数据预测数据提取及归一化

%下载四类语音信号

load data1 c1

load data2 c2

load data3 c3

load data4 c4

%四个特征信号矩阵合汪扰成一个矩阵

data(1:500,:)=c1(1:500,:)

data(501:1000,:)=c2(1:500,:)

data(1001:1500,:)=c3(1:500,:)

data(1501:2000,:)=c4(1:500,:)

%从1到2000间随机排序

k=rand(1,2000)

[m,n]=sort(k)

%输入输出数坦悔据

input=data(:,2:25)

output1 =data(:,1)

%把输出从1维变成4维

for i=1:2000

switch output1(i)

case 1

output(i,:)=[1 0 0 0]

case 2

output(i,:)=[0 1 0 0]

case 3

output(i,:)=[0 0 1 0]

case 4

output(i,:)=[0 0 0 1]

end

end

%随机提取1500个样本为训练样本,500个样本为预测样本

input_train=input(n(1:1500),:)'

output_train=output(n(1:1500),:)'

input_test=input(n(1501:2000),:)'

output_test=output(n(1501:2000),:)'

%输入数据归一化

[inputn,inputps]=mapminmax(input_train)

%% 网络结构初始化

innum=24

midnum=25

outnum=4

%权值初始化

w1=rands(midnum,innum)

b1=rands(midnum,1)

w2=rands(midnum,outnum)

b2=rands(outnum,1)

w2_1=w2w2_2=w2_1

w1_1=w1w1_2=w1_1

b1_1=b1b1_2=b1_1

b2_1=b2b2_2=b2_1

%学习率

xite=0.1

alfa=0.01

%% 网络训练

for ii=1:10

E(ii)=0

for i=1:1:1500

%% 网络预测输出

x=inputn(:,i)

% 隐含层输出

for j=1:1:midnum

I(j)=inputn(:,i)'*w1(j,:)'+b1(j)

Iout(j)=1/(1+exp(-I(j)))

end

% 输出层输困信旦出

yn=w2'*Iout'+b2

%% 权值阀值修正

%计算误差

e=output_train(:,i)-yn

E(ii)=E(ii)+sum(abs(e))

%计算权值变化率

dw2=e*Iout

db2=e'

for j=1:1:midnum

S=1/(1+exp(-I(j)))

FI(j)=S*(1-S)

end

for k=1:1:innum

for j=1:1:midnum

dw1(k,j)=FI(j)*x(k)*(e(1)*w2(j,1)+e(2)*w2(j,2)+e(3)*w2(j,3)+e(4)*w2(j,4))

db1(j)=FI(j)*(e(1)*w2(j,1)+e(2)*w2(j,2)+e(3)*w2(j,3)+e(4)*w2(j,4))

end

end

w1=w1_1+xite*dw1'

b1=b1_1+xite*db1'

w2=w2_1+xite*dw2'

b2=b2_1+xite*db2'

w1_2=w1_1w1_1=w1

w2_2=w2_1w2_1=w2

b1_2=b1_1b1_1=b1

b2_2=b2_1b2_1=b2

end

end

%% 语音特征信号分类

inputn_test=mapminmax('apply',input_test,inputps)

for ii=1:1

for i=1:500%1500

%隐含层输出

for j=1:1:midnum

I(j)=inputn_test(:,i)'*w1(j,:)'+b1(j)

Iout(j)=1/(1+exp(-I(j)))

end

fore(:,i)=w2'*Iout'+b2

end

end

%% 结果分析

%根据网络输出找出数据属于哪类

for i=1:500

output_fore(i)=find(fore(:,i)==max(fore(:,i)))

end

%BP网络预测误差

error=output_fore-output1(n(1501:2000))'

%画出预测语音种类和实际语音种类的分类图

figure(1)

plot(output_fore,'r')

hold on

plot(output1(n(1501:2000))','b')

legend('预测语音类别','实际语音类别')

%画出误差图

figure(2)

plot(error)

title('BP网络分类误差','fontsize',12)

xlabel('语音信号','fontsize',12)

ylabel('分类误差','fontsize',12)

%print -dtiff -r600 1-4

k=zeros(1,4)

%找出判断错误的分类属于哪一类

for i=1:500

if error(i)~=0

[b,c]=max(output_test(:,i))

switch c

case 1

k(1)=k(1)+1

case 2

k(2)=k(2)+1

case 3

k(3)=k(3)+1

case 4

k(4)=k(4)+1

end

end

end

%找出每类的个体和

kk=zeros(1,4)

for i=1:500

[b,c]=max(output_test(:,i))

switch c

case 1

kk(1)=kk(1)+1

case 2

kk(2)=kk(2)+1

case 3

kk(3)=kk(3)+1

case 4

kk(4)=kk(4)+1

end

end

%正确率

rightridio=(kk-k)./kk

% 语音合成

clear all,close all, clc

% 定义常数

FL = 80 % 帧长

WL = 240 % 窗长

P = 10% 预测系数个数

[s,fs] = wavread('C:\MATLAB7\work\voice.wav')% 载入语音s

s = s/max(s) %归一化

L = length(s) % 读入语音长度

FN = floor(L/FL)-2% 计算帧数

% 预测和重建滤波器

exc = zeros(L,1) % 激励信号(预测误差)

zi_pre = zeros(P,1) % 预测滤波器的状态

s_rec = zeros(L,1)% 重建语音

zi_rec = zeros(P,1)

% 合成滤波器

exc_syn = zeros(L,1) % 合成的激励信号(脉冲串颤友型)

s_syn = zeros(L,1)% 合成语音

last_syn = 0 %存储上一个(或多个)段的最后一个脉冲的下标

zi_syn = zeros(P,1) % 合成滤波器的状态

% 变调不变速滤波器

exc_syn_t = zeros(L,1) % 合成的激励告碰信号(脉冲串)

s_syn_t = zeros(L,1)% 合成语音

last_syn_t = 0 %存储上一个(或多个)段的最后一个脉冲的下标

zi_syn_t = zeros(P,1) % 合成滤波器的状态

% 变速不变调滤波器(假设速度减慢一倍)

v=.5

exc_syn_v = zeros(v\L,1) % 合成的激励信号(脉冲串)

s_syn_v = zeros(v\L,1)% 合成语茄猜音

last_syn_v = 0 %存储上一个(或多个)段的最后一个脉冲的下标

zi_syn_v = zeros(P,1) % 合成滤波器的状态

hw = hamming(WL) % 汉明窗

% 依次处理每帧语音

for n = 3:FN

% 计算预测系数

s_w = s(n*FL-WL+1:n*FL).*hw %汉明窗加权后的语音

[A E] = lpc(s_w, P) %用线性预测法计算P个预测系数

% A是预测系数,E会被用来计算合成激励的能量

if n == 27

% (3) 观察预测系统的零极点图

zplane(1,A)

end

s_f = s((n-1)*FL+1:n*FL) % 本帧语音,下面就要对它做处理

% (4) 用自带filter函数s_f计算激励,注意保持滤波器状态

[exc1,zi_pre] = filter(A,1,s_f,zi_pre)%最终值zi_pre保留下来提供给下一组数据运算,就能维持输出数据的连续性。exc1为激励

exc((n-1)*FL+1:n*FL) = exc1%计算得到的激励

% (5) 用filter函数和exc重建语音,注意保持滤波器状态

[s_rec1,zi_rec] = filter(1,A,exc1,zi_rec)

s_rec((n-1)*FL+1:n*FL) = s_rec1%计算得到的重建语音

% 注意下面只有在得到exc后才会计算正确

s_Pitch = exc(n*FL-222:n*FL)

PT = findpitch(s_Pitch) % 计算基音周期PT(不要求掌握)

G = sqrt(E*PT) % 计算合成激励的能量G(不要求掌握)

%方法3:本段激励只能修改本段长度

tempn_syn = [1:n*FL-last_syn]'

exc_syn1 = zeros(length(tempn_syn),1)

exc_syn1(mod(tempn_syn,PT)==0) = G%某一段算出的脉冲

exc_syn1 = exc_syn1((n-1)*FL-last_syn+1:n*FL-last_syn)

[s_syn1,zi_syn] = filter(1,A,exc_syn1,zi_syn)

exc_syn((n-1)*FL+1:n*FL) = exc_syn1 %计算得到的合成激励

s_syn((n-1)*FL+1:n*FL) = s_syn1 %计算得到的合成语音

last_syn = last_syn+PT*floor((n*FL-last_syn)/PT)

% (11) 不改变基音周期和预测系数,将合成激励的长度增加一倍,再作为filter

% 的输入得到新的合成语音,听一听是不是速度变慢了,但音调没有变。

FL_v = floor(FL/v)

tempn_syn_v = [1:n*FL_v-last_syn_v]'

exc_syn1_v = zeros(length(tempn_syn_v),1)

exc_syn1_v(mod(tempn_syn_v,PT)==0) = G%某一段算出的脉冲

exc_syn1_v = exc_syn1_v((n-1)*FL_v-last_syn_v+1:n*FL_v-last_syn_v)

[s_syn1_v,zi_syn_v] = filter(1,A,exc_syn1_v,zi_syn_v)

last_syn_v = last_syn_v+PT*floor((n*FL_v-last_syn_v)/PT)

exc_syn_v((n-1)*FL_v+1:n*FL_v) =exc_syn1_v %计算得到的加长合成激励

s_syn_v((n-1)*FL_v+1:n*FL_v) = s_syn1_v %计算得到的加长合成语音

% (13) 将基音周期减小一半,将共振峰频率增加150Hz~

PT1 =floor(PT/3) %减小基音周期

poles = roots(A)

deltaOMG = 240*2*pi/8000

for p=1:10 %增加共振峰频率,实轴上方的极点逆时针转,下方顺时针转

if imag(poles(p))>0 poles(p) = poles(p)*exp(j*deltaOMG)

elseif imag(poles(p))<0 poles(p) = poles(p)*exp(-j*deltaOMG)

end

end

A1=poly(poles)

if n==27

figure

zplane(1,A1)

end

tempn_syn_t = [1:n*FL-last_syn_t]'

exc_syn1_t = zeros(length(tempn_syn_t),1)

exc_syn1_t(mod(tempn_syn_t,PT1)==0) = G%某一段算出的脉冲

exc_syn1_t = exc_syn1_t((n-1)*FL-last_syn_t+1:n*FL-last_syn_t)

[s_syn1_t,zi_syn_t] = filter(1,A1,exc_syn1_t,zi_syn_t)

exc_syn_t((n-1)*FL+1:n*FL) = exc_syn1_t %计算得到的合成激励

s_syn_t((n-1)*FL+1:n*FL) = s_syn1_t %计算得到的合成语音

last_syn_t = last_syn_t+PT1*floor((n*FL-last_syn_t)/PT1)

end

% (6) s ,exc 和 s_rec 的区别

figure

subplot(3,1,1), plot(exc), xlabel('n (samples)'), ylabel('Amplitude'), title('激励信号')

subplot(3,1,2), plot(s), xlabel('n (samples)'), ylabel('Amplitude'), title('原语音信号')

subplot(3,1,3), plot(s_rec), xlabel('n (samples)'), ylabel('Amplitude'), title('重建语音信号')

figure

subplot(3,1,1), plot(exc), xlabel('n (samples)'), ylabel('Amplitude'), title('激励信号'), XLim([15*FL+1,16*FL])

subplot(3,1,2), plot(s), xlabel('n (samples)'), ylabel('Amplitude'), title('原语音信号'), XLim([15*FL+1,16*FL])

subplot(3,1,3), plot(s_rec), xlabel('n (samples)'), ylabel('Amplitude'), title('重建语音信号'), XLim([15*FL+1,16*FL])

sound(exc)

pause(2)

sound(s)

pause(2)

sound(s_rec)

pause(2)

%原始语音与合成语音的差别

figure

subplot(3,1,1), plot(exc_syn), xlabel('n (samples)'), ylabel('Amplitude'), title('合成激励信号')

subplot(3,1,2), plot(s), xlabel('n (samples)'), ylabel('Amplitude'), title('原语音信号')

subplot(3,1,3), plot(s_syn), xlabel('n (samples)'), ylabel('Amplitude'), title('合成语音信号')

sound(s)

pause(2)

sound(s_syn)

pause(2)

%变速不变调

figure

subplot(3,1,1), plot(exc_syn_v), xlabel('n (samples)'), ylabel('Amplitude'), title('合成慢速激励信号') ,XLim([0,length(exc_syn_v)])

subplot(3,1,2), plot(s), xlabel('n (samples)'), ylabel('Amplitude'), title('原语音信号'), XLim([0,length(s)])

subplot(3,1,3), plot(s_syn_v), xlabel('n (samples)'), ylabel('Amplitude'), title('合成慢速语音信号'), XLim([0,length(s_syn_v)])

sound(s)

pause(2)

sound(s_syn_v)

pause(4)

%变调不变速

figure

subplot(3,1,1), plot(exc_syn_t), xlabel('n (samples)'), ylabel('Amplitude'), title('合成高调激励信号') ,XLim([0,length(exc_syn_t)])

subplot(3,1,2), plot(s), xlabel('n (samples)'), ylabel('Amplitude'), title('原语音信号'), XLim([0,length(s)])

subplot(3,1,3), plot(s_syn_t), xlabel('n (samples)'), ylabel('Amplitude'), title('合成高调语音信号'), XLim([0,length(s_syn_t)])

sound(s)

pause(2)

sound(s_syn_t)


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/8248479.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-14
下一篇 2023-04-14

发表评论

登录后才能评论

评论列表(0条)

保存