if nargin<4, Nlpc = round(fs/1000)+2end
ls=length(sig) % 数据长度
Nwin = floor(ls/Nt) % 帧长
for m=1:Nt,
lpcsig = sig((Nwin*(m-1)+1):min([(Nwin*m) ls]))% 取来一帧信号
if ~isempty(lpcsig),
a = lpc(lpcsig,Nlpc)% 计算LPC系数
const=fs/(2*pi) % 常数
rts=roots(a)% 求根
k=1 % 初始化
yf = []
bandw=[]
for i=1:length(a)-1
re=real(rts(i)) % 取根之实部
im=imag(rts(i)) % 取根之虚部
formn=const*atan2(im,re)% 计算共振峰频率
bw=-2*const*log(abs(rts(i)))% 计算带宽
if formn>150 &bw <700 &formn<fs/圆冲2 % 满足条件方能成共振峰和带宽
yf(k)=formn
bandw(k)=bw
k=k+1
end
end
[y, ind]=sort(yf) % 排序
bw=bandw(ind)
F = [NaN NaN NaN] % 初始化
F(1:min(3,length(y))) = y(1:min(3,length(y)))% 输出最多三个
F = F(:)% 按列输出
fmt(:,m)=F/(fs/2) % 归一化频率
end
end
from 《matlab在语音信号猜腔慎分析与穗敬合成中的应用》
%% 清空环境变量clc
clear
%% 训练数据预测数据提取及归一化
%下载四类语音信号
load data1 c1
load data2 c2
load data3 c3
load data4 c4
%四个特征信号矩阵合汪扰成一个矩阵
data(1:500,:)=c1(1:500,:)
data(501:1000,:)=c2(1:500,:)
data(1001:1500,:)=c3(1:500,:)
data(1501:2000,:)=c4(1:500,:)
%从1到2000间随机排序
k=rand(1,2000)
[m,n]=sort(k)
%输入输出数坦悔据
input=data(:,2:25)
output1 =data(:,1)
%把输出从1维变成4维
for i=1:2000
switch output1(i)
case 1
output(i,:)=[1 0 0 0]
case 2
output(i,:)=[0 1 0 0]
case 3
output(i,:)=[0 0 1 0]
case 4
output(i,:)=[0 0 0 1]
end
end
%随机提取1500个样本为训练样本,500个样本为预测样本
input_train=input(n(1:1500),:)'
output_train=output(n(1:1500),:)'
input_test=input(n(1501:2000),:)'
output_test=output(n(1501:2000),:)'
%输入数据归一化
[inputn,inputps]=mapminmax(input_train)
%% 网络结构初始化
innum=24
midnum=25
outnum=4
%权值初始化
w1=rands(midnum,innum)
b1=rands(midnum,1)
w2=rands(midnum,outnum)
b2=rands(outnum,1)
w2_1=w2w2_2=w2_1
w1_1=w1w1_2=w1_1
b1_1=b1b1_2=b1_1
b2_1=b2b2_2=b2_1
%学习率
xite=0.1
alfa=0.01
%% 网络训练
for ii=1:10
E(ii)=0
for i=1:1:1500
%% 网络预测输出
x=inputn(:,i)
% 隐含层输出
for j=1:1:midnum
I(j)=inputn(:,i)'*w1(j,:)'+b1(j)
Iout(j)=1/(1+exp(-I(j)))
end
% 输出层输困信旦出
yn=w2'*Iout'+b2
%% 权值阀值修正
%计算误差
e=output_train(:,i)-yn
E(ii)=E(ii)+sum(abs(e))
%计算权值变化率
dw2=e*Iout
db2=e'
for j=1:1:midnum
S=1/(1+exp(-I(j)))
FI(j)=S*(1-S)
end
for k=1:1:innum
for j=1:1:midnum
dw1(k,j)=FI(j)*x(k)*(e(1)*w2(j,1)+e(2)*w2(j,2)+e(3)*w2(j,3)+e(4)*w2(j,4))
db1(j)=FI(j)*(e(1)*w2(j,1)+e(2)*w2(j,2)+e(3)*w2(j,3)+e(4)*w2(j,4))
end
end
w1=w1_1+xite*dw1'
b1=b1_1+xite*db1'
w2=w2_1+xite*dw2'
b2=b2_1+xite*db2'
w1_2=w1_1w1_1=w1
w2_2=w2_1w2_1=w2
b1_2=b1_1b1_1=b1
b2_2=b2_1b2_1=b2
end
end
%% 语音特征信号分类
inputn_test=mapminmax('apply',input_test,inputps)
for ii=1:1
for i=1:500%1500
%隐含层输出
for j=1:1:midnum
I(j)=inputn_test(:,i)'*w1(j,:)'+b1(j)
Iout(j)=1/(1+exp(-I(j)))
end
fore(:,i)=w2'*Iout'+b2
end
end
%% 结果分析
%根据网络输出找出数据属于哪类
for i=1:500
output_fore(i)=find(fore(:,i)==max(fore(:,i)))
end
%BP网络预测误差
error=output_fore-output1(n(1501:2000))'
%画出预测语音种类和实际语音种类的分类图
figure(1)
plot(output_fore,'r')
hold on
plot(output1(n(1501:2000))','b')
legend('预测语音类别','实际语音类别')
%画出误差图
figure(2)
plot(error)
title('BP网络分类误差','fontsize',12)
xlabel('语音信号','fontsize',12)
ylabel('分类误差','fontsize',12)
%print -dtiff -r600 1-4
k=zeros(1,4)
%找出判断错误的分类属于哪一类
for i=1:500
if error(i)~=0
[b,c]=max(output_test(:,i))
switch c
case 1
k(1)=k(1)+1
case 2
k(2)=k(2)+1
case 3
k(3)=k(3)+1
case 4
k(4)=k(4)+1
end
end
end
%找出每类的个体和
kk=zeros(1,4)
for i=1:500
[b,c]=max(output_test(:,i))
switch c
case 1
kk(1)=kk(1)+1
case 2
kk(2)=kk(2)+1
case 3
kk(3)=kk(3)+1
case 4
kk(4)=kk(4)+1
end
end
%正确率
rightridio=(kk-k)./kk
% 语音合成clear all,close all, clc
% 定义常数
FL = 80 % 帧长
WL = 240 % 窗长
P = 10% 预测系数个数
[s,fs] = wavread('C:\MATLAB7\work\voice.wav')% 载入语音s
s = s/max(s) %归一化
L = length(s) % 读入语音长度
FN = floor(L/FL)-2% 计算帧数
% 预测和重建滤波器
exc = zeros(L,1) % 激励信号(预测误差)
zi_pre = zeros(P,1) % 预测滤波器的状态
s_rec = zeros(L,1)% 重建语音
zi_rec = zeros(P,1)
% 合成滤波器
exc_syn = zeros(L,1) % 合成的激励信号(脉冲串颤友型)
s_syn = zeros(L,1)% 合成语音
last_syn = 0 %存储上一个(或多个)段的最后一个脉冲的下标
zi_syn = zeros(P,1) % 合成滤波器的状态
% 变调不变速滤波器
exc_syn_t = zeros(L,1) % 合成的激励告碰信号(脉冲串)
s_syn_t = zeros(L,1)% 合成语音
last_syn_t = 0 %存储上一个(或多个)段的最后一个脉冲的下标
zi_syn_t = zeros(P,1) % 合成滤波器的状态
% 变速不变调滤波器(假设速度减慢一倍)
v=.5
exc_syn_v = zeros(v\L,1) % 合成的激励信号(脉冲串)
s_syn_v = zeros(v\L,1)% 合成语茄猜音
last_syn_v = 0 %存储上一个(或多个)段的最后一个脉冲的下标
zi_syn_v = zeros(P,1) % 合成滤波器的状态
hw = hamming(WL) % 汉明窗
% 依次处理每帧语音
for n = 3:FN
% 计算预测系数
s_w = s(n*FL-WL+1:n*FL).*hw %汉明窗加权后的语音
[A E] = lpc(s_w, P) %用线性预测法计算P个预测系数
% A是预测系数,E会被用来计算合成激励的能量
if n == 27
% (3) 观察预测系统的零极点图
zplane(1,A)
end
s_f = s((n-1)*FL+1:n*FL) % 本帧语音,下面就要对它做处理
% (4) 用自带filter函数s_f计算激励,注意保持滤波器状态
[exc1,zi_pre] = filter(A,1,s_f,zi_pre)%最终值zi_pre保留下来提供给下一组数据运算,就能维持输出数据的连续性。exc1为激励
exc((n-1)*FL+1:n*FL) = exc1%计算得到的激励
% (5) 用filter函数和exc重建语音,注意保持滤波器状态
[s_rec1,zi_rec] = filter(1,A,exc1,zi_rec)
s_rec((n-1)*FL+1:n*FL) = s_rec1%计算得到的重建语音
% 注意下面只有在得到exc后才会计算正确
s_Pitch = exc(n*FL-222:n*FL)
PT = findpitch(s_Pitch) % 计算基音周期PT(不要求掌握)
G = sqrt(E*PT) % 计算合成激励的能量G(不要求掌握)
%方法3:本段激励只能修改本段长度
tempn_syn = [1:n*FL-last_syn]'
exc_syn1 = zeros(length(tempn_syn),1)
exc_syn1(mod(tempn_syn,PT)==0) = G%某一段算出的脉冲
exc_syn1 = exc_syn1((n-1)*FL-last_syn+1:n*FL-last_syn)
[s_syn1,zi_syn] = filter(1,A,exc_syn1,zi_syn)
exc_syn((n-1)*FL+1:n*FL) = exc_syn1 %计算得到的合成激励
s_syn((n-1)*FL+1:n*FL) = s_syn1 %计算得到的合成语音
last_syn = last_syn+PT*floor((n*FL-last_syn)/PT)
% (11) 不改变基音周期和预测系数,将合成激励的长度增加一倍,再作为filter
% 的输入得到新的合成语音,听一听是不是速度变慢了,但音调没有变。
FL_v = floor(FL/v)
tempn_syn_v = [1:n*FL_v-last_syn_v]'
exc_syn1_v = zeros(length(tempn_syn_v),1)
exc_syn1_v(mod(tempn_syn_v,PT)==0) = G%某一段算出的脉冲
exc_syn1_v = exc_syn1_v((n-1)*FL_v-last_syn_v+1:n*FL_v-last_syn_v)
[s_syn1_v,zi_syn_v] = filter(1,A,exc_syn1_v,zi_syn_v)
last_syn_v = last_syn_v+PT*floor((n*FL_v-last_syn_v)/PT)
exc_syn_v((n-1)*FL_v+1:n*FL_v) =exc_syn1_v %计算得到的加长合成激励
s_syn_v((n-1)*FL_v+1:n*FL_v) = s_syn1_v %计算得到的加长合成语音
% (13) 将基音周期减小一半,将共振峰频率增加150Hz~
PT1 =floor(PT/3) %减小基音周期
poles = roots(A)
deltaOMG = 240*2*pi/8000
for p=1:10 %增加共振峰频率,实轴上方的极点逆时针转,下方顺时针转
if imag(poles(p))>0 poles(p) = poles(p)*exp(j*deltaOMG)
elseif imag(poles(p))<0 poles(p) = poles(p)*exp(-j*deltaOMG)
end
end
A1=poly(poles)
if n==27
figure
zplane(1,A1)
end
tempn_syn_t = [1:n*FL-last_syn_t]'
exc_syn1_t = zeros(length(tempn_syn_t),1)
exc_syn1_t(mod(tempn_syn_t,PT1)==0) = G%某一段算出的脉冲
exc_syn1_t = exc_syn1_t((n-1)*FL-last_syn_t+1:n*FL-last_syn_t)
[s_syn1_t,zi_syn_t] = filter(1,A1,exc_syn1_t,zi_syn_t)
exc_syn_t((n-1)*FL+1:n*FL) = exc_syn1_t %计算得到的合成激励
s_syn_t((n-1)*FL+1:n*FL) = s_syn1_t %计算得到的合成语音
last_syn_t = last_syn_t+PT1*floor((n*FL-last_syn_t)/PT1)
end
% (6) s ,exc 和 s_rec 的区别
figure
subplot(3,1,1), plot(exc), xlabel('n (samples)'), ylabel('Amplitude'), title('激励信号')
subplot(3,1,2), plot(s), xlabel('n (samples)'), ylabel('Amplitude'), title('原语音信号')
subplot(3,1,3), plot(s_rec), xlabel('n (samples)'), ylabel('Amplitude'), title('重建语音信号')
figure
subplot(3,1,1), plot(exc), xlabel('n (samples)'), ylabel('Amplitude'), title('激励信号'), XLim([15*FL+1,16*FL])
subplot(3,1,2), plot(s), xlabel('n (samples)'), ylabel('Amplitude'), title('原语音信号'), XLim([15*FL+1,16*FL])
subplot(3,1,3), plot(s_rec), xlabel('n (samples)'), ylabel('Amplitude'), title('重建语音信号'), XLim([15*FL+1,16*FL])
sound(exc)
pause(2)
sound(s)
pause(2)
sound(s_rec)
pause(2)
%原始语音与合成语音的差别
figure
subplot(3,1,1), plot(exc_syn), xlabel('n (samples)'), ylabel('Amplitude'), title('合成激励信号')
subplot(3,1,2), plot(s), xlabel('n (samples)'), ylabel('Amplitude'), title('原语音信号')
subplot(3,1,3), plot(s_syn), xlabel('n (samples)'), ylabel('Amplitude'), title('合成语音信号')
sound(s)
pause(2)
sound(s_syn)
pause(2)
%变速不变调
figure
subplot(3,1,1), plot(exc_syn_v), xlabel('n (samples)'), ylabel('Amplitude'), title('合成慢速激励信号') ,XLim([0,length(exc_syn_v)])
subplot(3,1,2), plot(s), xlabel('n (samples)'), ylabel('Amplitude'), title('原语音信号'), XLim([0,length(s)])
subplot(3,1,3), plot(s_syn_v), xlabel('n (samples)'), ylabel('Amplitude'), title('合成慢速语音信号'), XLim([0,length(s_syn_v)])
sound(s)
pause(2)
sound(s_syn_v)
pause(4)
%变调不变速
figure
subplot(3,1,1), plot(exc_syn_t), xlabel('n (samples)'), ylabel('Amplitude'), title('合成高调激励信号') ,XLim([0,length(exc_syn_t)])
subplot(3,1,2), plot(s), xlabel('n (samples)'), ylabel('Amplitude'), title('原语音信号'), XLim([0,length(s)])
subplot(3,1,3), plot(s_syn_t), xlabel('n (samples)'), ylabel('Amplitude'), title('合成高调语音信号'), XLim([0,length(s_syn_t)])
sound(s)
pause(2)
sound(s_syn_t)
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)