声学特征的提取与选择是语音识别的一个重要环节,声学特征的提取既是一个信息大幅度压缩的过程,也是一个信号解卷过程,目的是使模式划分器能更好地划分。由于语音信号的时变特性,特征提取必须在一小段语音信号上进行,也即进行短时分析。
1、线性预测系数LPC
线性预测分析从人的发声机理入手,通过对声道的短管级联模型的研究,认为系统的传递函数符合全极点数字滤波器的形式,从而n时刻的信号可以用前若干时刻的信号的线性组合来估计。通过使实际语音的采样值和线性预测采样值之间达到均方差最小LMS,即可得到线性预测系数LPC。
2、倒谱系数CEP
利用同态处理方法,对语音信号求离散傅立叶变换DFT后取对数,再求反变换iDFT就可得到倒谱系数,使用倒谱可以提高特征参数的稳定性。
数据挖掘和统计分析的基础都是数学理论。数据挖掘是直接从庞大的数据中挖掘;
而统计分析则是从庞大的数据(总体)中,用随机抽样的方法抽取一部分数据(样本)。
通过分析样本数据来推测总体特性(平均、比例、标准偏差等)的统计方法,被称为推测统计学。
另外,统计学中还有记述统计学,它是一种能够正确记述并把握获得的数据特性的方法。甚至可以说,记述统计学+其他=数据挖掘。
对于多变量线性回归分析,可以regress()函数来预测变量系数。
基本用法:
[b,bint,r,rint,stats] = regress(y, X)
式中:b——变量系数
bint——bint为b的置信区间
r——残差向量
rint——rint为r的置信区间
stats——为1×3检验统计量,第一个是回归方程的置信度,即相关系数R²;第二个是F统计量;第三个是F统计量相应的p值
y——因变量向量,n×1向量
X——自变量向量,n×p向量
这是一篇硕士论文吧? 说句实话,它的建模方法有些问题,就是样本量不够大。按道理必须要大于6个样本点建模的结果才具有代表性。
不过看你这么爱研究,原理大概说一下,因为篇幅问题和界面无法编辑。
1、将业务量作为因变量,业务收入作为自变量
2、建模之所以挑了二次曲线Y=aX^2+bX+C,主要是因为R^2值比较高,相当于作者先打q后画靶子。不过也不计较了。
3、直接用二次曲线建模是比较麻烦的,但是可以将变量进行线性转换,将X^2转换成另一个变量X', 然后将X'和X进行建模,模型为Y= aX'+bX+C
4、有2种方法可以通过Excel进行求解a和b和C
先画出折线图,然后将鼠标右键点击在折线图上,选择“插入趋势线”,然后再右键点击趋势线,调整模型的种类,显示R^2值等功能都勾选上就出现了。
或者安装数据分析模块,选择“回归”功能,然后选择自变量和因变量,再点击确认即可。
以上就是关于语音的声学特征全部的内容,包括:语音的声学特征、excel2010在数据挖掘的估计里如何进行线性回归预测分析、matlab中做回归分析,怎么获得每一个预测变量的系数和p值和R方~跪求函数~等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)