MFCC（Mel倒谱参数）的维数是怎么确定的我怎么提取出12维的MFCC参数_CMS教程

MFCC维数的确定是根据你的要求来的，提取过程最后一步的DCT变换，在cos（）这个公式里，有个 i 就是你想要的那个维数。至于要多少，你自己来定。i的不同会直接影响cos函数，所以维数i越大，对应的频率也越高。

MFCC是计算语音信号的Mel频率倒谱系数,Mel频率是基于人耳听觉特性提出来的，它与Hz频率成非线性对应关系。Mel频率倒谱系数(MFCC)则是利用它们之间的这种关系，计算得到的Hz频谱特征，MFCC已经广泛地应用在语音识别领域。由于Mel频率与Hz频率之间非线性的对应关系，使得MFCC随着频率的提高，其计算精度随之下降。因此，在应用中常常只使用低频MFCC，而丢弃中高频MFCC。

MFCC参数的提取包括以下几个步骤：

 预滤波（低通）：前端带宽为300-3400Hz的抗混叠滤波器。

 A/D变换：采样频率，线性量化精度。

 预加重：通过一个一阶有限激励响应高通滤波器，使信号的频谱变得平坦，不易受到有限字长效应的影响。

 分帧：根据语音的短时平稳特性，语音可以以帧为单位进行处理，实验中选取的语音帧长为32ms，帧叠为16ms。

 加窗：采用哈明窗对一帧语音加窗，以减小吉布斯效应的影响。

 快速傅立叶变换（Fast Fourier Transformation, FFT）：将时域信号变换成为信号的功率谱。

 三角窗滤波：用一组Mel频标上线性分布的三角窗滤波器（共24个三角窗滤波器），对信号的功率谱滤波，每一个三角窗滤波器覆盖的范围都近似于人耳的一个临界带宽，以此来模拟人耳的掩蔽效应。

 求对数：三角窗滤波器组的输出求取对数，可以得到近似于同态变换的结果。

 离散余弦变换（Discrete Cosine Transformation, DCT）：去除各维信号之间的相关性，将信号映射到低维空间。

 谱加权：由于倒谱的低阶参数易受说话人特性、信道特性等的影响，而高阶参数的分辨能力比较低，所以需要进行谱加权，抑制其低阶和高阶参数。

 倒谱均值减（Cepstrum Mean Subtraction, CMS）：CMS可以有效地减小语音输入信道对特征参数的影响。

 差分参数：大量实验表明，在语音特征中加入表征语音动态特性的差分参数，能够提高系统的识别性能。可用到了MFCC参数的一阶差分参数和二阶差分参数。

采样前的低通滤波，主要是消除采样时的频谱混叠。由硬件完成。

预加重主要是提高高频的频谱分量。软件，硬件都可以完成。

预加重前，也可以用高通滤波器，消除低频噪音。

如果计算mfcc是有了预加重。之前的预加重就不要做。

采样前的硬件低通滤波是一定要做的。

计算mfcc时的滤波，看起的作用是什么？如果是进一步消除噪音，那就必须做。

以上就是关于MFCC（Mel倒谱参数）的维数是怎么确定的我怎么提取出12维的MFCC参数全部的内容，包括:MFCC（Mel倒谱参数）的维数是怎么确定的我怎么提取出12维的MFCC参数、语音信号预处理、等相关内容解答，如果想了解更多相关内容，可以关注我们，你们的支持是我们更新的动力！

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zz/10082794.html

MFCC（Mel倒谱参数）的维数是怎么确定的我怎么提取出12维的MFCC参数

发表评论

评论列表（0条）