[拼音]:shengmaqi
[外文]:vocoder
一种对话音进行分析和合成的编、译码器,也称话音分析合成系统或话音频带压缩系统。它主要用于数字电话通信,特别是保密电话通信。
图为人的发声系统模型。人讲话时,气流经过喉头形成声源信号,然后激励由口、鼻腔构成的声道,产生话音信号。声码器发信端的分析器首先对话音信号进行分析,提取主要话音参数:
(1)声源特性,如声带“振动-不振动”(浊-清音)、声带振动时的基本频率(基频f0);
(2)声道传输声源信号的特性。这些话音参数变化很慢,它们所占的总频带比话音本身的频带窄得多,因而对这些参数采样编码时总数码率只有几千甚至几百比特/秒,只有直接 由话音信号采样编码的数码率的十几分之一,可以通过一个普通电话信道来传输。收信端的合成器利用这些参数来合成话音。
声码器最早出现在美国贝尔实验室。这个实验室的H.W.达得利在1928年提出合成话音的设想,并于1939年在纽约世界博览会上首次表演了他取名为声码器的话音合成器。此后,话音合成的原理被用来研究压缩话音频带。声码器的研究工作不断取得进展,数码率已降到2400或1200比特/秒,甚至更低。合成后的话音质量有较大提高。在售价、结构、耗电等诸方面符合商用的声码器已经出现。中国于50年代末开始研制声码器,并已用于数字通信。
压缩频带声码器能压缩频带的根本依据是话音信 号中存在信息多余度。话音信号只要保留声源和声道的主要参量,就能保证有较高的话音清晰度。
类型采用频谱包络和基频作为参数的声码器称为信道声码器。除信道声码器外,还有多种其他类型的声码器。它们在合成话音质量、数码率和复杂程度等方面不大一样,主要的差别在于话音参数和提取这些参数的方式不同。例如,用共振峰的位置、幅度和宽度表示频谱包络的,称为共振峰声码器;利用同态滤波技术,如对话音信号进行积分变换、取对数和反变换以获得各参数的,称为同态声码器;直接编码和传输话音的基带(如取200~600赫的频带)以表征声源特性的,称为声激励声码器。此外,还有相位声码器、线性预测声码器(见线性预测编码)等。
特点声码器的明显优点是数码率低,因而适合于窄带、昂贵和劣质信道条件下的数字电话通信,能满足节约频带、节省功率和抗干扰编码的要求。低数码率对话音存储和话音加密处理也都很有利。声码器的缺点是音质不如普通数字电话好,而且工作过程较复杂,造价较高。现代声码器主要用于军队、政府以及那些值得付出代价以换取通信安全(保密)的场合。随着对人类发声机构和听觉机理的深入研究以及计算机技术和大规模集成电路的发展,声码器的音质和设备小型化将不断得到改进,并将在数字通信中得到更广泛的应用。
- 参考书目
- J.L.Flanagan,Speech Analysis Synthesis and Perception,2nd ed., Springer-Verlag, New York,1972.
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)