海天瑞声的语音识别数据库和语音合成数据库有什么区别啊?

海天瑞声的语音识别数据库和语音合成数据库有什么区别啊?,第1张

人机语音交互技术,粗略说来,包含语音识别(声音转文字)和语音合成(文字转声音)两种技术。语音识别指电脑分析人的语音,将之转换为文字,从而代替键盘输入。而准确的识别,还包含了自然语言理解技术。与语音识别对应的是电脑将文字转换为语音的合成技术。语音识别数据库,就是用来训练语音识别引擎的训练语料;语音合成数据库,是用来训练语音合成引擎的训练语料。一般来说,训练语料规模越大、语料音素设计、性别年龄等因素考虑的越合理,训练效果就越好。海天瑞声最大的优势,就是多语种的语音合成和语音识别训练语料数据资源。

1、用audioread('')函数读取电脑中的音频文件,参数是音频文件的路径:

[sampledata,FS] = audioread('F:1.mp3')

sampledata保存音频信号数据,FS是音频采样率,MP3格式的采样率一般为44100;

2、判断音频数据是否是双声道,如果是双声道则保留一个声道的数据,用calsample.m文件的函数完成此功能,文件内容如下:

function sample = calsample(sampledata,FS)

temp_sample = resample(sampledata,1,FS/11025)

[m,n] = size(temp_sample)

if (n == 2)

sample = temp_sample(:,1)

else

sample = temp_sample

end

end

data,意思为“数据”。

这个文件夹如果属于系统文件夹,是不能删除的,否则会影响系统的稳定性,或者无法正常运行系统;

如果是某个正在使用的应用软件下的文件夹,也不能删除,否则应用软件存放的数据将丢失。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/6773602.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-03-28
下一篇 2023-03-28

发表评论

登录后才能评论

评论列表(0条)

保存