海天瑞声的语音识别数据库和语音合成数据库有什么区别啊？_sql

人机语音交互技术，粗略说来，包含语音识别（声音转文字）和语音合成（文字转声音）两种技术。语音识别指电脑分析人的语音，将之转换为文字，从而代替键盘输入。而准确的识别，还包含了自然语言理解技术。与语音识别对应的是电脑将文字转换为语音的合成技术。语音识别数据库，就是用来训练语音识别引擎的训练语料；语音合成数据库，是用来训练语音合成引擎的训练语料。一般来说，训练语料规模越大、语料音素设计、性别年龄等因素考虑的越合理，训练效果就越好。海天瑞声最大的优势，就是多语种的语音合成和语音识别训练语料数据资源。

1、用audioread('')函数读取电脑中的音频文件，参数是音频文件的路径：

[sampledata,FS] = audioread('F:1.mp3')

sampledata保存音频信号数据，FS是音频采样率，MP3格式的采样率一般为44100；

2、判断音频数据是否是双声道，如果是双声道则保留一个声道的数据，用calsample.m文件的函数完成此功能，文件内容如下：

function sample = calsample(sampledata,FS)

temp_sample = resample(sampledata,1,FS/11025)

[m,n] = size(temp_sample)

if (n == 2)

sample = temp_sample(:,1)

else

sample = temp_sample

end

data，意思为“数据”。

这个文件夹如果属于系统文件夹，是不能删除的，否则会影响系统的稳定性，或者无法正常运行系统；

如果是某个正在使用的应用软件下的文件夹，也不能删除，否则应用软件存放的数据将丢失。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/sjk/6773602.html

海天瑞声的语音识别数据库和语音合成数据库有什么区别啊？

发表评论

评论列表（0条）