TIMIT语音库怎么用啊

TIMIT语音库怎么用啊,第1张

TIMIT语音库有着准确的音素标注,因此可以应用于语音分割性能评价,同时该数据库又含有几百个说话人语音,所以也是评价说话人识别常用的权威语音库,但该语音库的商业用途是要花钱买的。

可以使用Audacity软件播放,然后Export,重新命名;

在Matlab里,x=wavread('新名字')

sound(x,fs) %fs要看Audacity里显示的频率了,就可以了。

很多,没有明确数量。

计算机视觉数据集1.MNIST2.ImageNet3.CIFAR4.COCO5.PASCALVOC6.FDDB。

自然语言处理数据集1.SQuAD2.MS MARCO3.Question Pairs4.Maluuba Datasets5.Maluuba NewsQA6.20 Newsgroups7.Billion Word Language Model Benchmark。

语言识别数据集:1.TIMIT2.TED-LIUM3.大型音乐分析数据集FMA4.CHIME5.LibriSpeech6.2000 HUB5 English Evaluation Transcripts7.VoxForge8.音频数据集AudioSet

本文调查GSM 讲话编制程序的影响对文本独立报告人认识表现。三个现有的GSM 讲话编码人标准被考虑了。整体TIMIT 数据库通过了通过这些编码人, 获得三个自动译码的数据库。在第一实验, 它被发现对GSM 编制程序的用途极大贬低证明和证明表现(表现在书信以各位编码人的感知讲话质量) 。在第二个实验, 特点为报告人识别系统被计算了直接地从有用的资料在编码位小河。它被发现低LPC 命令在GSM 编制程序负责对多数性能退化。由提取特点直接地从编码位小河, 我们并且设法获得报告人识别系统等效在表现到原始一个解码和重新分析讲话在执行认识之前。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/6845518.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-03-29
下一篇 2023-03-29

发表评论

登录后才能评论

评论列表(0条)

保存