谁能给我简单介绍一下HTK

谁能给我简单介绍一下HTK,第1张

应用HTK建立连续语音识别系统 ------------王风娜 基本棚物内容知识回顾 HTK工具包 基于HMM的连续语音识别 应用HTK建立连续语音识别系统实例 知识回顾 HTK工具包数据准备工具 HDMan、HCopy、HLEd、HSGen、兆答HBuild、HLStats 、HParse 模型训练及优化工具 HERest、HInit、HRest、HHEd、HCompV 识别工具 HVite 性能评估工具 HResults、HRec 基于HMM的连续语音识别系统 HMM 三个基本问题:推理、学习、识别 模型初始状态 转移矩阵 λ ={π, A, B} 状态产生观测向 量的概率分布 连续语音识别模型结构:混合HMM(见附) 建模单元:可根据实际问题选择,对于大词汇量选择音素,进而扩展到三音素(词内或词间) 三音素捆绑:解决训练数据不足问题基于数据的状态聚类:自底向上,不能给不可见音素建模(欧氏距离) 基于决策树的聚类:自顶向下,能为不可见音素建模(见附) 嵌入式训练:训练语音必须有对应的抄本文件 嵌入式识别: p(w) p(O| w) w* = argmaxp(w| O) = argmax p(O) w w 识别网络及N-gram语言模型 识别结果评估: N ?D?S ×100% Correct= N Accuracy = N ?D?S?I × 100 % N 应用HTK建立连续语音识别的实例数据准备 创建模型及学习单音素模型 三音素模型 状态捆绑 增加高斯混合模型的个族和慧数 识别及评估 数据准备训练及待识别语音文件(.wav) 训练语音包含的所有词(wlist) 训练语音的词级标注文件(.lab 或 word.mlf) wlist中词的发音词典dict(见附) HDMan -m -w wlist -n monophones1 -l dlog dict beep names 训练语音的音素级标注文件(.lab 或 phones.mlf) HLEd .led 生成音素序列文件phones0(不包含sp)、phones1(包含sp) 训练语音的特征文件(.mfc、.plp等) HCopy config 训练语音词级网络wdnet(见附) HPRase HBuild HParse 创建模型及学习(逐步细化) 1、单音素模型: Proto文件:定义模型拓扑结构 3-state left-right HCompV:统计训练数据全局均值、方差 HCompV -C config -f 0.01 -m -S train.scp -M hmm0 proto hmm0(marcos、hmmdef) HERest: X3 hmm3 HERest -C config -I phones0.mlf -t 250.0 150.0 1000.0 -S train.scp -H hmm0/macros –H hmm0/hmmdefs -M hmm1 phones0 2、固定静音的单音素模型加入sil、sp模型 捆绑sil和sp模型 hmm4 hmm5 HHEd -H hmm4/macros -H hmm4/hmmdefs -M hmm5 sil.hed phones1 HERest: X2 hmm7 (phones1) 3、训练数据的重组:解决多音现象 HVite:得到更好的音素级标注文件aligned.mlf HVite -l ’*’ -o SWT -b silence -C config -a -H hmm7/macros -H hmm7/hmmdefs -i aligned.mlf -m -t 250.0 -y lab -I words.mlf -S train.scp dict phones1 HERest: X2 hmm9(phones1) Error:can’t find tee model at the start and end of the sentence. 4、三音素模型三音素标注文件wintri.mlf HLEd -n triphones1 -l ’*’ -i wintri.mlf mktri.led aligned.mlf sil th ih s sp m ae n sp ... 扩展为 sil th+ih th-ih+s ih-s sp m+ae m-ae+n ae-n sp ... 三音素模型 HHEd -B -H hmm9/macros -H hmm9/hmmdefs -M hmm10 mktri.hed phones1 HERest: X2 -s stats hmm12(triphones) 5、三音素捆绑 HHEd: HHEd -B -H hmm12/macros -H hmm12/hmmdefs -M hmm13 tree.hed triphones1 >log HERest: X2 hmm15(tiedlist) 6、增加混合高斯模型个数 Increase the mixture HHEd -H hmm15/macros -H hmm15/hmmdefs -M hmm16 increasemix.hed tailist increasemix.hed: HERest X2 MU +2 {*.state[2-4].mix} hmm18(tiedlist) 可根据实际问题需要适当增加高斯模型个数 识别及评估识别HVite HVite -H hmm15/macros -H hmm15/hmmdefs -S test.scp -l ’*’ -i recout.mlf -w wdnet -p 0.0 -s 5.0 dict tiedlist 词级、音素级、三音素级识别结果 评估 HResults -I testref.mlf tiedlist recout.mlf >result 附: 模型结构:混合HMM 决策树捆绑: 返回 词典dict 返回 识别网络 返回 The End!

2、软件分布路径和用途

?1)基础目录(C:\WDMACS):存放全部可执行文件,监控系统其它软件和数据文件通常是存放于该基础目录的子目录。

?2)本地目录(C:\WDMACS\LOCAL):存放过程数据库文件总文件(SUC)和系统安全保护文件。

?3)数据库目录(C:\WDMACS\DDB):存放过程数据库文件,数据库管理组态文件。

?4)图形目录(C:\WDMACS\PIC):存放绘图和显示程序使用的图形复盖和块状态显示文件。

?5)应用文件目录(C:\WDMACS\APP):建立应用程序及相应的数据文件。

?6)历史目录(C:\WDMACS\HTK):存放历史、趋势、应用三个程序的组态文件。

?7)历史数据(C:\WDMACS\HTRDATA):存放历史数据文件。

?8)报警(C:\WDMACS\RCC):存放报警数据文件。

?3、系统启动和自动加载执行的程序:

?1)报警文件任务(WALMFILE.EXE):接收报警信息并将它们存入文件。

?2)报警一览任务(WALMSUM.EXE):按报警一览链接接收报警以进行显示。

?3)报警管理(WNAM.EXE):向各节点分发报警信息。

?4)对话监视(者悔WSEMON.EXE):监视系统的对话状态,在对话中断时产生报警信息,同时试图再次接通。

?5)启动对话(WSTRTSES.EXE):在启基卜动时,接通组态文件中列出的对话。

?6)数据库服务(WDBASRV.EXE):回答系统中的数据请求。

?7)扫描、报警及控制(WSACTASK.EXE):根据设备首锋正映象表(DIT)更新数据库,向DIT写数据及执行数据库链逻辑。

?8)历史采集(HTC EXE):根据设定要求采集历史数据。

_眉扑慊砍〉鼗肪臣嗫叵低骋盐榷ㄔ诵卸嗄辏蕴岣叩缒曰炕肪成璞傅募嗫厮胶透谋湮す芾淼南肿炊计鹆嘶淖饔茫行幕康募扑慊巴缦低成璞傅陌踩煽抗ぷ魈峁┝肆己玫幕肪场?


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/tougao/12329397.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-24
下一篇 2023-05-24

发表评论

登录后才能评论

评论列表(0条)

保存