以上均为训练过程,训练完了声学模型和语言模型就到了测试的过程。也就是本节的解码过程,也可以称为推断过程。与传统的深度学习任务不同,语音识别的解码是一个很复杂的搜索过程。用公式表示为: w^{*} = argmax{w}{(logP(w|o)} + λlogP{LM}(w) + γlen(w))
λ是语言模型的权重,λ越大表示越依赖语言模型。正常的想法是遍历所有可能词序列找到概率最大的那个座位输出结果,但是计算量太大。所以就有了各种优化的算法。比如WFST,Beam Search等。WFST是解码(测试)时的优化方法
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)