MEITRON模型技术是百度地图语音定制的关键技术

MEITRON模型技术是百度地图语音定制的关键技术,第1张

(文章来源:砍柴网)

从技术角度看,要实现这种极受欢迎的语音定制,地图软件的制作技术必须要跨越三大门槛:灵活的音色转换、朗读的多情感化、语音的韵律迁移。而目前能够跨越这些技术障碍的,只有百度一家。

据了解,百度为实现语音定制,在AI技术领域独创了风格迁移技术Meitron模型。该模型能够以按照不同的情感模式来合成语音;并能够根据一个人的声音特征,合成出不同的讲话风格;甚至能够依靠少量的样本语音,来合成符合一个人讲话特征的专属音库。为了展示Meitron模型的高超能力,百度在今年5月还通过语音合成技术,利用少量的录音材料,专门为某位抗战老兵“再造”了栩栩如生的讲话声音,让他的老战友们能在时空中与其“重逢”。

再现“奇迹”的Meitron模型技术,实际上是一种端到端建模的注意力模型。这种模型具有语言语音一体化建模的优势,能够大幅提升语音识别率,并能高效率地实现在嵌入式场合的语音应用。目前,这种注意力模型是语音识别与合成行业里,各大巨头纷纷投入大量资源进行研发的重点。但是除了百度外,其他公司都还没能在主流产品上广泛应用这种技术。在全球同行业中,百度首家实现了在全线产品中都统一采用基于注意力机制的端到端语音识别建模。

Meitron模型的实际应用,以及用户语音定制功能的推出,标志着百度不但在工业级别上实现了对基于注意力机制的端到端语音识别建模的大规模应用,而且将这种技术普及到了“民用层面”,对产品使用体验的提升,具有重大意义。

欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/dianzi/2558570.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-08-06
下一篇 2022-08-06

发表评论

登录后才能评论

评论列表(0条)

保存