语音识别技术(AutomaTIc Speech RecogniTIon,ASR)的功能是将人类语音中的词汇内容以按键、二进制编码或字符序列转换为计算机可读的输入信息。长久以来,人类梦寐以求的事情是与机器进行语音交流,让机器明白自己在说什么。作为一种伴随信息革命诞生的新兴交叉技术,语音识别旨在引导机器通过识别和理解过程,把语音信号转变为相应的文本或命令。
20世纪50年代,人类开始了对语音识别系统的研究,伦敦学院(College of London)的Denes率先将 语法概率应用于语音识别,随后卡内基·梅隆大学的李开复博士率先提出了第一个基于隐马尔可夫模型(Hidden Markov Mod-el)的大词汇量语音识别系统Sphinx,这一系统的发明帮助他获得了1988年“美国商业周刊最重要发明奖”,也奠定了后来语音识别技术的研究框架。
进入21世纪以来,全球范围内语音识别技术的发展风生水起、方兴未艾,逐渐从实验室迈向大众消费市场,在手机、家电、医疗、工业、通信、汽车电子、家庭服务等诸多领域应用广泛。在未来的智能网联汽车应用场景中,很多研究者和创业公司都希望将语音识别技术应用进来,他们会经常描绘一个场景:用户只要对着手机说话,汽车就会自动从车库开到你的面前来接你上班。
语音识别领域的创业项目非常容易受到投资机构的青睐,不论是在一级股权投资市场还是在二级证券市场,科大讯飞、思必驰、云知声、得意音通等公司先后完成了多轮融资,它们代表了国内目前在智能语音技术研究、软件及芯片产品开发、声纹识别和语音信息服务以及电子政务等领域的最高水平,并且在教育、医疗、家电和金融等领域获得越来越多的应用机会。由于汽车车厢内处于噪声环境,因此对语音识别的降噪要求会更高,这也是目前语音识别技术还需进一步提高的地方。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)