关于语音交互，你不得不知的技术知识_服务器

关于语音交互，你不得不知的技术知识

要更好的理解语音交互，你得了解背后的技能基础知识。十一国庆，我花了几天时间看了宗的《统计自然语音处理》，该书聚焦于语音交互的核心单元，即自然语言处理。为了更好的整理自己，我把在这本书里看到的吴军的《数学教学的好》总结出来，整理出来给求的朋友。

课文分四个单元，比较少，也比较熟练，可以出的很漂亮，但是...他们应该僵持不下。

一、语音交互的管理体系构成

二、语音交互的艰辛

三、自然语音应急响应核心技巧

四。阐述了真实感场景语音交互的技术原理

一、语音交互的构成

语音交互一般包括三个模块:

ASR(自动语音识别(ASR)，主次之分就是把噪音转换成墨水笔。

在NLP(自然语言处理)中，首要和次要的事情是把握每个人想说的话的实际含义，并得到合理的回应。

视频溶解TTS(文本到语音)，主次之分就是把墨水笔转换成声音。

统计自然语音处理给出了一个更加详细完整的人机交流管理系统的结构，包括以下六个技术模块:

1、视频语音识别器

现在真正的客户是在视频语音到墨水笔的分辨率转换中打字，分辨率效果一般输出在分数以下的前n(n≥1)个句子或词格中。(把客户频道的视频语音变成墨水笔)

2，语言解析器

停止分析掌握视频语音辨别的效果，得到打字的内在建议。(即把客户的话变成机械设备掌握的话)

3、测试结果求解模块

根据语音分析仪的分析结果，终止对测试结果的逻辑推理或查看，从而解开客户测试结果之谜。(就是解决客户考试成绩的模块，像盗用的百度搜索掠夺)

4、会话应用管理模块

它是管理系统的管理中心。一个假想的对话应用处理程序应该能够根据对话历史调整人机交互技术，辅助语音分析器准确把握视频语音辨别的效果，为考试成绩的解释提供帮助，引导语音死亡的过程。是的，会话应用处理机在人机交换管理系统中非常重要。(能够记录历史谈话数据信息，全程培训后给予客户更有力的回应)

5，语言生成器

根据分析模块得到的内部建议，会话应用处理机器已经死成了一个纯自然的语音句子。(将响应的机械设备语音重新转换为白话语音)

6、语音合成器

把死句转换成视频语音输出。(再次将白话语音转换成视频语音)

二、应对语音交互的难度

下图为知乎竞猜结果。为什么Siri听得懂我说的话，所以与其去克服，不如做出有效的反应或者精确的控制？内容，这是一个很好的例子。语音交互中最大的测试分数已经掌握在语义上，即能够准确把握客户谈话的整体目标。Siri可以很好的区分视频语音，就是它可以知道客户的消息是“明天早上9点帮我订辆出租车来企业”，但最好能掌握你们谈话的总体目标，是设置预约提醒日历，还是提前预约出租车。

但是，Siri的起源不可能比掌握客户更好:1。原对话中有几个意思，2。原对话中，滴滴打车，上了一辆车。Siri上路就认识字了。(当时嵌入了管理系统，皮带连接滴滴打车)

因此，语音交互最终需要解决的核心测试分数是歧义消除的测试分数，以及语言符号已经已知的应急响应的测试分数。

知道是哪个场景，我们已经讲过Siri对话了。当我们构思语音交互的功能时，就能抓住他们为什么不能有效响应的原因。上面这篇文章讲的是如何掌握语义。

三、自然语音应急响应核心技巧

如何让机械设备掌握“明天早上9点给我订辆出租车来企业”这句话，就像是一个2岁小孩听得懂却听不懂的故事。那么，我们是不是应该先教她怎么读这个短语:

“明天/上午/9点开会/求助/我/预约/出租车/商务”——也就是分词算法。

然后教她“明天早上9点钟见我/订辆出租车/来谈生意”的实际意义——也就是语法结构。

然后报告她那边的“保留”不是保留提醒，就是语义阐发。

首先，请在明天早上9点为我预订一辆出租车。而且我现在也不要求”——这是转移变化，也就是章阐发。

1、分词算法

单词是会话的最小单位，所以掌握一个句子的标准就是知道会话中用了哪些单词。

比如“上海大郊乡绘本书店已经在那边了”，要求拆分红色的“上海/大郊乡/绘本书店/已经/在那边”而不是“上海大郊/乡/绘本书店/已经/在那边”

以上是吴军在《数学教学之善》中同样的词性标注方法。他的话比较间接，容易理解，所以做了间接截屏。

不同词性标注的粒度是不一样的。Google的分词章节结尾使用了基础技术企业通用的分词装置，词性标注的效果对于结束掠夺恶化是有效的。前期通过刻意争取掠夺，实现了自己的词性标注管理系统。

2，句法分析

原文中的注释是，语法分析是自然语音应急处理中的核心技能之一，其根本任务是不容置疑的句子的语法结构。真的很平淡。我的知识是分词算法是把一个句子拆分成红色的word1，word2，word3，那么语法分析就是把一个句子拆分成红色的主语，宾语，宾语。

经过整个过程的语法分析，你可以很快掌握一个句子，就像你已经掌握了英语会话一样。虽然有些叙述性的词听不懂，但你们大多数人在寻找形容词、主语或宾语后，就能知道这句话的实际意思。

根据概率(或Stostic)上下文无关文法(PCFG或SCFG)的句子结构分析方法，可以使用统计分析语法分析方法，这是目前英语最成功的语法驱动程序。喜欢的话可以提前了解。

3，语义阐释

主次语义说明是词义消歧中的语义角色标注。

主次义消歧就是“果与效”一词的多义性。例如，英文单词“bank”在英语中的意思可以是“尹稚”或“堤岸”。根据人物高矮的情况主动消除歧义要求哪一种？

像“带我去北方的银行”，不管是去北方的银行还是北方的银行。

词语消歧可以分为有监督消歧和无监督消歧。在受监控的消歧方法中，我们可以根据练习数据信息知道一个多义词之间的差异以及具有特殊含义的高、短词之间的匹配关系。那么，实践中多义词语义区分的测试结果就是高、短词分类的测试结果。一旦对高矮两个词的范畴没有疑问，这个词的语义格也就没有疑问了。

在无监督的词义消歧中，由于练习数据信息已经被标注，最后一部分需要分散类优化算法的控制来终止一个统一多义词的所有上下字的等价类。如果一个单词的上下字符已经在几个等价类中，那么这个单词就被认为是多义词。然后在词义已经区分的情况下，将这个词的高低字与每个词义匹配高低字的等价类进行比较，通过全过程高低字匹配等价类的确定来判断这个词的语义。

4，章节说明

“discover”这个词经常用在章节英语中，暗示着汉语的章节和课文中经常有句子。篇章阐发的最终目的是在一个团队中掌握篇章，而最关键的任务之一就是阐发篇章结构。

在谈话的过程中，很少说话，但是当谈话有了积累，一整篇谈话就真的是一章了。所以要求掌握每句话中间的章节结构。

比如“明天早上7点给我设个闹钟。”“算了，太早了。改成8点。”那么，在掌握了几个词的结构的整个过程之后，大家都知道，要求消除前面的7点，设置一个8点。

四。人机交流管理系统的真实技巧

以上是统计自然语音处理中介绍的一种白话分析方法HMM按划分规则的统计分析方法。文章的内容展示了当时人机交换管理系统的真实技能，也暗示了那种做法存在一定的缺陷。大家只需要知道语义块按照词汇分类后，机械设备能够掌握的那种会话分析机制就可以了。

根据划分规则对HMM进行统计分析。本地分析方法是

词汇分类模块终止对其词汇的语义分类，即针对响应的语义类别设置句子中的每个词。语义块分析器从与句子匹配的词类编码序列中分析出语义块，其输出是语义块编码序列。统计分析模块从语义块的编码序列中解释语句IF所隐含的一级和二级结构。语义块标注模块将每个语义块标注为关系片段的响应。最终的IF(interchangeformat)关系是通过两个单位的企业合并得到的(国际在线翻译高级讨论联盟C-STAR接受的一个语义叫管理中心转换布局，隐含情况，有利于多语种音频翻译)。

1，如果关系布局:

说话人:言语行为[概念]*[(自变量=值[，自变量=值]*)]

《出埃及记》:明天想订一个单人。

IF:c:给定-信息预订房间(room-spec=(房间类型=单个，数量=1)，reservation-spec=(时间=(相对时间=明天)))

“如果”的意思是“C”，这句话的徒劳尝试是提供信息，主题风格是“订房”，一个“房间”中的详细信息是通过一组“特征-值”与外观相关联的:房型单一，数量为1；“排序”的细节要求整个过程中主参数“相对-时间”的出现，变量的值和“明天”。

2.词汇分类

根据词汇的语义功能，每个词汇分为不同的类别。其分类是根据词语在句子中的语义功能，将语义功能相同的词语归为一类，如“单身生活”和“单身房间”属于一个统一的语义范畴；“大”和“小”的意义不同，但语义功能没有区别。因此，它们被归为同一类。

3、语义块解释

根据语义块的具体实际意义，终止语义块的语义分类。比如，所有关于时间的表述，如“明天来临”、“后天”、“星期一”、“三天后”，都属于时间的语义组块，记为时间；“单身生活”、“单身生活”、“私人房间”、“宽敞的房间”等房屋格的表达都属于房屋类的语义块，记为ROOM_TYPE。

4、统计分析过程

标注一定数量的语料库。对于句子猜测出的每一个句子，最后终止语义组块解释，得到该句子匹配的组块编码序列。然后，得出句子的IF语义蕴涵。首先，IF语义蕴涵被线性化，语义块编码序列的两端被对齐。通过使用这些语料库来停止训练模板的主要参数，可以获得统计分析模板。

对于需要分析的语句，最后终止语义块分析，得到与该语句匹配的语义块编码序列。然后，语义块编码序列被类型化作为统计分析模板，分析模板的输出是被类型化的语句的线性化IF结构。

5，组块标注方法

当语义块已经被阐明时，可以通过全过程划分方法获得语义块。此外，还可以获得语义块内部的逻辑结构。但是，那种逻辑结构，其实并不是所有人都要求的IF提示。所以大家就构思了语义块标注模块，用它把那种逻辑结构转换成IF提示。语义组块标注模块基于组块解释模块的交互。在组块解释过程中使用的每个划分规则匹配一个划分规则的注释方法。控制这些标注方法可以将划分规则触及的词汇标注为响应IF提示。如果循环吞食语义块划分规则匹配的标注亚法语体，则可以得到语义块的IF逻辑提示。

6、IF之死

从上面的介绍可以看出，根据HMM的分析模块的结果，语义块标注的结果只是IF的片段，这暗示了IF他们的企业并购人才是完好的。语义块标注模块将每个语义块转化为IF片段，每隔一个语义块由统计分析模块进行分析，然后与有标记的标记进行匹配，有标记的标记最终作为IF蕴涵中的结。当每组企业已经合并时，IF执行器将语义块的标注作用作为连接的子连接，通过简化的应急响应将概念编码序列还原为原始的概念编码序列，从而得到IF提示。

就这样，谢谢&撒花。并推荐宗的《统计自然语音处理》一书。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zz/778495.html

关于语音交互，你不得不知的技术知识

发表评论

评论列表（0条）