如何设置和使用Windows10语音识别_工具

让小娜启动语音识别设置向导，完成设置

1，在小娜框里输入“语音识别”，启动小娜匹配的“Windows 语音识别”桌面应用。“设置语音识别”的向导将被打开，点击“下一步”继续。

2，确保麦克风已正确插入电脑，然后在向导窗口中选择麦克风类型，在“头戴式麦克风”或“桌面麦克风”中选择一种，下一步；阅读正确使用麦克风的提示，下一步。

3，在收到“此计算机上的麦克风已准备就绪”之后，点击“下一步”，根据向导提示朗读文本。使用普通话可能更有利于识别率的提高。

4，接下来，可以选择“启用文档审阅”，让计算机搜索当前用户的文档、邮件等，生成语音数据库，这样可以明显提高针对当前用户语音识别的能力；一步选择语音聆听的激活模式，这里可以根据需要选择。

5，向导提示“打印语音参考卡片”，点击“查看参考表”将由 Edge 浏览器打开网页，其中有常用命令的语音格式。

6，最后，设置是否开机启动语音识别；还可以打开语音控制的教程页面（在 Edge 浏览器中），进一步学习语音控制电脑的一系列方法和技巧。

直接访问控制面板，进行语音识别相关设置。

1，除了借助小娜，还可以直接访问传统的控制面板。

点击“开始”按钮，在程序列表中导航到“W”字母——“Windows 系统”并展开，点击启动其中的“控制面板”。

2，在控制面板中，依次访问“轻松使用”——“语音识别”，即可进入语音识别设置界面，在这时可以进行“设置麦克风”、“训练计算机”等与语音识别相关的 *** 作了。

启动并使用语音识别：

语音识别设置完成后，即可随时启动语音识别，可以使用语音向计算机发出指令，也可以在文字录入界面使用语音录入文字。

可以在小娜中输入“语音识别”启动，也可以到控制面板中点击“启动语音识别”启动，相关图形界面请参考前面步骤栏目中的截图。

语音识别启动后，屏幕顶端将会出现语音 *** 控的面板，点击左侧麦克风按钮开始语音聆听；点击右侧“x”号关闭语音识别。

麦克风接收语音信号。

语音信号放大。

语音信号AD转换。

语音信号关键数据提取。

对比语音数据库寻找匹配。

生成文字显示。

摘要——提出一种有效的语音活动检测(VAD)算法来改进噪声环境中的语音识别性能。该方法基于通过作用于子带对数能量上的专门的顺序统计过滤算法(OSFs)来检测语音/非语音的散度。该算法不同于决策规则所规定的许多其他的算法。不同于基于当前帧来作决策，它在子带对数能量上使用OSFs，这使得它在噪声信号中从非语音中识别语音时，明显减少了误差概率。语音/非语音鉴别准确度的明显改进说明了所提出的VAD的有效性。这表明OSF顺序的增加导致了语音和噪声分布的较好的分离，因此使它在复杂性和性能之间得到更有效的鉴别和权衡。该算法还包含了噪声降低块与VAD相配合，并且在正确性上有了更进一步的改善。之前的噪声降低块也改进了检测语音和非语音的正确性。实验分析是在AURORA数据库上实现的，并且与像ITU G729, GSM AMR和用于分布式语音识别(DSR)的ETSI AFE那样的标准VADs和其他最近报道的VADs进行了全面的比较，同时提供了大量的性能评估。

索引词——噪声降低，鲁棒语音识别，语音/非语音检测，子带顺序统计过滤。

国内大多数语音识别技术商都在安徽合肥、北京、杭州。

当前，国内语音识别公司主要包括：科大讯飞、歌尔股份、全志科技、汉威科技、共达电声、盛视科技、海天瑞声和精伦电子。

1、科大讯飞

科大讯飞是语音识别技术的龙头企业，研发完成在深度学习新框架下的语音识别技术，识别准确率保持业界领先。

针对采访、会议、节目、授课等复杂场景下的语音转写效果持续提升，业界唯一达到实用门槛；研发完成通过较小代价提升方言和小语种识别可用性的技术路径，方言和维语、藏语识别效果大幅提升。结合麦克风阵列的远场识别、语音唤醒等关键指标相对提升达到50%以上，有效支撑万物互联下的远场人机语音交互的进一步普及。

2、歌尔股份

歌尔股份公司所处的行业为电声行业,主营业务为微型电声元器件和消费类电声产品的研发、制造和销售。

3全志科技

全志科技公司非常重视AI技术在终端场景的应用落地，现有多个产品线都可以支持包括智能语音、智能视觉等AI相关应用，未来将根据客户需求持续推出芯片产品和解决方案。

4汉威科技

汉威科技公司表示传感器的应用范围非常广泛，在感知和数据采集环节发挥重要作用，可穿戴设备将是其重要应用方向。

5共达电声

共达电声公司是专业的电声元器件及电声组件制造商和服务商、电声技术解决方案提供商。公司是专业的电声元器件及电声组件制造商、服务商和电声技术整体解决方案提供商，是国家级高新技术企业、中国电子元件百强企业。

6盛视科技

盛视科技公司在声音方面的自主研发技术包含语音采集、语音端点检测、语义分析、人机交互和声波检测与分析等。公司产品海关多功能机器人利用语音识别、自然语音处理技术等服务。

7海天瑞声

海天瑞声公司拥有基于DNN-HMM等模型的多语言语音识别技术，并掌握当前语音识别中流行的多种深度学习技术。在语音识别算法领域，公司已掌握细分技术语音数据库质量预估技术，已取得4项发明专利授权。

8精伦电子

精伦电子公司的四大主营业务包含电子通信产品、身份z阅读机具、控制类产品、云影音智能机系列产品及解决方案为四大主营业务。

根据语音识别实际应用中的不同，语音识别系统可以分为：特定人与非特定人的语音识别、独立词与连续词的语音识别、小词汇量与大词汇量以及无限词汇量的语音识别。但无论哪种语音识别系统，其基本原理和处理方法大体相同。语音识别原理语音信号输入之后，预处理和数字化是进行语音识别的前提条件。其中，预处理主要是进行预滤波，保留正常人的300～3400Hz的语音信号；数字化是要进行A/D转换及抗混叠等处理；特征提取是进行语音信号训练和识别必不可少的步骤。能够体现语音信号特征的参数包括：(1)基于LPC的倒谱参数；(2)Mel系数的倒谱参数；(3)采用前沿数字信号处理技术的特征分析手段，如小波分析、时/频域分析、人工神经网络等。本文采用基于LPC的倒谱参数表示方法，提取出的特征值存入参考模式库中，用来匹配待识别语音信号的特征值。匹配计算是进行语音识别的核心部分，由待识别人的语音经过特征提取后，与系统训练时产生的模板进行匹配，在说话人辨认中，取与待识别语音相似度最大的模型所对应的语音作为识别结果，这就是语音识别的整个过程。语音识别技术从应用类分为特定人语音识别和非特定人语音识别。特定人语音识别技术是针对指定人的语音识别，其他人的话玩具不识别，应用模式是使用前需要指定人的语音训练过程，一般按照玩具提示训练2遍语音词条，然后就可以使用了；非特定人语音识别是不用针对指定的人的识别技术，不分年龄，性别，只要说相同语言就可以，应用模式是在产品定型前按照确定的十几个语音交互词条，采集200人左右的声音样本，经过我们的PC算法处理得到交互词条的语音模型和特征数据库，然后烧录到我们的芯片上，应用我们芯片的玩具就具有交互的功能了。非特定人语音识别应用有的是基于音素的算法，这种模式下不需要采集很多人的声音样本，就可以做交互识别，但是缺点是识别率不高，识别性能不稳定。在PC领域，Microsoft的Word软件就有语音识别技术

以上就是关于如何设置和使用Windows10语音识别全部的内容，包括:如何设置和使用Windows10语音识别、手机是怎样来实现语音识别的、谁能帮我翻译下摘要关于语音识别的谢了等相关内容解答，如果想了解更多相关内容，可以关注我们，你们的支持是我们更新的动力！

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/sjk/10186832.html

如何设置和使用Windows10语音识别

发表评论

评论列表（0条）