如何设置和使用Windows10语音识别

如何设置和使用Windows10语音识别,第1张

让小娜启动语音识别设置向导,完成设置

1,在小娜框里输入“语音识别”,启动小娜匹配的“Windows 语音识别”桌面应用。“设置语音识别”的向导将被打开,点击“下一步”继续。

2,确保麦克风已正确插入电脑,然后在向导窗口中选择麦克风类型,在“头戴式麦克风”或“桌面麦克风”中选择一种,下一步;阅读正确使用麦克风的提示,下一步。

3,在收到“此计算机上的麦克风已准备就绪”之后,点击“下一步”,根据向导提示朗读文本。使用普通话可能更有利于识别率的提高。

4,接下来,可以选择“启用文档审阅”,让计算机搜索当前用户的文档、邮件等,生成语音数据库,这样可以明显提高针对当前用户语音识别的能力;一步选择语音聆听的激活模式,这里可以根据需要选择。

5,向导提示“打印语音参考卡片”,点击“查看参考表”将由 Edge 浏览器打开网页,其中有常用命令的语音格式。

6,最后,设置是否开机启动语音识别;还可以打开语音控制的教程页面(在 Edge 浏览器中),进一步学习语音控制电脑的一系列方法和技巧。

直接访问控制面板,进行语音识别相关设置。

1,除了借助小娜,还可以直接访问传统的控制面板。

点击“开始”按钮,在程序列表中导航到“W”字母——“Windows 系统”并展开,点击启动其中的“控制面板”。

2,在控制面板中,依次访问“轻松使用”——“语音识别”,即可进入语音识别设置界面,在这时可以进行“设置麦克风”、“训练计算机”等与语音识别相关的 *** 作了。

启动并使用语音识别:

语音识别设置完成后,即可随时启动语音识别,可以使用语音向计算机发出指令,也可以在文字录入界面使用语音录入文字。

可以在小娜中输入“语音识别”启动,也可以到控制面板中点击“启动语音识别”启动,相关图形界面请参考前面步骤栏目中的截图。

语音识别启动后,屏幕顶端将会出现语音 *** 控的面板,点击左侧麦克风按钮开始语音聆听;点击右侧“x”号关闭语音识别。

麦克风接收语音信号。

语音信号放大。

语音信号AD转换。

语音信号关键数据提取。

对比语音数据库寻找匹配。

生成文字显示。

摘要——提出一种有效的语音活动检测(VAD)算法来改进噪声环境中的语音识别性能。该方法基于通过作用于子带对数能量上的专门的顺序统计过滤算法(OSFs)来检测语音/非语音的散度。该算法不同于决策规则所规定的许多其他的算法。不同于基于当前帧来作决策,它在子带对数能量上使用OSFs,这使得它在噪声信号中从非语音中识别语音时,明显减少了误差概率。语音/非语音鉴别准确度的明显改进说明了所提出的VAD的有效性。这表明OSF顺序的增加导致了语音和噪声分布的较好的分离,因此使它在复杂性和性能之间得到更有效的鉴别和权衡。该算法还包含了噪声降低块与VAD相配合,并且在正确性上有了更进一步的改善。之前的噪声降低块也改进了检测语音和非语音的正确性。实验分析是在AURORA数据库上实现的,并且与像ITU G729, GSM AMR和用于分布式语音识别(DSR)的ETSI AFE那样的标准VADs和其他最近报道的VADs进行了全面的比较,同时提供了大量的性能评估。

索引词——噪声降低,鲁棒语音识别,语音/非语音检测,子带顺序统计过滤。

国内大多数语音识别技术商都在安徽合肥、北京、杭州。

当前,国内语音识别公司主要包括:科大讯飞、歌尔股份、全志科技、汉威科技、共达电声、盛视科技、海天瑞声和精伦电子。

1、科大讯飞

科大讯飞是语音识别技术的龙头企业,研发完成在深度学习新框架下的语音识别技术,识别准确率保持业界领先。

针对采访、会议、节目、授课等复杂场景下的语音转写效果持续提升,业界唯一达到实用门槛;研发完成通过较小代价提升方言和小语种识别可用性的技术路径,方言和维语、藏语识别效果大幅提升。结合麦克风阵列的远场识别、语音唤醒等关键指标相对提升达到50%以上,有效支撑万物互联下的远场人机语音交互的进一步普及。

2、歌尔股份

歌尔股份公司所处的行业为电声行业,主营业务为微型电声元器件和消费类电声产品的研发、制造和销售。

3全志科技

全志科技公司非常重视AI技术在终端场景的应用落地,现有多个产品线都可以支持包括智能语音、智能视觉等AI相关应用,未来将根据客户需求持续推出芯片产品和解决方案。

4汉威科技

汉威科技公司表示传感器的应用范围非常广泛,在感知和数据采集环节发挥重要作用,可穿戴设备将是其重要应用方向。

5共达电声

共达电声公司是专业的电声元器件及电声组件制造商和服务商、电声技术解决方案提供商。公司是专业的电声元器件及电声组件制造商、服务商和电声技术整体解决方案提供商,是国家级高新技术企业、中国电子元件百强企业。

6盛视科技

盛视科技公司在声音方面的自主研发技术包含语音采集、语音端点检测、语义分析、人机交互和声波检测与分析等。公司产品海关多功能机器人利用语音识别、自然语音处理技术等服务。

7海天瑞声

海天瑞声公司拥有基于DNN-HMM等模型的多语言语音识别技术,并掌握当前语音识别中流行的多种深度学习技术。在语音识别算法领域,公司已掌握细分技术语音数据库质量预估技术,已取得4项发明专利授权。

8精伦电子

精伦电子公司的四大主营业务包含电子通信产品、身份z阅读机具、控制类产品、云影音智能机系列产品及解决方案为四大主营业务。

根据语音识别实际应用中的不同,语音识别系统可以分为:特定人与非特定人的语音识别、独立词与连续词的语音识别、小词汇量与大词汇量以及无限词汇量的语音识别。但无论哪种语音识别系统,其基本原理和处理方法大体相同。语音识别原理语音信号输入之后,预处理和数字化是进行语音识别的前提条件。其中,预处理主要是进行预滤波,保留正常人的300~3400Hz的语音信号;数字化是要进行A/D转换及抗混叠等处理;特征提取是进行语音信号训练和识别必不可少的步骤。能够体现语音信号特征的参数包括:(1)基于LPC的倒谱参数;(2)Mel系数的倒谱参数;(3)采用前沿数字信号处理技术的特征分析手段,如小波分析、时/频域分析、人工神经网络等。本文采用基于LPC的倒谱参数表示方法,提取出的特征值存入参考模式库中,用来匹配待识别语音信号的特征值。匹配计算是进行语音识别的核心部分,由待识别人的语音经过特征提取后,与系统训练时产生的模板进行匹配,在说话人辨认中,取与待识别语音相似度最大的模型所对应的语音作为识别结果,这就是语音识别的整个过程。语音识别技术从应用类分为特定人语音识别和非特定人语音识别。特定人语音识别技术是针对指定人的语音识别,其他人的话玩具不识别,应用模式是使用前需要指定人的语音训练过程,一般按照玩具提示训练2遍语音词条,然后就可以使用了;非特定人语音识别是不用针对指定的人的识别技术,不分年龄,性别,只要说相同语言就可以,应用模式是在产品定型前按照确定的十几个语音交互词条,采集200人左右的声音样本,经过我们的PC算法处理得到交互词条的语音模型和特征数据库,然后烧录到我们的芯片上,应用我们芯片的玩具就具有交互的功能了。非特定人语音识别应用有的是基于音素的算法,这种模式下不需要采集很多人的声音样本,就可以做交互识别,但是缺点是识别率不高,识别性能不稳定。在PC领域,Microsoft的Word软件就有语音识别技术

以上就是关于如何设置和使用Windows10语音识别全部的内容,包括:如何设置和使用Windows10语音识别、手机是怎样来实现语音识别的、谁能帮我翻译下摘要 关于语音识别的 谢了等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/10186832.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-06
下一篇 2023-05-06

发表评论

登录后才能评论

评论列表(0条)

保存