计算机是如何识别C语言的

计算机是如何识别C语言的,第1张

计算机是不能直接识别C语言的,它需要经过特殊的编译器,编译之后的二进制才能被计算机识别,计算机只能识别二进制代码。

整个程序的编译过程中有三个角色:程序员——编译器——计算机。

程序员和编译器之间的交流是C语言,同时编译器也能把C语言经过翻译成二进制指令。编译器相当于程序员和计算机之间的翻译官。

一个C语言程序的过程有以下步骤:

一、程序员使用C语言编写代码;

二、编译把代码翻译成二进制指令;这里也有四个步骤:

a预处理,这里主要处理头文件,和程序中的一些宏代码;

b编译,主要是把每个C语言文件编译成二进制目标代码;

c链接,把上一步生成的目标代码和库文件进行链接,最终生成可执行程序。

以上就是C语言到计算机可识别代码的转换过程。

HTK是英国剑桥大学开发的一套基于C语言的语音处理工具箱,广泛应用于语音识别、语音合成、字符识别和DNA排序等领域文中主要介绍了HTK的基本原理和软件结构,并且针对HTK工具箱进行了二次开发,设计开发了一套完整的语音识别输入系统及其相应的测试平台,并验证了该语音识别系统的识别率,实验表明,该系统取得了较好的语音输入效果

麦克阿瑟语音是一种基于技术的语音合成系统,可以将文字转换为自然语言,并通过语音播放出来。想要使用麦克阿瑟语音进行语音合成,需要完成以下几个步骤:

1 注册并登录麦克阿瑟语音账号。在注册时需要提供一些基本信息,如邮箱地址、密码等。

2 创建自己的语音合成项目。在项目中需要设置一些参数,如语音合成的目标语言、声音风格等。

3 编辑待合成的文本。将需要合成的文本输入到项目中,并根据需要进行一些文本编辑 *** 作。

4 进行语音合成 *** 作。在文本编辑完成后,选择语音合成的方式,可以通过Web API、SDK等方式进行。

5 播放语音文件。语音合成完成后,可以将生成的语音文件下载到本地,然后通过调用播放器进行播放 *** 作。

需要注意的是,在使用麦克阿瑟语音进行语音合成时,应该尽量避免使用与法律、社会公德以及道德伦理相悖的内容,以避免引发不必要的纷争和问题。同时,也需要保护好个人隐私,不要泄露个人敏感信息给未经授权的第三方。

语音识别是完成语音到文字的转换。自然语言理解是完成文字 到语义的转换。语音合成是用语音方式输出用户想要的信息,用语音实现人与计算机之间的交互,主要包括语音识别、自然语言理解和语音合成。

相对于机器翻译,语音识别是更加困难的问题。机器翻译系统的输入通常是印刷文本,计算 机能清楚地区分单词和单词串。而语音识别系统的输入是语音,其复杂度要大得多,特别是口语 有很多的不确定性。人与人交流时,往往是根据上下文提供的信息猜测对方所说的是哪一个单 词,还可以根据对方使用的音调、面部表情和手势等来得到很多信息。特别是说话者会经常更正所说过的话,而且会使用不同的词来重复某些信息。显然,要使计算机像人一样识别语音是很困难的。 

语音识别过程包括从一段连续声波中采样,将每个采样值量化,得到声波的压缩数字化表 示。采样值位于重叠的帧中,对于每一帧,抽取出一个描述频谱内容的特征向量。然后,根据语音信号的特征识别语音所代表的单词,语音识别过程主要分为五步,如下:

01

语音信号采集

语音信号采集是语音信号处理的前提。语音通常通过话筒输入计算机。话筒将声波转换为 电压信号,然后通过A/D装置(如声卡)进行采样,从而将连续的电压信号转换为计算机能够处理的数字信号。

目前多媒体计算机已经非常普及,声卡、音箱、话筒等已是个人计算机的基本设备。其中声 卡是计算机对语音信进行加工的重要部件,它具有对信号滤波、放大、A/D和D/A转换等功 能。而且,现代 *** 作系统都附带录音软件,通过它可以驱动声卡采集语音信号并保存为语音文件。

对于现场环境不好,或者空间受到限制,特别是对于许多专用设备,目前广泛采用基于单片机、DSP芯片的语音信号采集与处理系统。

02

语音信号预处理

语音信号号在采集后首先要进行滤波、A/D变换,预加重(Preemphasis)和端点检测等预处理, 然后才能进入识别、合成、增强等实际应用。

滤波的目的有两个:一是抑制输入信号中频率超出//2的所有分量(/:为采样频率),以防止 混叠干扰;二是抑制50 Hz的电源工频干扰。因此,滤波器应该是一个带通滤波器。

A/D变换是将语音模拟信号转换为数字信号。A/D变换中要对信号进行量化,量化后的信 号值与原信号值之间的差值为量化误差,又称为量化噪声。

预加重处理的目的是提升高频部分,使信号的频谱变得平坦,保持在低频到高频的整个频带 中,能用同样的信噪比求频谱,便于频谱分析。

端点检测是从包含语音的一段信号中确定出语音的起点和终点。有效的端点检测不仅能减 少处理时间,而且能排除无声段的噪声干扰。目前主要有两类方法:时域特征方法和频域特征方 法。时域特征方法是利用语音音量和过零率进行端点检测,计算量小,但对气音会造成误判,不 同的音量计算也会造成检测结果不同。频域特征方法是用声音的频谱的变异和熵的检测进行语 音检测,计算量较大。

03

语音信号的特征参数提取

人说话的频率在10 kHz以下。根据香农采样定理,为了使语音信号的采样数据中包含所需单词的信息,计算机的采样频率应是需要记录的语音信号中包含的最高语音频率的两倍以上。一般将信号分割成若干块,信号的每个块称为帧,为了保证可能落在帧边缘的重要信息不会丢失,应该使帧有重叠。例如,当使用20kH的采样频率时,标准的一帧为10 ms,包含200个采样值。

话筒等语音输入设备可以采集到声波波形。虽然这些声音的波形包含了所 需单词的信息,但用肉眼观察这些波形却得不到多少信息因此,需要从采样数据中抽取那些能 够帮助辨别单词的特征信息。在语音识别中,常用线性预测编码 技术抽取语音特征。

线性预测编码的基本思想是:语音信号采样点之间存在相关性,可用过去的若干采样点的线 性组合预测当前和将来的采样点值。线性预测系数埽以通过使预测信号和实际信号之间的均方误差最小来唯一确定。

语音线性预测系数作为语音信号的一种特征参数,已经广泛应用于语音处理各个领域。

04

向置量化

向量量化(Vector Quantization,VQ)技术是20世纪W年代后期发展起来的一种数据压缩和 编码技术。经过向量量化的特征向量也可以作为后面隐马尔可夫模型中的输入观察符号。

在标量量化中整个动态范围被分成若干个小区间,每个小区间有一个代表值,对于一个输入 的标量信号,量化时落入小区间的值就用这个代表值>[戈替。因为这时的信号量是一维的标量,所 以称为标量量化。

向量量化的概念是用线性空间的观点[,把标量改为一维的向量,对向量进行量化。和标量量化一样,向量量化是把向量空间分成若干个小区域,每个小区域寻找一个代表向量,量化时落入 小区域的向量就用这个代表向量代替。

向量量化的基本原理是将若干个标量数据组成一个向量(或者是从一帧语音数据中提取的 特征向量)在多维空间给予整体量化,从而可以在信息量损失较小的情况下压缩数据量。

05

语音识别

当提取声音特征集合以后,就可以识别这些特征所代表的单词。本节重点关注单个单词的 识别。识别系统的输入是从语音信号中提取出的特征参数,如LPC预测编码参数,当然,单词对 应于字母序列。语音识别所采用的方法一般有模板匹配法、随机模型法和概率语法分析法三种。这三种方法都是建立在最大似然决策贝叶斯(Bayes)判决的基础上的。

( 1 ) 模板(template)匹配法

在训练阶段,用户将词汇表中的每一个词依次说一遍,并且将其特征向量作为模板存入模板 库。在识别阶段,将输入语音的特征向量序列,依次与模板库中的每个模板进行相似度比较,将 相似度最高者作为识别结果输出。

( 2 ) 随机模型法

随机模型法是目前语音识别研究的主流。其突出的代表是隐马尔可夫模型。语音信号在足 够短的时间段上的信号特征近似于稳定,而总的过程可看成是依次相对稳定的某一特性过渡到 另一特性。隐马尔可夫模型则用概率统计的方法来描述这样一种时变的过程。

( 3 ) 概率语法分析法

这种方法是用于大长度范围的连续语音识别。语音学家通过研究不同的语音语谱图及其变 化发现,虽然不同的人说同一些语音时,相应的语谱及其变化有种种差异,但是总有一些共同的 特点足以使他们区别于其他语音,也即语音学家提出的“区别性特征”。另一方面,人类的语言 要受词法、语法、语义等约束,人在识别语音的过程中充分应用了这些约束以及对话环境的有关 信息。于是,将语音识别专家提出的“区别性特征”与来自构词、句法、语义等语用约束相互结 合,就可以构成一个“自底向上”或“自顶向下”的交互作用的知识系统,不同层次的知识可以用 若干规则来描述。

除了上面的三种语音识别方法外,还有许多其他的语音识别方法。例如,基于人工神经网络 的语音识别方法,是目前的一个研究热点。目前用于语音识别研究的神经网络有BP神经网络、 Kohcmen特征映射神经网络等,特别是深度学习用于语音识别取得了长足的进步。

找我获取IT技术干货

分类: 电脑/网络 >> *** 作系统/系统故障

解析:

打开word或其他一些office应用程序

再打开工具菜单下的语音命令,这时会d出语音识别对话框,下一步进入麦克风向导,一直下一步,在这个过程中会提示你对麦克风和耳机进行测试,这个你自己都会哈完了之后会谈出声音训练对话框,这时你需要进行语音训练,建议进行更多的训练这个过程大约15分钟,但你也可以直接跳过以后来训练

你还可以在C:\Program Files\Microsoft Office\OFFICE11\2052\VIDEOMHT里面观看演示

你还可以参考下面这个文章

如何在 Windows XP 中使用语音识别

察看本文应用于的产品

文章编号 : 306901

最后修改 : 2004年3月25日

修订 : 10

本页

概要

如何使用 Microsoft 语音识别引擎

如何训练语音识别引擎

如何使用语音识别引擎

语音识别提示

参考

这篇文章中的信息适用于:

概要

本文介绍如何在 Windows XP 中使用语音识别。如果您在 Microsoft Office XP 中安装了语音识别功能,或者您新购买的计算机安装了 Office XP,那么您就可以在所有 Office 程序中使用语音识别,并可以在其他启用语音识别功能的程序(如 Microsoft Inter Explorer)中使用此功能。

语音识别使 *** 作系统能够将所说的话转换为书面文字。一种叫做语音识别引擎的内部驱动程序可以识别语音并将其转换为文字。语音识别引擎可以随 *** 作系统安装,也可以在以后随其他软件安装。在安装过程中,支持语音的软件包(如字处理程序和 Web 浏览器)可以安装自己的引擎,或使用现有的引擎。第三方供应商还提供了其他引擎。这些引擎常常使用特定的术语表或词汇表,例如,它们可能会使用医学或法律方面的专门的词汇表。它们还可以使用不同的声音,允许使用诸如英国英语之类的地区性口音,或使用另一种完全不同的语言(如德语、法语或俄语)。

您需要麦克风或其他声音输入设备来接收声音。一般情况下,麦克风应是内置了噪声过滤器的高品质设备。输入语音的质量直接影响到语音识别率。如果使用质量低劣的麦克风,则识别率将大大降低,甚至会到使人无法接受的程度。Microsoft 语音识别训练向导(声音训练向导)将指导您逐步完成这一过程,建议放置麦克风的最佳位置,并允许您进行试验以达到最佳效果。

在系统安装完毕并开始工作后,您必须训练该引擎,使之适应您的环境和说话风格。为做到这一点,请单击 语音识别 选项卡,单击 训练配置文件,然后按照“声音训练向导”中的说明来训练系统,让它识别背景噪音,如风扇、空调或其他办公室声音。引擎将按您的说话风格进行调整,包括口音、发音甚至习惯用语。

有关使用 Microsoft 语音识别功能的更多信息,请单击语言栏中的帮助 按钮。

有关 Microsoft 语音识别开发的最新信息,请访问下面的 Microsoft Web 站点:

microsoft/speech/ (supportmicrosoft/scid=%3a%2f%2fmicrosoft%2fspeech%2f)

回到顶端

如何使用 Microsoft 语音识别引擎

Microsoft 语音识别引擎使您能够使用特定的程序将文本插入到文档。您可以在任一 Office XP 程序中、 Inter Explorer 中以及 Microsoft Outlook Express(50 或更高版本)中口授文本。其他软件程序最终也将支持 Microsoft 语音识别引擎。目前您还不能在 Microsoft 记事本中口授文本。

备注:语音识别引擎是特定于语言的。最先推出的三种 Microsoft 语音引擎是简体中文版、美国英语版和日语版。其他语言的引擎也将陆续推出。

除了特定于语言外,有的引擎还可能是特定于区域的。例如,Microsoft English ASR Version 5 引擎就是专为讲美国英语的人设计的。英国人、澳大利亚人及其他不讲美国英语的人因口音不同在使用此引擎时可能会遇到问题。

有关语音识别引擎的其他信息,请单击下面的文章编号,查看 Microsoft 知识库中相应的文章:

306537 (supportmicrosoft/kb/306537/EN-US/) 如何在 Windows XP 中安装和配置语音识别

回到顶端

如何训练语音识别引擎

在训练语音识别引擎时,语音识别器使用“声音训练向导”来适应您说话的声音、字的发音、口音、说话方式甚至生词或惯用语。即使只训练十分钟,也可以改进语音识别能力。系统还会在实际使用过程中不断适应您的语音特点,识别能力会越来越强。

如要训练语音识别引擎,请按照下列步骤 *** 作: 1 单击开始,单击控制面板,然后双击语音。

2 单击语音识别选项卡,然后在语言 框中单击您希望使用的语音识别引擎。

3 在识别配置文件 组中单击希望使用的配置文件。训练是特定于引擎和配置文件的,因此训练一个引擎或配置文件集不影响任何其他引擎或配置文件集。

4 单击训练配置文件,然后按照“声音训练向导”中的说明 *** 作。并不是所有的引擎都支持训练。如果您的引擎不支持训练,训练配置文件 选项将不可用。

备注:建议您至少花费 15 分钟的时间训练计算机。进行的训练越多,识别的准确率就越高。

回到顶端

如何使用语音识别引擎

备注:此过程中的步骤可能会因使用语音识别的程序而异。 1 将麦克风定位在距您的嘴边一英寸或一拇指宽的地方。确保不要放在嘴的正前方,不至直接对着它呼吸。

备注:如果在说话时无意中移动了麦克风,请不要忘记将其放回到正确的位置。

2 启动想在其中使用语音识别的程序,然后单击文档在其中定位插入点。如果在工作时打开了一个“帮助”主题或者在屏幕上显示了一条消息,再单击一次文档即可继续使用语音识别。

3 在语言栏上,单击麦克风 (如果麦克风尚未打开)。

备注:默认情况下,语言栏在其每个按钮旁边显示文本标签。若要隐藏或显示文本标签,请右键单击语言 栏,然后单击文本标签。

4 在工作的时候,可在“听写”和“声音命令”模式之间切换。

备注:可以先完成听写、文件检查,再进行格式编排或修改,以节省时间。这样做时,会减少在“听写”模式与“声音命令”模式之间的切换次数。若要更改模式: • 使用“听写”模式:若要将您说的话转换为文本,请单击语言栏上的听写模式 。

在说话时,将显示一个蓝色的条,表示计算机正处理您的声音。您说的话被识别后,屏幕上将显示相应的文字。在计算机处理您的声音的过程中您可以继续说下去,不必等到蓝色条消失之后才接着讲。

备注:在显示蓝色条时,应避免使用鼠标或键盘进行键入或其他 *** 作。否则将中断语音识别,您说的话将得不到处理。

• 使用“声音命令”模式:若要选择菜单、工具栏、对话框(仅美国英语)和任务窗格(仅美国英语)项,请在语言栏上单击声音命令。例如,若要更改字体格式,您可以说“字体”以打开格式工具栏上的“字体”框,然后说出一个字体名称。如果您想设置所选文本的格式,则可以说“加粗”或“下划线”。

5 对着计算机讲完后,可单击语言栏上的麦克风 以关闭麦克风。

下面的列表说明了您可以使用的一些快捷方式: • 您还可以通过说“听写”或“声音命令”在“听写”和“声音命令”模式之间切换。

• 在 Microsoft Word 中,您可以通过说 scratch that(勾掉)来删除在“听写”模式下最后说的内容。

• 您可以通过单击工具 菜单中的语音 打开或关闭麦克风(在 Microsoft Excel 中,指向工具 菜单中的语音 ,然后单击语音识别)。

• 您还可以通过说“麦克风”将麦克风关闭。

回到顶端

语音识别提示

语音识别并未设计为完全不用手 *** 作;如果将您的声音和鼠标或键盘结合起来,效果会更好。另外,使用一致的语音音质也有助于获得最佳效果。当您与别人讲话的时候,人们通常是通过上下文和环境来理解的,即使您低声说、高声说、快说或慢说都是如此。然而,语音识别只有在您以可预知的方式讲话时才能更好地理解您的话。 • 请使用一致而平缓的音调讲话。如果您说话的声音太高或太轻,计算机可能无法识别您说的是什么。

• 请使用一致的速度,而不要时快时慢。

• 说话时词与词之间不要有停顿,计算机理解短语要比理解单个词更容易。例如,计算机对诸如“这(停顿)是(停顿)另一个(停顿)例(停顿)句”之类的话理解起来就会很吃力。

• 请在安静的环境中开始工作(这样计算机将只听到您说的话而不会听到周围的声音),并且使用高品质的麦克风。将麦克风放在同一个位置,调整好后尽量不要移动它。

• 通过大声朗读在“声音训练向导”中准备好的训练文字,训练您的计算机识别您的声音。更多的训练可提高语音识别的准确率。

• 在听写的时候,如果您说的话没有立即显示在屏幕上,请不要担心。您可以继续说下去,并在语意结束时才停顿。计算机在处理完您的声音之后会将其识别的文本显示出来。

• 发音要清楚,但不要将一个字的各个音节断开。例如,如果将“现”的音节分开说成“xi-an”,计算机将无法识别您在说什么。

还有这个文章:

ctiforum/technology/asr/2001/07/asr0702

以上就是关于计算机是如何识别C语言的全部的内容,包括:计算机是如何识别C语言的、HTK到底是什么技术在语音识别中如何应用介绍一下,谢谢、麦克阿瑟语音怎么弄等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zz/9513707.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-29
下一篇 2023-04-29

发表评论

登录后才能评论

评论列表(0条)

保存