我把部分英文文档的翻译贴上来吧:
实际上这个东西的汉语发音觉得很怪,大概需要多次地调试语速、语调才能使程序的发音自然,要不然听起来很不舒服。
SAPI 5 介绍
SAPI 5 总揽
SAPI 应用程序接口程序戏剧性的减少了语音识别和语音合成应用中的程序代码,使得语音技术在广泛和蓬勃发展的实际应用中更容易使用。
本章包括以下主题:
API总揽
文本合成语音应用程序接口
语音识别应用程序接口
API总揽:
SAPI使得应用程序和语音引擎之间高度紧密的结合。SAPI可以实时处理各种语音引擎在底层工作中的细节。
SAPI的两种基本类型是文本合成语音(TTS)引擎和语音识别(SR)引擎。TTS可以将文本中的字符或文档合成为语音并“说”出来。而SR则可以把人说话的语音转换为易读的字符或文档。
应用程序可以通过ISpVoice COM接口控制使用TTS。应用程序一旦建立了ISpVoice 对象,它只需调用ISpVoice::Speak来从文本数据生成语音。另外IspVoice接口同样提供了多种方式来改变程序所发出的声音、音调和其他属性,例如ISpVoice::SetRate改变语音速度,ISpVoice::SetVolume改变语音音量,ISpVoice::SetVoice改变当前程序所发出的声音。
更有趣的是SAPI还可以控制通过对插入的文本的结合来实时改变合成语音的声音类型、音调、重音、发音速度和音量。
IspVoice::Speak方法可以同步地(在发音完毕时返回程序)或异步地(在发音时同时返回程序,发音成为后台处理)。当处于异步工作时,可以使用ISpVoice::GetStatus来获得发音状态及文本位置。同样,当处于异步工作时,新的文本发音也可以通过立即终止当前的发音来创建,这个过程是决定于新文本所包含的结束信息由程序自动处理的。
除了IspVoice接口之外,SAPI同样提供更多的高级TTS应用——通过手动控制COM接口。
语音识别应用程序接口:
类似于IspVoice是主要的语音合成程序接口,ISpRecoContext就是主要的语音识别程序接口。同IspVoice一样,他是一个IspEventSource,也就是说当语音程序接收到一个语音识别请求就会触发一个事件的事件源。
一个程序拥有两种不同的语音识别引擎(ISpRecognizer)类型。一个是共享的语音识别引擎,由于它可以与其他语音识别应用程序共享其程序资源,所以在大多数场合中被推荐使用。(在共享的语音识别应用中)需要建立一个采用共享语音识别引擎的识别环境(IspRecoContext),应用程序需要调用COM接口位于CoCreateInstance结构上的CLSID_SpSharedRecoContext。然后SAPI会设立一个音频输入流,并把这个音频输入流定义为默认的SAPI音频输入流。对于大型的服务器应用程序,这个过程需要一个独立的系统来完成,因为性能是这时的关键因素,一个独立进程(InProc)的语音识别引擎是最适合的。如果需要创建采用一个独立进程(非共享)语音识别引擎的语音识别环境,应用程序首先需要调用COM接口位于CoCreateInstance结构上的CLSID_SpInprocRecoInstance。然后,应用程序必须调用ISpRecognizer::SetInput来设立一个音频输入流。最后,应用程序通过调用ISpRecognizer::CreateRecoContext来建立它自己的识别环境。
下一步是为应用程序的识别事件建立消息通知表(IspNotifySource)。同样由于IspRecognizer 也是ISpEventSource,应用程序通过一个从ISpRecoContext 取得的IspNotifySource来判别哪种由IspRecoContext报告的事件源的需要被触发。然后,IspRecognizer需要调用ISpEventSource::SetInterest来创建一个需要被识别的“事件”。其中最重要的事件是SPEI_RECOGNITION,当其被触发,说明已经有一个被IspRecognizer识别的符合当前IspRecoContext要求的识别事件已完成。
最后,一个语音应用程序必须创建、加载并激活一个识别语法(ISpRecoGrammar),识别语会法从本质上决定哪种发音需要识别,而哪种发音不必理会,(具体有类似)听写或者一个command and control(C&C)语法。首先,应用程序需要通过调用语法接口函数ISpRecoContext::CreateGrammar建立一个IspRecoGrammar,然后应用程序需要加载这个语法(通过调用ISpRecoGrammar::LoadDictation),其目的是建立一个听写或者command and control语法环境。最终为了激活这个识别语法需要调用ISpRecoGrammar::SetDictationState(听写语法环境)或 ISpRecoGrammar::SetRuleIdState、ISpRecoGrammar::SetRuleIdState(C&C语法环境)。
当识别结果依据IspNotifySource的需要返回给应用程序,SPEVENT数据结构中的lParam就被定义为一个ISpRecoResult,这样应用程序就能决定哪些符合ISpRecoContext.中设立的IspRecoGrammar的语音被识别出来了。
无论是共享的(shared)还是独立进程(InProc)的识别引擎,都可以在IspRecoContexts中多进程同时工作,每一个识别引擎也都可以有自己的触发事件源。一个IspRecoContexts也可以有多个IspRecoGrammars同时工作,互相之间并不影响。
爱学习的小伙伴们,你们知道什么是硬件抽象层吗?不知道的话跟着我一起来学习了解什么是硬件抽象层。
硬件抽象层介绍(Hardware Abstraction Layer )
硬件抽象层是位于 *** 作系统内核与硬件电路之间的接口层,其目的在于将硬件抽象化。它隐藏了特定平台的硬件接口细节,为 *** 作系统提供虚拟硬件平台,使其具有硬件无关性,可在多种平台上进行移植。 从软硬件测试的角度来看,软硬件的测试工作都可分别基于硬件抽象层来完成,使得软硬件测试工作的并行进行成为可能。
硬件抽象层大概分为以下几点HAL:
*上层软件
*虚拟驱动,设置管理模块
*内部通信SERVER
*内部以太网
*内部通信CLIENT
*用户接入口
硬件抽象层接口的定义和代码的设计具有一下特点:
*硬件抽象层具有与硬件的密切相关性
*硬件抽象层具有与 *** 作系统无关性
*接口定义的功能应包含硬件或系统所需硬件支持的所有功能
*接口定义简单明了,太多接口函数会增加软件模拟的复杂性
*具有可测性的接口设计有利于系统的软硬件测试和集成
硬件抽象层对用户设备接口的功能模拟主要由虚拟驱动模块完成,包括数据包的收发及协议报文的预处理等工作,为上层协议软件提供标准的API函数, 而对用户设备的接口管理则由上层网络管理软件通地设备管理模块对其进行管理配置及监控,内部通信模块运行于内部队以太网络,协调各模块之间的功能接口,保证从处理单元与主处理单元之间实时可靠的数据传输.
speically in Android
Framework&Application
------------------------------------
External lib&Runtime
------------------------------------
HAL
Sensor stub stub stub
------------------------------------
Linux Device Driver
------------------------------------
图上是现在Android HAL 的所在位置,从这张架构图我们知道,HAL 的目的是为了把 Android framework 与 Linux kernel 完整隔开。让 Android 不至过度依赖 Linux kernel,有点像是kernel independent的意思,让 Android framework 的开发能在不考虑驱动程序的前提下进行发展。
HAL module架构
struct hw_module_t
struct hw_module_methods_t
struct hw_device_t
hw_module_methods_t
---------------------------
open()
\
\
\
hw_module_t
----------------
tag:uint32_t
, , , , ,
\
\
\
\
hw_device_t
---------------
close()
HAL 使用方法
举Sensor为列子
(1)Native code通过hw_get_module调用获取HAL stub:
hw_get_module (SENSOR_HARDWARE_MODULE_ID, (const hw_module_t**)&module)
(2)通过继承hw_module_methods_t的callback来open设备:
module->methods->open(module,
SENSOR_HARDWARE_MODULE_ID, (struct hw_device_t**)device)
(3)通过继承 hw_device_t的callback来控制设备:
sSensorDevice->set_on(sSensorDevice, sensor)
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)