服务器是什么?

服务器是什么?,第1张

下面我们就看一下该框架的基本信息。

iOS用户习惯于使用Siri与应用进行交互,并在键盘可见时使用听写来捕捉他们的语音。 Speech API允许您在应用程序中扩展和增强语音识别体验,而不需要键盘。

下面看一下该框架的基本结构。

Speech API通过与Apple服务器通信或使用设备上的语音识别器(如果可用)来执行语音识别。 要找出语音识别器是否可用于特定语言,请使用 SFSpeechRecognizerDelegate 协议。

由于您的应用可能需要连接到服务器才能执行识别,因此尊重用户的隐私并将其话语视为敏感数据是非常重要的。 因此,在启动语音识别之前,您必须获得用户的明确许可。

要开始在您的应用程序中使用语音识别:

例如,如果您的待办事项列表应用程序在用户说完“done”时将项目的状态更改为完成,则可以编写 “Lets you mark an item as finished by saying Done” 。

如果用户拒绝许可(或者语音识别不可用),请妥善处理。例如,您可能会禁用指示语音识别可用性的用户界面项目。

使用 SFSpeechURLRecognitionRequest 类对预先记录的磁盘上的音频文件执行识别,并使用 SFSpeechAudioBufferRecognitionRequest 类识别实时音频或内存中的内容。

语音是逐渐识别的,所以你的识别器的处理程序可能会被多次调用。 (检查识别完成时 final 属性的值。)如果您正在使用实时音频,则在识别过程中使用 SFSpeechAudioBufferRecognitionRequest 并将音频缓冲区附加到请求。

这是创建一个简单的识别器的方法,默认为用户当前的语言环境并启动语音识别。

不知道你用的是什么语音识别的软件,当我觉得可能有如下三个原因。
可能是以下原因:1,你的网络有问题,请检查一下!
2,语音识别的服务提供商服务器出现问题,使得联网连不上,可以与讯飞的客服联系
3,可能是语音识别的服务提供商在迁移服务器什么的。

1针对输入源来测试:

(人声、录音、广播),语音采集:语音输入方式(人声、录音、广播等)、语音的类型(男生、女生、童声等)、不同语音环境(室外、室内、浴室、火车站、大厅等等),声音大小

(1)用户正常比较标准的哼唱,查看识别结果,并且能够点播;

(2)用户加了特效的哼唱,比如加了电音效果,查看识别结果;

(3)用户的哼唱咬字不清或者是错字,查看识别结果;

(4)用户的哼唱停顿点节奏不对,查看识别结果;

(5)用户的哼唱音调比较低,查看识别结果;

(6)用户的哼唱音调比较高,查看识别结果;

(7)还可以从用户哼唱的音色来看,音色明亮和低沉,查看识别结果;

(8)输入比较短的哼唱,比如1秒,查看识别结果;

(9)输入比较长的哼唱,就是哼唱的特别慢,查看识别结果;

2对识别结果测试:

(1)对正常比较标准的哼唱输入,查看得到的结果,是否正确,是否模糊匹配到其它歌曲,准确度如何;

(2)对非正常的哼唱输入,结果显示如何,是否需要显示空白提示页

3容错性和性能测试:

比对速度、准确性,乐库容量对识别速度和结果的影响数据;什么量级,什么结果;服务器并发量;

(1)哼唱的环境有比较多杂音,查看识别结果;

(2)哼唱的声音时大时小,查看识别结果;

(3)哼唱识别得到结果后,多次反复哼唱,查看是否每次都能够识别出结果;

4兼容性测试:

(1)平台测试:iOS和Android;

(2)设备系统测试:iOS8-11系统,Android40-81等,具体得看需求支撑哪些系统;

(3)设备内存和存储等,如存储不够的时候,输入一段音频,是否会出现crash等;

(4)分辨率:手机不同分辨率,页面显示;这个也可以归为UI测试了;

(5)方言识别;

华镇电子的品质就做的比较好,这个产品在技术方面是获得过多项专利的,水平更高,他们的产品技术能够应用于各种电子及通信设备,包括:智能玩具,智能家居系统,智能汽车导航及声控,智能手机Smartphone、 PDA、固定电话、移动电话,电信级的服务器及个人电脑等。


欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/zz/13200524.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-06-19
下一篇 2023-06-19

发表评论

登录后才能评论

评论列表(0条)

保存