对于贫困读者语音识别技术并不是有效的解决方案

对于贫困读者语音识别技术并不是有效的解决方案,第1张

(文章来源:大学网)

大约五分之一的人被认为是文盲或文盲,无法阅读或编写简单的陈述。识字率低可能是由于阅读障碍(例如诵读困难)或很少或没有阅读习惯造成的。对于识字率低的发展中国家,语音识别已被Google等公司誉为解决方案。但是语音技术真的是解决方案吗?

福尔克·休艾特格(Falk HuetTIg)和马丁·皮克林(MarTIn Pickering)认为并非如此。心理学家在《认知科学趋势》中的一篇评论文章中指出,依靠语音技术可能适得其反,因为识字具有超越阅读的重要益处。Falk HuetTIg说:“观察语音阅读的优势是非常相关和及时的,特别是因为人们倾向于以比以往更少的方式和不同的方式阅读。”“例如,当代社交媒体的写作和阅读习惯与传统的印刷媒体有很大不同。人们过去从小说,报纸,公共公告甚至食谱书等书面资源中获得的信息,他们越来越多地从YouTube视频,播客中获得信息或有声读物。”

这不一定是一件坏事,因为阅读听力的一些常规好处也可以从听有声读物获得。由于有声读物还提供“书本语言”,因此聆听它们会带来一些类似的好处,例如词汇量更大,对世界的了解增加以及短期(“工作”)记忆力的增强,这对于跟踪应用程序非常重要。信息以及多个句子,段落甚至一页上的多个实体。

但是,根据韦蒂格和皮克林所说,阅读本身(阅读的实际行为)对于发展预测即将到来的单词的技能至关重要,该技能将从阅读转变为理解口语。阅读可以训练语言预测系统,尽管即使很小的孩子仍然无法阅读,也可以预测句子的去向。当两岁的孩子听到“男孩吃了一个大蛋糕”时,他们在听到“吃”之后但在听到“蛋糕”之前期望有可食用的东西(即蛋糕)。预测即将到来的信息非常有用,因为它可以减少处理负荷并释放有限的大脑资源。至关重要的是,熟练的读者可以更好地进行预测。

最狂热的阅读器中的孩子每年遇到超过400万个单词,而很少阅读的孩子仅遇到大约50,000个单词。结果,优秀的读者对单词的含义有了更深入的了解,并建立了庞大的单词网络,它们之间具有很强的关联性,这有助于他们预测即将到来的单词。由于贫穷的读者词汇量较少,单词的神经表示能力较弱(即单词的声音和含义的记忆),单词之间的预测关系也较弱(例如,经常遵循“读...”的预测)通过“书”)。

由于阅读是随心所欲的,因此有强烈的动机来预测即将到来的单词,因为这可以加快阅读速度,通常比听书要快得多。熟练的读者倾向于一眼看完整个单词(同时凝视着多个字母的眼睛),并安排他们的眼动时间以优化阅读过程。打印的文本(即使考虑到字体和单词大写的偶尔更改)也比会话语音更为规则,会话语音充满了歧义,单词发音不完整和语音错误。书面文本的这种规律性有助于读者形成单词之间的预测关系,进而,可以将其扩展用于在听语音时更好地预测单词。

单词的概念本身就是识字头脑的发明。对于一个只听过语音流的文盲来说,很难把握。例如,当要求尚未学会阅读的文盲或儿童重复口头句子的最后一个单词时,他们倾向于重复整个句子。相反,单词显然以书面语言脱颖而出,通常用空格隔开。书面形式使单词更加突出和精确:读者逐渐意识到单词是语言中的稳定单元。将书面形式的单词存储在内存中还有助于使语音形式更加突出,在预测即将到来的语音时可以更快地访问它们。而且,正是对即将到来的语言的预测使语言理解真正变得快速而熟练。

“我们的论点提供了一个理由,为什么我们需要做出更多的努力来教导发展中国家的数亿文盲和世界各地的功能文盲如何阅读(或更好地阅读)以及为何着重于人工智能语音识别和语音克服识字相关问题的助手有其危险。”休蒂格总结说:“写作是一项古老的人类技术,我们不应该轻易放弃。即使在现代技术世界中,教导如何阅读和如何更好地阅读仍然非常重要。”

欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/dianzi/2550156.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-08-05
下一篇 2022-08-05

发表评论

登录后才能评论

评论列表(0条)

保存