关于隐形的

关于隐形的,第1张

隐形AI与设计

本文从人工智能帮助想象的过程、模拟人工智能对抗隐形人工智能、外观三个角度讨论了获取人工智能之间关系的方法。

作为一个有远见的人,我对今天AI大潮的立场是这样开始的:

听起来不错,但这和我的幻想有什么关系?

我对所有趋势都持谨慎态度,今天媒体宣传的野生智能与我们在科幻小说中读到的强大工业智能截然不同。更何况总要想象老师关心的都是世界,他们的职责就是根据不同的交互方式去想象不同的有用世界,而AI看似是底层的创新,战争世界里的关系太多了。

虽然按照我对那个成绩的一步一步理解,但是我发现我之前的理解很局促。

我对AI算法的理解

其实我和AI算法斗的不多,不过我是在TU/E的一个具身社交的课程里斗的,那堂课导师教了我们一个神经气体学习算法(这是用JavaScript写的Demo),让我们测试算法,锻炼数据,得出结果。

整节课下来,教室里所有的泰国半教学生都一头雾水(尤其是欧洲,大部分系的数学教学都不是特别好)。虽然去了文科,但也不懂。

但是机械学习的有趣之处在于,即使你不知道算法,你也可以用它来得到好的结果。

当时我们测试了很多零散的数据。一开始,我们对算法不太了解。运动数据是RGB,然后改成灰度。后来我误以为算法更容易识别两组差异很大的数据,就让算法识别不同颜色的衣服,结果不成功。

经过这么多的测试,我们发现,我们在力学学习中特别擅长的是那些容易进行逻辑分析的结果。

一个在逻辑分析中容易使用的成果的例子是:用算法识别用脚写的数字。

[FIG–1]一组用不同书写方法书写的数字

试想一下,如果不需要机械学习,可以为每个数字编写不同的算法,需要了解更多人的习俗、笔画、形状等。,需要写一套逻辑,需要得到途径,特征曲面等。从一堆像素中,而且需要处理大量划界规则之外的特殊情况……总之不简单。而且在很多情况下,这是不可能的(比如识别一张图片中的不同物体)。识别脚写的数字的成果,属于人脑简单,计算机难的。机械学习,或者说深度学习,非常擅长处理那种结果,甚至比人类还要好,比如下围棋,打股票。当然,我很了解AI工艺。如有不妥,请在批评区指出。

好吧,我们先去工艺圈看看。

听到这里,你可以和我站在同一个立场:“AI听起来好像可以处理很多我之前处理过的不好的结果,但是关于我想象中的产品的远见卓识和它有很大关系吗?”那个立场很合理。搜索引擎长期以来一直使用各种智能技术来帮助用户进行搜索,但这些技术的改进通常是由工程师或产品经理来推动的。设计师似乎只是把搜索框想象得很优雅,把世界的布局想象得更合理,让人们以多种方式忏悔(那些自然的也很重要)。

我以为有两种水果元素会影响你的不雅长相:

我相信设计师应该为极致体验而努力。如果设计师只是在产品管理工程师学会了功能战技巧之后,从他身上减去一个优雅的外壳,我很怀疑那种协作方式是否会成功(其实大部分公司设计师都得有同样的产品管理深度,尤其是交互设计师)。我还认为,这些职位之间的区别相当模糊,尤其是在产品经理和远见者之间。

未来,野生智能工艺会影响到产品的方方面面,不会局限于那些听起来“AI”(搜刮、语音交互)的产品。如果你不懂那些工艺,你的产品在被体验的时候就会落后。

在那篇文章中,我将概述从之前提出的三个想法中获取人工智能连接关系的方法。他们的分离是AI帮助想象航向,模仿人类AI,对抗隐形AI。

人工智能帮助想象这个过程

想象力是我认为非常需要创造力的领域之一,也应该是最早被AI取代的职业之一(据那个网站_)。但是物业有很多想法需要供给。没有需求是特别有创意的,而最能被AI替代的恰恰是那些需要供给的。

比如,人们很久以前就不再主动进行简单的排版,对它的需求非常旺盛(想象一下电商网站中数量庞大的产品图片),但偶尔的创意要求却如此之低。随着人工智能技术的发展,这些主动算法变得越来越有用。以下是一些例子:

[FIG–2]阿里鲁班的旗帜对主动和自然的假设。

[FIG–3]网飞根据照片内容主动裁剪版面,死磕多个版本。

[图4]WIX天马行空的想象力

我看过很多例子,我觉得里面有真正的想象力和智能。当你在使用它的时候,你可以感觉到内部模板的痕迹。当然,一些需要提供的简单模板就足够了。如果我们深挖停止供应,就有很多创新的机会。但是,也有一些有远见的人注定要逃离这个部门。陶爱对空想家职业的威胁很早就有了。

模拟完全人类交流的人工智能

在2001年制造一个可以与人交换和旅行的HAL机器人简直是科技幻想。亚马逊、微硬盘、脸书和苹果等国际科技巨头都推出了聊天机器人或智能音箱。用户可以互相聊天,订购机票,用智能音箱播放音乐,设置闹钟,掌握智能家居。

我也用过一些那种产品,语音识别整体成功率挺低的,但是我真的知道单词背后的意思,借用一下特别好。更重要的是,那些交互场合都有自己的局限性,所以有时候传统的GUI更有用。

野智确实是一股大潮。其实并不代表动手的时间没有了。其实并不是说语音辅助会取代屏幕。人是有眼睛的,只要人有眼睛,就会看屏幕。我们有脚趾,我们喜欢触摸工具。然而,从很晚的科幻小说开始,人们期望拥有一台能够以自然的方式说话的计算机。这正逐渐成为一种理想。

——亚马逊CEO杰夫·贝索斯在问野生智能的时代。

我也看到一些理论,(语音用户界面)和崔(对话式用户界面)将取代GUI,这是非常微妙的,没有错,而且有一些差异。目前最大的成果是如何在有限的技能水平下获得合格的用户体验(比如想象Alexa技能),并从产品的角度提出了技能需求的提升。为了加深这种需要,再写一篇文章。

隐形人工智能

那部分是本文的重要方面,也是我认为明天开始需要密切关注的动向。

所谓隐形AI(好吧,那是我自己的称号)就是在传统UI中是隐形的,智能天会把信息给你。在传统的UI中,UI是静态的,也就是说UI不会根据不同用户的输入做太多的改变,不会帮助用户停止输入,无法理解用户的尝试,也越来越无法给不同用户有针对性的主动权。

我以为交互设计师一开始就可以 *** 纵隐形AI去考虑UI的方方面面。我认为有更多的创新方法等待探索,我在这里介绍两种:减少不良输出

插嘴

人是懒惰的,我们真的不想通过在键盘上打字来输入一些工具,尤其是在移动平台的时候。先把笔墨移上讲台,输入自己的服从。第二,平台上很多用户(比如老人)确实不好进。第三,人往往是以移动或单脚 *** 纵的形式出现。第四,人们非常渴望快速完成一项任务,比如排队付款。

我觉得锤子科技在那个圈子探索的比较好。早期,锤子科技发明了输入考证码的痛苦一面,第一次主动识别考证码并停止了被告知栏目的功能。以后大部分ROM厂商也纷纷效仿,删除了更多间接复制按键等功能。

我个人总结的减少输入的方法是环境升力和多模态输入。环境提升(Ambientlift)是指不占用用户二次注意力的提升方式,而多模态输入是利用图像识别和语音识别来帮助或替代键盘输入。

环境促销

我们现在可以考虑一下。有什么可以用AI主动停止智能防护?

太多太多的输入计划都可以被AI降级,我们只要改变思维就可以发明现有产品中需求降级的很多方面。

以给阅读器添加书签为例。我以前的书签都不会被标记或分组,所以我很懒。但是当我需要找到一个以前珍藏的网页时,我当时就发明了一个合理的分类,很容易快速找到我的珍藏页。我也用过EverNote的网页剪贴藏东西,但是每次收藏都要输入一个标签,太麻烦了。

[FIG–5]使用雨滴添加网页时,它会主动添加标签。图标在创建文件夹时被自动杀死。

我正在使用的雨滴 *** 纵人工智能来恶化这一过程。

它会主动分析网页的文字,保护我之前创建的一个文件夹。而且它可以根据我每次收集到的网页,不断学习,对抗恶化。当然,那种方法只需要80%的准确率。但我不妨,因为我可以很容易地停止文件夹的快速变化,并创建它们。更有趣的是,它会主动给文件夹添加图标。如果我创建一个名为games的文件夹,它会主动给我添加一个游戏的脚把图标。

整个运用过程非常流畅,即使摔倒也能轻松快速纠正。

当然,有一个假设,当AI为我们制定分辨率计划时,分辨率计划越精确,分辨率计划就越不重要,越不需要用户友好的校正方法。

像一个图标,是基于单个词的阐发而赋予的,其粗糙往往不如其有力;同时,图标是一个很好的功能,它并不特别影响我的一般使用。因此,有必要赋予标记更改图标的功能。

相反,如果解析方案比较重要,AI无法给出完整准确的解析方案,就要只给出一个倡议,或者最后能提供一个快速的修正方法。在那里,需求交互设计者在这个过程中找到一个合适的平衡。

[FIG–6]谷歌收件箱的主动恢复功能

[FIG–7]tribeapp可以主动识别语音对话中的疑问,并将其带到hub。

在那里,我正在逃避几个例子。GoogleMail服务中收件箱的主动复活功能和Tribe在视频聊天中主动丢失信息,死为卡。就像那些在同流中冷静观察,适时提供帮助的人,如果构思得当,也能给人们的生活带来便利。

多模态输入

在过去的几年里,图像识别和语音识别已经进行得很完美了,一些常见的功能都可以被它取代。可以比作

锤子科技宣布将尝试刺激语音输入。

在使用地图和搜索时增加语音输入。

*** 纵摄像头间接停止谷歌翻译的翻译

以后的使用场景只会越来越多。

对于交互设计师或产品经理来说,我们应该密切关注如何将那些新技术奇妙地应用到现有产品中,以便用户可以根据需要方便地挪用那些功能。那么就要找到一个非常必要的使用场景。

在SmartisanOS的爆款功能中,当世界上的笔墨无法间接提及时,系统会提醒用户选择截屏,然后对所选区域实施OCR功能。这就是图像识别绕过系统障碍的奇妙方法。

下一步是深化算法进度,阻止恶化。如果在图像被击中的区域停止图像的智能裁剪,用户将没有必要停止裁剪那个 *** 纵(那个 *** 纵真的是一个成本很低的 *** 纵,应该被AI降级。我每次都拒绝使用,只是间接停止了所有截图的OCR)。整个体验不会被打破,用户会在不知不觉中实现背后的一系列算法 *** 控。这样,可以进一步提升用户体验。

较差的输出

除了被输入到圈子里,可以减少大家的工作量,AI可以提供越来越多的带有恶化性质的输出。

那个趋势很热,像陶:

iPhone通过流程可以给用户的照片停止被分析,间接死成了可以分享的皮影戏;

资讯网站,包括过去的头条,对不同用户智力的内容进行划分;

YouTube的主动死亡智能预览;

在大部分国产rom中,邮件大战、智能分析排版从无到有等是毋庸置疑的。

这种使用在算法和用户分析中都是相称和响应的。

标签

那篇文章提到,很多人工智能正在产品中使用。我认为最重要的是思维方式的转变。之前,我们用创新的想法来处理我们的成果,这使得用户能够更快地达到他们想要的目标。在AI时期,我们可以从一开始就考虑是否所有的结果都可以被后端的AI测试处理,在前端以逻辑的方式展现出来。比如:

我们总是被最后一个人的讲述打扰。系统是否可以通过流程判断我们是否可以消除对讲述的 *** 纵,推断我们没有读过一些用过的讲述,并将其降低或按时结算?

我们的屏幕亮度调节被禁止。系统能否在我每次主动时根据补偿干涉亮度来停止亮度调节算法的恶化?

系统可以检测到我经常停止的重复 *** 纵(每天从公司拿卡),主动为我创建一个类似IFTTT的快捷功能?

视频播放器在字幕和声音不匹配的情况下可以主动结婚吗?(当这种攻击发生时,很难做到完全一致。)

能否智能解释一下如何取消订阅邮件,让我有一个列表来报告我订阅了哪些邮件?我只需要当面打复选框,后台会主动给我取消或续费订阅?还是读SmartisanOS,用智能屏障的方法取消订阅?

当我说出电话号码时,你能主动认出号码并保留吗?同时保留填充音,保证没有攻击识别问题。

下次等你成绩出来了,试试AI的方法~

引用

图1:使用神经集合来识别写在脚上的数字。进一步研究的神经集合,引自https://hit-scir.gitbooks.io/neural-networks-and-deep-learning-zh_cn/content/chaP1/c1s0.html。

图–2:想象现在的AII:想象1.7亿大旗的阿里鲁班,想象现在的AII:想象1.7亿大旗的阿里鲁班。

图3:人工智能时代的设计,https://medium.com/startup-grind/Design-In-a-Age-of-Artificial-Intelligence-739e656b44ba

图–4:网站创建的未来:WixADI简介,https://www.Wix.com/blog/2016/06/Wix-artificial-design-intelligence/

图6:谷歌收件箱将很快通过分析你的电子邮件来预测你的回复

图7:红杉支持的视频聊天应用部落向其客户的通讯录发送垃圾邮件

欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/zz/778561.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-05-03
下一篇 2022-05-03

发表评论

登录后才能评论

评论列表(0条)

保存