图像识别让机器人拥有眼睛可以像人类一样看世界

图像识别让机器人拥有眼睛可以像人类一样看世界,第1张

图像识别AI无人驾驶机器人等未来趋势技术,被一班年轻大学生“玩”出新高度。作为国际性的大学生机器人赛事,第十七届全国大学机器人大赛2018 RoboMaster机甲大赛日前圆满落幕,本届大赛共吸引了全世界近200支战队和近万名学生参加,经过近5个月激烈比赛,广州本地高校华南理工大学“华南虎”战队,凭借过硬的实力成为卫冕冠军。

每届机甲大赛的最大亮点就是体现高端制造业发展趋势,今年图像识别的应用成为决胜的重要因素之一。目前,图像识别是除语音识别外,人机交互的重要手段之一。苹果、微软、谷歌、英特尔华为等企业都纷纷致力于让机器具备深度学习能力,让图形识别更智能,让计算机、机器人“看”世界。

今年的RoboMaster(以下简称RM)机甲大赛类似于手机游戏《王者荣耀》的模式,被称为《王者》的机器人版。一支团队分为英雄机器人、步兵机器人、工程机器人、空中机器人、哨兵机器人共5个角色,其中,步兵机器人有三个,其他角色机器人均有一个。对战双方通过机器人之间的协同工作、射击等进行对抗,最后“击毁”对方基地或基地血量高者胜利,而且每局限制在7分钟之内。

机甲大赛的科技含量在于参赛战队需要 *** 作团队亲自研发的机器人,从一个细小的零件开始,焊接、装拼、核心主板装嵌、无人机改装、写程序、调试……到最后完成和 *** 控一支机器人队伍。近日,全媒体记者来到位于华南理工大学五山校区的机器人实验室,里面放置着零件焊接的机器、无数的装配工具、排线、电路板等,还有用于写程序的电脑。

要制作如此高比赛级别的机器人,过程是漫长的,经历无数次反复制作与测试。例如步兵机器人顶端是一个云台,包含了子d发射器,底部是四个轮子组成、能灵活转向的“车辆”。队员李佩佩表示,目前这款参加比赛的步兵机器人,不是团队做出来的“唯一”步兵机器人,“之前有机器人已经做出来了,因为只有做出实物,并且达到较为完整的程度,才能进行测试。虽然比如今这辆更加小巧和灵活,但由于车速以及稳定性没有后者快与良好,所以被放弃了”。一台步兵机器人从机械加工到电控“上电”,完成出来大概半个月时间。据介绍,制造出一台英雄机器人大概需要6位成员共同完成。整个战队中,工程与英雄机器人复杂性相对较高,其中,英雄机器人的难点在需要快速“取d”,这是比赛决胜因素之一,“我们的优势就在于英雄机器人取d快,一次性能取两个d药箱,时间在2~3秒之间。”队员李佩佩说。

卫冕“秘籍”:

视觉研发 帮助机器人自动瞄准更精确

尽管RM大赛每年的规则都有所更新,今年采用的技术和零件明年不能用,但是由于大赛有一项固定规则就是射击,因此打击、识别、发射等项目都是一众强队钻研的方向。

根据赛制,发射出的子d必须打在对方机器人身上规定的裁判系统位置才算有效——让对方扣掉血量。射击技术的一个核心是机器人射击子d的d道要稳定与精准,RM官方对子d的射速有上限规定,每个具备射击能力的机器人的子d发射口都有一个测速的装置,假如检测到子d超速就会扣掉血量。所以,参赛队伍都会尽量在限速的情况下做到高速。

视觉组成员杨泽霖对此解释道,比如RM官方的限速是25米/秒,团队就要做到每颗子d的速度均是24~25米/秒,并且一颗子d都不超过上限。另外,子d不能卡住“q管”,若是卡住了就全场都不能发d了——这亦是众多队伍遇到的难题之一。杨泽霖介绍,今年的机器人采用了较多的气动结构,相比用电机而言,前者取d速度更快,而且也加入了众多的自动辅助技术,例如使用相机自动对位,相比人工对位,前者更加稳定、准确和快速。据了解,上届赛事中仅有极个别队伍采用了自动瞄准技术,到了本届比赛,这一技术已成机器人的“标配”。据视觉组队员杨泽霖表示,团队机器人身上装载的摄像头能自动识别对方,自动跟随过去,这也是图形识别技术的应用。

机器人拥有“眼睛”

视觉测试需要反复多次调试

据了解,华工战队今年主要将图像识别运用到了各机器人的自动瞄准、步兵机器人激活大小能量机关、工程和英雄机器人自动取箱、补给机器人自动给子d这4个方面,“今年所有机器人都加载视觉识别程序,例如补给站机器人就是自动识别并跟机器人对接进行补d的”,视觉组队员解释,图像识别技术使机器人的速度和稳定性有很大提升。

然而,为机器人装上摄像头,写入自动图像识别程序后,让它能准确地识别图像并不简单。“因为实际环境与工业试验环境是两回事”,视觉组成员成斌告诉全媒体记者,团队有一个独立的视觉实验室进行机器人视觉测试,测试并非一两次就能完成,需要多次反复调试。因为实际场景的光照强度、光照方向、曝光时间和增益等,都会影响机器人的视觉“能力”。例如在赛场上复杂的光线或者突如其来的光照,都会给机器人战队的视觉系统带来困难。视觉组队员表示,他们需要做足够多的实验测试,模拟实际环境较为充分,“我们会模拟不同的光线情况,将众多的实际情况考虑进去”。

据了解,目前团队所研究的识别技术,优势在于延时低、转换回来的坐标较为精准,这让机器人打击的准确率很高。

让机器像人类一样观察和理解世界

未来:除了图像 还有视频识别

作为机器视觉系统的重要组成部分之一的图像处理应用,相当于人的大脑对系统获取的图像,做出正确判断。除了在摄像头中加入图形识别功能外,据了解,今年华工战队的机器人换上了麒麟970,这个人工智能移动计算平台最大的特点之一是AI场景识别,因为除了CPU外,更拥有具有独立神经处理单元(NPU),AI运算相比CPU处理能效提升50倍,性能提升25倍。据了解,从去年全球科技厂商苹果在iPhone X上使用了具备神经网络引擎的A11仿生处理器后,目前,众多科技厂商的高端处理器都带有了“深度学习”能力,并且集中“火力”在图像识别上。高通、英特尔、谷歌、英伟达等都专门开发针对图像识别的平台。

图像识别,被认为是人工智能科技领域中,除语音交互外,人机交互中的重要手段之一,例如目前消费者们经常在中高端手机产品上看到的人脸识别技术,就是图像识别功能之一。另外,目前众多智能终端拥有AI拍照功能、相册筛选等等,同样是图像识别发挥着重要的作用。

根据科技行业最新的消息称,日前,谷歌抛出了新的黑科技:视频内容识别。通过这一技术,能够识别视频当中的各种动物、物体、风景等内容,例如你要在视频当中搜索一只狗,搜索引擎很快就能为用户找出视频中包括狗的画面。业界解释,其中可以通过图像识别的原理来理解视频识别。实际上,国内有物联网团队亦致力于这一方面,正把图形识别、视频识别的研究用于在城市交通监测当中。

记者观察

科技技术有应用场景,才得以深入发展以及发掘新的研究方向。“华南虎”战队的指导老师、来自华南理工大学机械与汽车工程学院讲师张东认为,只有通过动手实践,知识才能真正掌握,成为有价值有意义的知识。

作为国际性的机器人赛事,机甲大赛并非仅有刺激性与观赏性。纵观整个比赛的机器人竞技模式,除了不同角色的机器人本身拥有不同“含金量”的技术外,更重要的是团队合作、整体战术,以及考验不同角色机器人之间的协同。业内专家表示,多机器人的协同控制在学术圈是研究热点。今年3月在平昌冬奥会闭幕式的“北京八分钟”表演中,我国新松的24台人工智能机器人控制着“冰屏”与24名轮滑演员,配合地面投影不断变幻曼妙舞姿,当中讲求的就是多机协同、人机协同——如果有一台机器人稍有延迟或动作偏差,整个演出都会失败。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/dianzi/2538454.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-08-05
下一篇 2022-08-05

发表评论

登录后才能评论

评论列表(0条)

保存