在延误了近半个多小时后,特斯拉终于在8月20日上午召开了“AI日”大会。与此前的“电池日”大会一样,马斯克拉上了团队成员,介绍了特斯拉在自动驾驶和超算训练上的新成果,更是宣布了一个重磅消息:特斯拉进军机器人制造。
明年面世的特斯拉机器人
本次大会的重磅除了用于汽车平台的AI方案外,还有一个神秘的特斯拉机器人(Tesla Bot)。一阵音乐响起后,特斯拉的人形“机器人”登场,在现场灵活地跳起了舞蹈。不过,随后马斯克很快澄清,刚才的现场表演出自真人扮演的“假机器人”,但特斯拉的目标就是造出一个同样造型的“真机器人”。
马斯克与特斯拉机器人 / 特斯拉
其实马斯克早在4月底的财报中透露了这一消息,他说:“大家往往将特斯拉视为一个电动车或能源公司,但从长远角度来看,我们其实是一家人工智能机器人公司。”当时不少人都没细想,认为他不过是将特斯拉汽车比作带车轮的AI机器人而已。
不过,机器人项目在特斯拉团队内部成立的时间并并不算久,特斯拉仍在广泛招募机器人领域的人才,并借助这个大会呼吁有志之士加入他们。马斯克称机器人的量产非常困难,预计明年才会推出特斯拉机器人的首个原型。虽然没有成品的展示,但特斯拉还是公布了一部分初期参数。
特斯拉机器人参数 / 特斯拉
特斯拉机器人将作为一个服务型的通用机器人,帮助用户解决危险、重复而无趣的作业,所以它的结构参数至关重要。该机器人身高在1米73左右,可以承载20千克左右的重物,拉力达68千克,速度可至5英里每小时。马斯克还在现场开了个玩笑:“放心,这是一个友好的机器人,而且它是跑不过你的。”
尽管声称采用了轻质材料,但该机器人依旧拥有56千克的重量,全身各个关节处装载了40个电机传动器,依靠二轴结构的脚部和压力感应器来保持平衡。
从这些参数上来看,这一机器人似乎并没有太多值得称道的亮点,然而它的内在却不容小觑,这个机器人可以说是人形的特斯拉电动车。特斯拉机器人的头部将使用车身上用到的摄像头,组成多摄像头的视频神经网络,面部的屏幕将显示实用的信息。借助躯干里的FSD计算平台,机器人将使用神经网络来进行运动规划,并具备特斯拉电动车的自动标注和仿真工具,同时借助超级计算机Dojo来进行训练。
纯视觉自动驾驶
众所周知,特斯拉向来追求的都是纯视觉的自动驾驶方案,利用车身上的八个摄像头来完成识别和预测工作。然而这一做法引发了不少问题,比如图像空间不足以提供足够的深度来进行道路和物体识别,而且多摄像头融合后给到的预测并不理想。因此,特斯拉决定将输出从图像空间搬到矢量空间。
HydraNets算法 / 特斯拉
特斯拉也依此组建了多任务学习的“HydraNets”神经网络算法,用于物体检测、交通灯、车道预测等任务,这些任务可以共享功能,而且随时可以解耦。这么做不仅提升了效率,也可以对自动驾驶任务进行单独打磨,不必每次对算法进行大改。
特斯拉在近期的自动驾驶测试中引入了自动标注,不过这一技术的采用只经过了几个月的时间,就远超过去手动标注获得的成果。过去特斯拉的手动标注是交给第三方标注公司来完成的,但特斯拉AI主管Andrej Karpathy强调,这么做不仅耗时耗力,而且成本不低,况且与第三方合作得到的数据存在延迟,于是特斯拉决定打造自己的标注团队。
自动标记量随时间的增长 / 特斯拉
特斯拉组建了千人的数据标注团队,运用了完全定制的数据标注和分析架构。先通过特斯拉车身收集到的实际视频片段,经过自动驾驶的重构后,重新创造一个合成世界。
当问及如果有人试图骗过视觉方案的做法是否可行时?马斯克举了个例子,他有一件印有强制停车标志的衣服,站在特斯拉车旁时,特斯拉是会停下来的。为此,特斯拉AI团队也在改进其算法,未来让特斯拉能够识别是真正的停车标志,还是人穿着停车标志的衣服。
特斯拉在训练时用到了各个国家的数据,但该功能目前仅对美国开放,未来才会对加拿大和欧洲国家开放。马斯克强调确实各个地区的驾驶情况会有所区别,但其自动驾驶算法即便没有覆盖所有国家,也能很好地做到防撞。他称特斯拉的优势就是在没有标注过的情况下也能实现优秀的避障,即便是UFO砸下来也会躲开。
超级计算机Dojo和自研训练芯片D1
本次发布会上,特斯拉并没有提到任何汽车的硬件更新。在问答环节,被问及下一代硬件平台时,马斯克回答HW 4.0应该会在明年和Cybertruck一起推出,并搭载下一代的摄像头模组,不过如今的HW 3.0已经可以做到比人类强200%以上的安全性了。虽说车身没有更新,特斯拉却为自动驾驶背后的基础设备来了次大翻新。
特斯拉利用超算来完成深度学习和训练已经不是什么秘密了,特斯拉最新的一台超算就包含了5760个英伟达A100加速卡,算力达到1.8 EFLOPS。但特斯拉并没有止步于此,他们想要实现更高的AI训练性能,创造更大更复杂的神经网络模型,同时又兼顾功耗和成本。
Dojo项目负责人Ganesh Venkataramanan展示D1芯片 / 特斯拉
为了实现可扩展的性能,特斯拉采用了分布式的计算结构,将计算单元用网络结构组合在一起。但这种架构的挑战在于两个计算单元之间的带宽和延迟上,面对这些挑战,特斯拉打算用自研芯片来解决
D1芯片与TPU、GPU和初创企业AI芯片的算力与带宽对比 / 特斯拉
D1是特斯拉基于7nm制程自研的AI训练芯片,单个芯片内包含500亿个晶体管,提供22.6 TFLOPs的FP32算力。该芯片采用了645mm2的BGA封装,功耗达到400W,单向带宽可达4TB/s。按照特斯拉团队的说法,该芯片的算力可与GPU相比,灵活性可与CPU媲美,IO带宽是网络芯片的两倍。
训练TIle / 特斯拉
由于D1芯片的扩展性,特斯拉将25个D1芯片组成一个训练TIle,并为其配以高带宽高密度的连接器,一个TIle的四向都能做到9TB/s的IO性能。单个TIle给以做到9 PFLOPs的BF16算力,特斯拉称其可能是业内最大的MCM。特斯拉用120个训练Tile组成了10机柜的ExaPOD服务器,借助3000片D1芯片达到了1.1 EFLOP的算力,而且每个Tile可以实现跨机柜无缝连接,均能做到9TB/s的性能。
特斯拉已经了做出了一台正常运转的训练Tile,未来会很快组装出一台ExaPOD。马斯克补充道:“我们计划在明年把Dojo正式投入运营。”可想而知,为何特斯拉要对其自动驾驶开展订阅收费了,这种规模的超算要是继续扩展下去,可能当前最强的超算富岳也无法与之抗衡。
特斯拉未来开放AI服务?
虽然特斯拉在AI研发的技术上可能超出了大部分车企,但和多数车企一样,他们并没有像部分AI公司一样选择一部分的开源。在问答环节中,一名嘉宾向马斯克提问,会不会提供一定程度的开源。马斯克沉思了一会说:“我们这么大的成本投入很难做到开源,不过确实人人都喜欢免费的东西。”他继续强调:“如果有厂商愿意花钱来买我们的技术授权,我们还是可以考虑的。”
马斯克回复网友 / Twitter
会后有网友在社交网络上向马斯克提问,有没有考虑过把Dojo的神经网络训练作为一项付费服务,马斯克给出了肯定的答复。其实这种做法也相当合理,毕竟特斯拉的优势是由软硬件实力共同打造的,仅仅将其超算给别人使用并不会降低本身的竞争力。如果特斯拉顺势又把机器人市场带火的话,也许之后人们眼中的特斯拉会再度转型。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)