美国当地时间9月30日,特斯拉于加州帕罗奥图举办2022 AI Day活动。特斯拉CEO埃隆·马斯克与特斯拉工程师团队现身会场,带来了Tesla Bot人形机器人“Optimus”原型机的全球首秀,这款采用与特斯拉汽车同源人工智能科技的人形机器人,将率先带领我们走入期待已久的“次世代”。
从第一次工业革命至今,人类的生活发生了翻天覆地的变化。我们从坐马车到开汽车,从煤油灯到电灯,从翻阅浩瀚书海到通过互联网便捷地获取各种信息……每次科技进步都带领人类进入一个新时代,人们好奇人工智能时代何时到来。
其实回顾过去我们可以发现,面部识别技术、语音和文本转换、内容推荐机制、扫地机器人等早已潜移默化地影响着我们的生活——其实人类早已置身于人工智能时代。
而之所以人们并没有进入新时代的感知,是因为人们对人工智能期待,除了对应用方式的要求外,还在形态上更希望见到“人形”而不是机器,能够更加融入人类的生活场景。人形机器人无论在科技、经济、社会还是人类精神层面,都有着更大的意义。
应用特斯拉汽车同源人工智能科技,打造真正可落地的人形机器人
其实在特斯拉之前,已经有不少厂商发布了人形机器人产品,但是仅有特斯拉带来了更强的“现实感”。
因为特斯拉CEO埃隆·马斯克说:“我们需要以非常高的可靠性和非常低的成本大批量生产机器人,这非常重要。”他预计,Optimus可能在3-5年间即可量产上市,产量应该可以达到数百万台,它的价格将比汽车便宜得多,预估机器人最终价格将达到2万美元以下。
目前大多数厂商制造的机器人,或是成本过高无法量产,又或者因无底洞的投入而流产,如国内厂商最近发布的人形机器人制造成本高达70万元无法量产,而日本的ASIMO成本更是高达2000多万元人民币。
Optimus所应用的科技许多都与特斯拉汽车共通,如场景构建、视觉识别等,并与特斯拉FSD(完全自动驾驶能力)采用同样的神经网络学习技术。特斯拉在人工智能方面的积累不仅让特斯拉车辆具备比其他品牌产品更多的技术潜力,更让Optimus得以在短短几个月时间从概念走到现实。此次AI Day,特斯拉不仅带来了Optimus的原型机,更展示了即将投入生产使用的版本。这意味着几年后,如你我这样的普通人拥有自己的人形机器人不再存在于想象中,它不是昂贵的玩具,而是真正可以为我们服务的伙伴。
如今Optimus的原型机已经可以在办公室内灵活地提起水壶浇花、双手搬运物料至目标位置、准确定位周围人员并主动避让。据媒体报道,特斯拉弗里蒙特工厂中Optimus已经开始投入简单工作。
人类的形态将赋予机器人更多可能。智能汽车让人工智能技术得到了广泛应用,而一旦人形机器人如同现在的智能汽车一样大批量进入市场,人工智能将真正面对人类所面对的场景,清洁、烹饪、学习、休闲、育儿、养老……一个更广阔的世界正在人工智能行业展开。
马斯克说:“AGI(通用人工智能)的本质是涌现。”一个系统的个体数量急剧增加会使得群体突然出现之前没有的特征,这种现象即是涌现。生命、智能就是涌现的结果,单一神经元所传达的信号极为有限,甚至无法被解读,但数百亿的神经元叠加在一起就形成了人类的“智能”。人工智能正以指数级速度发展,当过了某个“奇点”之后,或许接近人类的智能可以“涌现”而出,届时,人工智能将迎来自己的“完全体”。
从人类角度认知世界,深入更多场景
为让Optimus更接近人类,特斯拉在过去一年中做了许多努力,将以往用于汽车上的软硬件技术与机器人结合。机器人躯干处搭载了2.3 kWh、52V电池包,高度集成了充电管理、传感器和冷却系统,可以支持机器人工作一整天。“这意味着从传感到融合、再到充电管理,都汇集到这一系统内,这也是借鉴了我们在汽车设计方面的经验。”特斯拉工程师表示。
Optimus身体共有28个结构执行器,关节采用仿生学关节设计,手部则借鉴了生物学设计,拥有11个自由度。在“感官”上,在经过完全自动驾驶能力(FSD)系统的实际应用验证后,特斯拉强大的计算机视觉已可直接应用于机器人。Optimus的“大脑”则采用了与Tesla车辆相同的芯片,支持Wi-Fi、LTE链接和音频交流,令它可以处理视觉数据、基于多个传感器输入做出行动决策、支持通信交流等系,统软硬件的安全性保障也再度提升。
同时,Optimus也通过动作捕捉“学习”人类,与世界互动的形态更加类人。以搬运物品为例,特斯拉工作人员通过穿戴式设备输入动作,机器人通过神经网络学习,从在同一地点完成相同的动作,到进化推演出在其他场景下的方案,从而学会在不同环境中搬运不同的物品。
目前,Optimus已经可以完成行走、上楼梯、下蹲、拿取物体等动作,既有能够承受约半吨重的钢琴等重物的执行器,也有可以完成轻薄物体抓取、操作机械装置、复杂手势等高精度动作的灵活双手。
马斯克表示,特斯拉要做的是“有用”的产品:“我们希望通过Optimus这样的产品帮助更多的人,提高工作效率。随着时间的推移,我们会考虑今后如何去改变我们的产品。”
关注人工智能安全,率先为行业树立标准
和汽车一样,在机器人方面,特斯拉也坚持“设计以安全为先”的理念,基于汽车安全模拟分析能力提升机器人安全性。在交通事故模拟中,特斯拉通过软件优化和改进车辆溃缩、电池保护等提升安全表现,而在机器人设计上,特斯拉也以同样的方式保障Optimus保护自身和周围人安全的能力。如在跌倒、碰撞等外部状况下,机器人将采取和人类一致的决策——最大程度优先保障“大脑”安全,其次是躯干电池组的安全。
AI Day的问答环节,马斯克还指出了人工智能的安全问题。“人工智能安全是非常关键的,”他说,“人工智能安全应该有政府层面更好的监管,应该建立相应的监管机构,任何可能影响公共安全的事情都需要有这样的监管。”
如同汽车、飞机、食品和药物等“会影响公共安全”的领域已经有了较为完善的监管方式,马斯克认为人工智能也需要类似的措施:“我们需要有一种裁判的角色来确保AI对于公众来说是安全的。”
人工智能安全目前还没有统一的准则,Optimus的量产将促使行业与各部门与机构加速标准的制定,并率先提供可供参考的范本。
打造“全球最强超算”,引领行业发展
智能汽车为了实现安全可靠的自动驾驶,所需的训练数据就是难以想象的庞大,而在应对更复杂场景的人形机器人身上,需要更强的训练算力、更大规模数据的训练和分析,如何解决更快处理这些数据,决定着人工智能的发展速度。
特斯拉自研的Dojo超级计算机将胜任这一任务。特斯拉从一开始就意识到高算力、高效率芯片的重要性,特斯拉工程师表示:“我们要让Dojo超级计算机成为在人工智能训练方面全球最强的超算系统。”
目前特斯拉仅在代码、设计方面就已经实现了30%的训练速度提升,如通过自动标注技术,特斯拉将训练场景的标注速度大幅提升。而只使用一个由25个D1芯片组成的训练模块,就能实现6个GPU Boxes的性能,且成本低于一个GPU Box。只需要4个Dojo超级计算机机柜的算力,就能实现72个GPU机柜的自动标注性能。
在高效的神经网络训练下,首先受益的是特斯拉FSD的发展,其软件在技术层面已经逐渐趋于成熟。在最近版本的更新中,FSD如同人形机器人一样变得越来越类人,以更接近人类反应的方式处理驾驶情景。
比如在无保护左转的场景中,若路口对面有车辆右转、路口右边有车辆直行,左边斑马线上还有人牵着狗行走,FSD系统会给出多种方案:加速在行人、车辆之前左转入道;等待行人和右转车辆经过后,在右侧车辆经过路口前左转;或者等待行人和两边车辆都经过后再左转。以往FSD可能会采用较为激进的第一种方式,现在则会选择较为温和自然、符合大部分人类司机思维的第二种方式。这也是人工智能安全的一种体现。
特斯拉表示将在2023年第一季度布置第一批10个Dojo超级计算机机柜,即算力超过1.1EFLOPS的ExaPOD,将自动标注能力提升2.5倍;将来,特斯拉共将在帕罗奥图布置7个这样的集群,提供难以想象的庞大算力,为自动驾驶和人形机器人的发展提速,引领行业发展。
解放劳动力,改变人类命运
自动驾驶在交通行业带来的变化可谓是革命性的,运输生产效率至少可以提高一个数量级甚至更多。而机器人对于社会来说会有更大的意义,将改变人类的命运。
马斯克表示:“谈到机器人就会想到经济发展。经济的根本要素是劳动力,如果我们可以使用机器人来实现更低的劳动力成本,终将带来更快速的经济发展。”
以人工智能为代表的第四次工业革命正在如火如荼地进展,作为人工智能最理想的硬件平台,人形机器人在加速解放第一、二产业劳动力的同时,也将大比例释放第三产业的劳动力,出生率低、老龄化带来的劳动力短缺问题将迎刃而解。
不仅如此,将来在机器人的参与下,人们可以自由选择工作,其中简单的重复性工作可交由机器人完成,这类工作对于人类而言将成为一种选择,而不是必须。更多人可以进入人类更有价值的领域——创造、研发、慈善、民生……让人类走向更高度的科技和精神文明。
在Dojo超级计算机加持下,特斯拉将在人工智能和人形机器人领域迅速发展,而目前离我们最近的人工智能技术,当属已在特斯拉汽车上落地的FSD。相比采用同源人工智能科技、已经实实在在走入生活的特斯拉汽车, Optimus这款“最接近大规模量产”的人形机器人仍然需要几年的时间真正与我们见面,因为特斯拉采取了非常谨慎的态度,保证带来可靠、安全的产品。