高端装备制造:海外人形机器人巨头深度剖析.docx
《高端装备制造:海外人形机器人巨头深度剖析.docx》由会员分享,可在线阅读,更多相关《高端装备制造:海外人形机器人巨头深度剖析.docx(14页珍藏版)》请在课桌文档上搜索。
1、高端装备制造:海外人形机器人巨头深度剖析.特斯拉:由人类打造、为人类服务的机器人1.l.后人工智能时代机器人将取代人类进行重复性劳动Optimus定位为解放劳动力,可替代4亿岗位。特斯拉的人形机器人项目OPtimUs(擎天柱)最早于2021年AIDay上公布(早期名称为TeslaBot),定位为解放劳动力的通用型机器人。人形机器人作为模仿人类的拟态物,相比机械臂等传统机器人,能无缝在众多场景替代人类工作。马斯克表示,在后人工智能时代机器人将取代人类进行重复性劳动,生产力充足的前景下可行的经济模式是政府实行全民补贴,而体力劳动将成为个人的选择。根据世界银行数据,2022年全球劳动人口约343亿人
2、,劳动力人口已呈现下降趋势,据麦肯锡报告预测,到2030年全球约4亿人的岗位将会被自动化机器人替代,即11.7%的劳动者会被机器人所取代。以Optimus单价2万美元计算,长期全球人形机器人市场天花板达8万亿美元,是一个庞大的蓝海市场。高自由度结构与精细控制初步具备实用性。目前OPtimUS原型机身高约172cm,体重约57kg,力量能单手举起一架钢琴。其身体共有28个自由度(下一代预计超过200个自由度),采用了更加灵活的弹簧负载设计与6种类型执行器,关节采用仿生学关节设计,模拟人类关节与肌腱形态,手部是Optimus最大亮点,采用人体工程学设计,拥有11个自由度(下一代预期27个),相比之
3、下工业机器人全身一般仅有4到6个自由度。特斯拉已于演示视频中展示了精细手部动作,在Dojo超算的支持下OPtimUS利用动作捕捉对人类活动方式进行学习,可抓取杂物,力道控制精细,甚至不会打碎鸡蛋。根据特斯拉介绍,OPtimUS已经在特斯拉弗里蒙特工厂试验简单工作,如移动零件或用扳手将螺栓固定在汽车上。1.2. 自动驾驶的终极形态,FSD自动驾驶超算机器人三位一体人形机器人是自动驾驶技术的终极形态。自动驾驶的本质就是有轮子的机器人,特斯拉已经打通了FSD软件(完全自动驾驶)和机器人的底层模块,特斯拉在FSD上的积累将使得人形机器人全面受益。特斯拉将FSD从其汽车转移到了机器人,并经过调整以适应机
4、器人的身体和不同的工作环境。特斯拉主要通过对人进行真实世界彳壬务的运动捕捉,如提起物体、行走等,然后使用反向运动学技术让OPtimUS重复这些动作,同时应用了在线动作适应技术,使这些彳壬务更加灵活,并能根据环境进行调整。同时由于采用了相同的FSD系统,机器人可直接复用电动车成熟的视觉系统,由于特斯拉决定采用同样的摄像头方案,而不是LIDAR传感器,因此可直接移植到人形机器人上。自动驾驶为机器人搭建技术框架。机器人的反馈机制本质上是与自动驾驶相同的架构,即感知层-决策层-执行层。特斯拉在汽车上使用自研的HW硬件与FSD软件,而机器人的感知层和决策层可直接复用自动驾驶技术,特斯拉基于Transfo
5、rmer的BEV方案结合时序队列与OccupancyNetworkz实现包含空间和时间的4D感知,即使在纯视觉方案下仍能实现高效的环境感知。在决策层上,模型训练阶段的数据标注和模拟环境同样可复用于机器人上,因此Optimus能在立项仅一年就拿出展示机型,远快于其他人形机器人厂商,软件层面上只需要更多优质的训练数据积累就能快速提高运动能力。图2人彩机器人可复用自动驾驶技术框架感知层决策层执行层收集分析数据周边环境定义规划数据华驶场景懂判控制车辆Dojo超算云端训练AI的基石。超级计算机Dojo基于特斯拉自研的7nmDl芯片,具备采集、训练和进化的能力,能够更理想的采集道路交通标识、生物形象、路面
6、情况等信息。该芯片将354个独立处理器封装在一起,产生362TFLOPS的计算和440MB的内部静态随机存取存储器存储。在保持完全可编程性的同时,DOJO强调资源分配和极高带宽的互连,使其能够从小型系统一直扩展到exaFL0P超级计算机。在产品形态上,Dojo的最终落地单位是名为ExaPOD的超级计算集群,它集成了3000颗Dl芯片,包含120个训练瓦片,最终能够实现高达LIEFIops的BF16/CFP8峰值算力。2023年7月特斯拉Dojo正式投产,预期到2024年2月,特斯拉算力规模将进入全球前五,2024年10月总规模将达到100Exa-Flops,相当于30万块英伟达AlOO显卡的算
7、力总和。Dojo超算为机器人提供最强AI大脑。超级计算机Dojo被特斯拉称为PureLearningMachine(纯学习机器),特斯拉FSD芯片最大的优势就是只有一个客户,而Dojo也是同样的设计思路,它是一种专为深度神经网络训练而生的可拓展系统。传统CPU和GPU都不是为机器学习而设计的,在Dojo之前的超级计算机主要由专业的计算机设备制造商研发、集中在国家级实验室,主要用途在中长期天气预报、油气勘探、物理模拟、量子力学等超大型计算应用场景;相比之下,Dojo的应用场景主要是以视频和图像数据训练AL专为自动驾驶和机器人训练使用。原本在AlOO阵列上需要进行一周的自动驾驶学习彳壬务,在Doj
8、o上可能只需要2至3天就能完成,而人形机器人由于高自由度以及四肢协作,训练数据体量远大于自动驾驶,根据特斯拉数据显示,在同样的成本之下,Dojo超级计算机相比英伟达AlOO能够实现4倍的性能、能耗比提升13倍。技术整合带来人形机器人奇点。OPtimUS采用了与Tesla车辆相同的芯片,支持Wi-Fi、LTE链接和音频交流,其系统软硬件的安全性保障也正在不断提升,通过量产与技术发展控制制造成本,而软件复用汽车FSD系统、算力调用Dojo超算,在规模化生产后预计远期成本远低于一辆汽车。Optimus的版本迭代十分之快,会远超汽车等产品,自2021年AIDay公布一年后已改进到第二代,在2023年5
9、月的股东大会演示视频上第二代人形OPtimUS已能流畅行走。据证券时报,马斯克在2022AIDay上透露,OPtimUS有望在3-5年间量产上市,预期产量可以达到数百万台,预估Optimus机器人稳定生产后的价格将达到2万美元以下。1.3. 未来展望:仍在等待GPT时刻的到来机器人领域仍在等待着大脑的进化。GPT模型的自然语言处理已经汇聚了自回归变换器+下一个词预测+强化学习高级特征的配方。然而,对于人形机器人的技术而言,还没有算法能够达到同样的效果。目前OPtimUS可期待的应用场景还是重复性的小场景工作,因为FSD模型无法对未知信息进行预测,近日特斯拉Optimus的官方推特账号上传了新的
10、演示视频,Optimus能够仅依靠视觉来对物体进行分类,还能完成难度更大的瑜伽动作,采用了类似于特斯拉自动驾驶技术FSD12的端到端神经网络控制:视频输入,控制输出,并由此来控制各个部件和关节的移动。谷歌Deepmind已在测试多模态模型RT-2控制机器人,内嵌120亿参数PaLM-E模型以及550亿参数PaLI-X模型的RT-2在陌生任务中的平均准确率相比RT-I翻倍,达到62%o如果行业能打造出RobotGPT的基座模型,实现零样本或少样本学习,则能在更复杂乃至陌生的环境中执行任务,实现人形机器人的智能涌现。Optimus初步落地可期,应用想象力扩大。根据马斯克发言,Optimus预计将于
11、今年11月进行行走测试,之后在生产稳定后开始加速,明年进入工厂测试实际工作。此外,OPtimUS的核心硬件模块化同样有巨大的应用潜力,透过将Neuralink脑机接口植入物与机器人手臂或腿结合,可构成优秀的假肢,为被截肢的人提供一个优秀的机器人身体,可能只需要6万美元。2 .波士顿动力:机器人领域的顶尖实验室2.2. 最强动态性能的跑酷机器人Atlas机器人领域三十年积累,造就最灵活人形机器人。波士顿动力(BostonDynamics)由麻省理工学院副教授马克雷波特于1992年创立,最初的机器人是为美军研制的大狗(BigDog)机器人,可在废墟、泥地、雪地、水中行走,奠定了Atlas运动能力的
12、基础。波士顿动力目前最先进的机器人Atlas身高1.5米,体重80kg,速度1.5ms,依靠28个液压执行器实现各种高难度运动,足部踝关节由两个直线执行器并联驱动,散关节和手臂多是伺服摆动缸。Atlas不仅拥有卓越的物理机动性,更因其高级的控制系统和算法而独立于众,多次在演示中展现出近乎超乎人类的运动与平衡能力。22.创新硬件与算法沉淀,Atlas实现卓越运动性能Atlas以高性能电液驱动系统、复杂的AI算法和多模态视觉感知实现优异运动性能:强大运动性能得益于独特液压驱动。不同于多数机器人采用电驱,Atlas为了获得最强的机动性采用液压伺服驱动,具有高负载驱动特性,即使是高难度动作如后空翻等依
13、然能平稳落地。AtlaS机器人全身有28个自由度,在多个液压关节与算法的协调配合下,Atlas已经可以熟练的完成垂直起跳、跨越障碍、后空翻,甚至完成整套的舞蹈以及手脚都参与的跑酷功能。表3Atlas各关节自由度I身体部位自由度具体应用单腿3个小腿抓向自由度、大腿蚁向自由度、胯部横向自由度单脚踝2个横向和纵向自由度,通过双液用缸的联合驱动能够实现纵向、横向、轩向三种运动状态,这三种运动状态可增强行走过程中单腿支撑时腿部的运动能力腰腹2个轴向和径向自由度单臂6个肩部轴向和径向自由度,大臂轴向和径向自由度,小臂轴向和径向自由度墓蛀土卷!个龟由息一一三*及离线模板与在线精细控制构成独特运动算法。Atl
14、as的离线轨迹库模板包含了众多预设的最优运动方案,会向决策层MPC(模型预测控制)提示最佳的解决方案选择,此后MPC利用机器人的动力学模型来预测其未来的动作。这种控制器的核心工作机制是优化计算,确定机器人当前应该进行的最优动作,从而随着时间的推移产生最佳行为。当遇到如环境改变、脚滑等实时因素时,MPC会调整机器人的发力、姿势和动作的发生时机来适应。此外,MPC还能跨行为边界预测下一步的行动,例如知悉跳跃后要进行后空翻,它便会自动创建行为之间的过渡,确保动作连贯。在MPC3.0版本中,Atlas已能主动使用参数已知的工具,在官方演示视频中Atlas用木板搭了一座桥通过障碍。TOF+预设地图构成A
15、tIaS的眼睛。在感知层,Atlas使用TOF深度相机每秒生成15帧的环境点云,这些点云基于大规模的测距集合。它的感知软件采用多平面分割算法从点云中提取平面,并将此信息输入到映射系统中,为Atlas构建通过相机看到的各种对象的模型。当Atlas执行扩展的跑酷行为时,波士顿动力的研发团队为其提供了一张高级地图,指明了它应该前往的地方和沿途应该执行的动作。尽管这张地图并不完全与真实路线的几何形状匹配,但它提供了障碍模板和注释动作的近似描述,Atlas则利用这些稀疏信息进行导航,并用实时感知数据来填补细节。23.从机械狗Spot开始,商业化前路漫长机械狗Spot率先开启商业化之路。Spot是波士顿动
16、力2015年2月发布的四足机器人,身高仅一米有余。SpotMini是Spot机器人的更加小型且防水的版本,加上机器臂重量29.5kg,一次充电可以跑90分钟,相比波士顿动力其他液压结构驱动的机器人,SpotMini是纯电动的,因此是波士顿动力最安静的机器人之一,搭配多种传感器,可以完成各项复杂的动作以及巡航,如无人区巡逻、寻找气体泄露、公园安保等。SPotMini是公司商业化探索的第一步,于2020年6月开始公开发售,每只定价74,500美元,折合人民币超过50万元。SPotmini整体的设计以高集成度、高任务作业能力为主,继承了波士顿动力其他机器人的高运动能力,最优异的性能就是楼梯攀爬,其采
17、用全视觉方案构建全局地图,进一步选择合适的落足点避开台阶边缘以及不安全的落足区域。难以降本量产约束商业化落地。波士顿动力从学术领域实验室诞生,因此机器人的设计多是不计成本以性能为导向,早期为美国国防高级研究计划局承包项目,由于商业化进程不及预期,被谷歌收购后又经历两度易主,2017年6月软银接手、2021年6月由现代汽车接管。根据AnalyticsIndia杂志,专家估计Atlas单台成本至少为15万美元(折合人民币109万元),即使是更有性价比的SPot机械狗,公司表示截至2023年6月售出超过LoOO台。尽管Spot在市场中获得了一定的反响,但相较于Atlas等高端产品的技术潜力,其商业化
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高端 装备 制造 海外 人形 机器人 巨头 深度 剖析

链接地址:https://www.desk33.com/p-1059205.html