【亿欧智库】2023中国智驾大模型应用研究报告正式版.docx
《【亿欧智库】2023中国智驾大模型应用研究报告正式版.docx》由会员分享,可在线阅读,更多相关《【亿欧智库】2023中国智驾大模型应用研究报告正式版.docx(95页珍藏版)》请在课桌文档上搜索。
1、卬国智能电前汽车”,CHINASMARTELECTRICVEHICLEmSERIESREPORT2023中国智驾大模型应用研究报告一二】幕了二:,一一二.1亿欧智库CopyrightreservedtoEOIntelligence,October2023(127607)(127607)强张库丫忆欧智库(127607)亿欧智库:亿政智库(127607)强张智欧MIMicscwsrv*K2 ISA* mMT亿(127607)强张智欧亿(127607)强张智欧亿开始在自动驾驶行业内盛行起来。至2023年,智驾相关大模型开始大量出现,如华为盘古大模型、百度文心大模型、毫末DriVeGPT等。基于上述背
2、景,为了更深入地了解智驾大模型的定义、技术应用现状、产业竞争格局以及遇到的挑战等,亿欧智库撰写了2023中国智驾大模型应用研究报告,并针对中国智驾大模型应用进行深入地研究和分析。2023中国智驾大模型应用研究报告核心观点“力(127607)(127607)(127607)目前,智驾大模型没有一个公允定义,并且产学研不同领域的专家对智驾大模型的定义也不一样,但结合各专家的观点来看,智驾大模型具备多模态输入、自监督学强强强一,一-atB库库库GBBtUJI.IW-SMW%-rE.MRM*MMtMtft.SlffMlMVSItlMMUI*V 欧欧欧亿亿亿练为车辆提供更有效的感知融合效果与实时建图方案
3、,最终让车端实现与人类司机行为和思维一致的感知、预测、规划等能力。 智驾大模型最重要的应用是数据闭环,相比于传统数据闭环而言,当前的数据闭环对自动驾驶系统赋能最多的主要是数据挖掘、自动标注、模型训练、仿真测试四个应用方向。从感知侧的数据采集开始,会先根据筛选器的设置来进行数据挖掘,随后通过自动化标注来对数据打标签,再对原模型反复训练并经过仿真测试后,最后对车端/模型进行优化,在经过反复地不断迭代循环后,使得整个数据闭环能力能够不断提升。 对于已布局或正将布局的企业,智驾大模型玩家主要可分为四类,其中新势力主机厂以自研为主,而传统主机厂持有保守观望的态度;科技企业凭借强大的Al技术背景和资本实力
4、,构建了以云服务为基础的垂直服务体系;Tierl以自研基于BEV感知的垂域大模型为主;芯片企业主要是优化芯片的开发生态,以便客户能在自家芯片(127607)(127607)(127607)遑强富XXvk9av*rzuMa.彳乙彳乙库曾R库智2023年,智驾相关大模型开始大量出现,如华为盘古大模型、百度文心大模型、毫末DriVeGPT等。亿欧智库:Al大模型发展历程性能(参数、层媾)语言类大模型CV类大模型通用类大模型(127607)强X-张库智得相关大楼5!智欧亿基于这!则的少M库3欧Z195020062014强(127607)富-张JSs导入IB/亿开发期GANGoogleOpenAIGPT
5、2,二工、NVDli.qpM小、G2)百度文心大模型阿里巴巴M6毫末DriveGPTUniADBEV+Transformer(127607)ThinkTwice微软FlorenceDALL强-E2202120222023时间8U77数据来源:亿欧智库20201.2.1数据端:基于BEV+Transformer的融合架构f可使大规模多模态数据更好地融合了亿欧智库(127607)(127607)(127607)从多传感器的融合趋势来看,目标级融合(后融合)是当前行业内主流的融合方案,虽然算法开发难度较低,但融合精度较低、关键信息易缺失,不适合未来融合趋势的发展。数据级融合(前融合)是行业发展的目标
6、,但技术壁垒高,短期内方案落地较难。所以,在不丢失关健信息的基础上,富富富张张张库存年智智智欧欧欧况。相反,基于BEV+Transformer的特征级融合方案,可以通过注意力机制提取目标物特征,并在鸟瞰图下脑补出完整的目标物信息,有利于提高整体感知融合精度。亿欧智库:多传感器的融合趋势变化亿欧智库:基于BEV+TranSformer架构的特征级感知融合方案优势目标级融合(后融合)优势:算法难度低、各传感器之间解耦性强劣势:关键信息容易丢失、整体融合精度低目标级融合方案采用的算法仍然是基于规则的运算,虽然方案整体的算法开发难度较低,但有效信息容息缺失.SS引出感知系统读报.鸿报等同SLa(127
7、607*1E.MfiMW劣势:算力消耗较高、时空同步难、运动*联误差大A数据级融合方案目前在行业内极少被使用,整体技术难度较高,在模型开发层面存在较多的棉霞特征级融合(中融合)之间融合效果较好gl公方MnMtt行*.优势:数据损失少、目标特征级信息使得不同传感器(127607现在5个摄像头(共8颗摄像头)中,但是每个摄像头可能只露出了卡车部分车体。对于传统规则算法(比如卡尔曼滤波),算法只会在出现卡车车体的摄像头内进行识别检测,强X张庠欧亿遮挡区域的目标,提高识别与融合精度。车轮、;瞬、车轮、油箱、窗户、车身、Transformer烟囱、窗户等烟囱、窗户等触机等融合效果好,容车身、轮子等特征级
8、融合(中融合)特斯拉在2021年的AIDAY,展示过一个大型卡车路过自车的场景,在某个时刻卡车同时出来源:亿欧智库高价值数据的比例低高价值数据通常指的是corner case (即长尾场景数据),随着L2级以上的自动驾驶功能 不断演进,越来越多的corner case会被挖掘出来,从而转换为common case,但是, 通过采集车收集回来的数据,由于数据最有限,使得ComerCaSe的比例会越来越低.(127607)b各类型数据的需求同步难Q27607)强强成熟导致了标注仍需依赖天工签:1/L高成本麻 诉、当前的演业的取蠢处正(存在大的手M工作比例,Ka斓标注环节,防标注肾法的不W欧K1.2
9、.1数据端:智驾大模型具备数据闭环的能力,解决主机厂在数据处理层面的痛点亿政智库(127607)(127607)(127607)自动驾驶产业在数据处理层面,面临着低效蔚口高成本的双重问题,比如cornercase的挖掘效率低、自动化数据处理程度低、数据标注和存储成本高等,这些因素阻碍了自动驾驶技术迈向高阶自动驾驶。然而,数据是驱动自动驾驶算法迭代的必要属性,能够利用好数据的公司,才可能进入K寓富nMrwrL0L2:用户期待系统能力,系统被认为是不安全的IaL4L5:用户期待=系统能力,系统被认为是安全的:、:LUULIWI人的接程181安全感对不规则障碍物的感知能力差强基于规则的算法模型I别与
10、融合精度低车道拓扑结构识别难基于AI的fr=WUA提取多践猛蝠皿3加融合精度建立3D鸟瞰图空间,增强拓扑信息7)增加时序信息,提升未知物体感知效地图采集成本高地图更新频率慢、鲜度低合规要求高II实时建立局部拓扑地图采用SDMaP或者众包地图仅采集系统所需的交通信息驶系统驾驶员自.用户期待系统能力力不安全用户期待=系统能安全实现L3-L5高阶自动驾驶功能将面对较高的场景复杂性动态道路信息承担大部分驾驶工作(1276(富张/更多的交通参与者:大小货车、行人、电动自行车、清扫车等no-7c/更复杂的交通规则:不同规则的红绿灯、车道(1276线、环岛等富,张R欧-数据来源:朱西产教授公开演讲、亿欧智库
11、;ODD:OperationalDesignDomain(运行设计域)解决高阶自动驾驶功能突破的关键,是提高对周围事物的理解,以及对复杂场景的处理能力,尤其是针对感知和定位方面遇到的问题。智驾大模型将凭借端到端的自学习和环境适应能力,成为实现高阶智驾功能的关键(127607)(127607)(127607)亿政智库13.1区别于通用类大模型,智驾大模型的部署难度高、数据维度广、模型设计复杂目前智驾大模型没有一个公允定义,并且产学研不同专家对智驾大模型的定义也不一样,但结合产学研专家的观点来看,智驾大模型具备多模态输入、自监督学习、端到端学习范式以及大规模参数的特征。但是,相比于通用类大模型,智
12、驾大模型的主要差异在于:部署难度高、数据维度广以库亿亿亿张用类大模型解决所有自动驾驶的工程化问题,而是需要一个更系统的部署方式。亿欧智库:产学研不同角度对智驾大模型的定义A:当二个模型在多模态预训练领域有一定突破从产学研角度的不同定义后,它既能处理文字信息,也能处理图片信息,同时也能对一些自动驾驶模型做出一点微调,这类模型可以称之为自动驾驶大模型。一,张耨欧从数JK的度来看.“0型可帔就是只Vf一冲甥技芟型.比如视觉图像如防自化e三s触-三s三t三三三ii三涯-而专家B:自动驾驶大模型一方面需要樗参数量达到至少IOB到IoOB的规模,另一方面预训练数据需要达到500万至1000万帧的图像.个任
13、务,最终形成一个基于TranSfOrmer网络架构的端到端的模型。专家D:自动驾驶大模型是在云端部署文本单模态通用大型语言模型或多模态通用类语言大模型,在边缘端部署垂域BEV多模态大模型,最后在移动端实现局部自主。数据来源:专家访谈、亿欧智库.亿一(127607)专家E:(127607)亿欧智库:智驾大模型的特征及差异多模态输入:自动驾驶大模型通常接受厂-一多种模态的输入:包括图像,T到表器数一:据、文本等,这使得模型能够充分利用不同类型的数据,提升感知和决策的准确性.!强智驾大模型的特征自发匍学习:口动雪姜大模咖常来用欧日空他习的方式汨行U塔,利用大n亿cKt在SeMWeHKllS.sww签
14、的数据上进行微调.这种方式可以大幅减少对标注数据的依赖。端到端学习范式:自动驾驶大模型通常采用端到端的学习方式,将所有感知数据进行统一的输入和输出,通过一个统一的模型进行学习和推理,从而避免多个模块之间的信息传递和集成问题。A大规模参数:自动驾驶大模型的参数规,弓虽模通常达到百亿甚至千亿级别,这种大i张;HIKNNIHal三r三fJIS力和泛化能力。.库欧亿:驾大模型与通用类大模型的异部署难度高:自动驾驶大模型由于车L端算力限制.目前艮能觥嵋矮缸的大模型部署在云端,从而逐步优化;车端的/模型,最终让车端实现局部端到端的学习方式,优化自动驾驶系统不同不壬务,比如感知、决策、规i划等.数据维度广:
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 亿欧智库 2023 中国 智驾大 模型 应用 研究 报告 正式版

链接地址:https://www.desk33.com/p-1218284.html