张凯发布2023十大自动驾驶趋势预测 自动驾驶全面进入3.0时代!
2023年1月5日,第七届HAOMO AI DAY在北京举办。正值岁末年初,中国自动驾驶届开年盛会精彩来袭。本届AI DAY上,毫末分享了2022年三大战役稳健收官成果,展望2023年全球自动驾驶发展趋势,并发布毫末技术、产品最新成果。
第七届HAOMO AI DAY在北京举办
毫末智行智算中心“雪湖·绿洲”(MANA OASIS)重磅发布,这是中国自动驾驶行业最大智算中心,每秒浮点运算达到67亿亿次。有了MANA OASIS的加持,毫末MANA五大模型全新亮相升级,车端感知架构实现跨代升级,毫末的技术栈布局继续保持完整领先的态势,尤其在感知、认知等层面领跑行业,引领大模型、大算力、大数据发展方向,冲刺进入自动驾驶3.0时代。
毫末智行与火山引擎合作:建成中国自动驾驶行业最大智算中心MANA OASIS
产品层面,2024年上半年,毫末城市NOH落地将达到100城,这是中国第一个可大规模落地的城市导航辅助驾驶,以重感知、大模型的技术路线及技术应用、用户闭环的数据建设等方向保持领先位置,2025年毫末HPilot全面进入全无人驾驶时代。
毫末智行董事长张凯表示,2023年,毫末将继续把安全、可靠、实用的智能驾驶产品快速、大规模推向市场,赢得广大用户的认可和肯定。
2023十大自动驾驶趋势预测重磅发布,毫末2023年四大战役正式打响
“过去三年是毫末穿越创业生死线的关键期,但三年只是创业漫长旅程的开端。”张凯以《春归有期,AI照亮未来》为主题,回顾了毫末2022年发展成果,并公布了2023年发展规划。
毫末智行董事长张凯进行主题演讲
张凯表示“2022毫末三大战役稳健收官。”2022年毫末持续稳居中国量产自动驾驶第一名,三代HPilot产品搭载至魏牌、坦克、欧拉、长城炮等近20款车型,辅助驾驶用户行驶里程突破2500万公里;毫末城市NOH是中国第一个可大规模量产的城市导航辅助驾驶产品,目前软件封版达到交付状态;末端物流自动配送车已初步完成商业闭环,交付超1000台,小魔驼配送订单量突破13万单,商业化进程正全面提速;MANA学习时长超42万小时,虚拟驾龄相当于人类司机5.5万年。此外,毫末自研的AEB算法助力魏牌、欧拉、坦克的四款车型获得E-NCAP(欧洲新车安全评鉴协会)、ANCAP(澳大利亚新车安全评鉴协会)五星安全认证,搭载毫末HPilot的300台摩卡DHT-PHEV车型也已奔赴欧洲。毫末不但是中国首个自研AEB算法落地海内外的公司,也是中国首个出海欧洲、澳洲的自动驾驶公司。
毫末在乘用车领域产品高速迭代的背后,是毫末打造的业内独有的产品能力迭代铁三角:即场景化用户体验设计、人工智能技术、技术工程化能力。基于此,MANA已形成了强大的数据智能驱动体系,它包含六大闭环:用户需求闭环、研发效能闭环、产品自完善闭环、数据积累闭环、数据价值闭环、业务工程化闭环。
用户需求闭环中,毫末已建立5大维度、264类核心用户需求,日常可以从大量核心场景数据中提取核心问题;研发效能闭环则通过仿真工具提升研发效能。目前毫末仿真在研发中覆盖率超过70%,研发效能较两年前提升8倍;产品自完善闭环,让毫末的产品自完善闭环率超过70%,助力客户成功实现7次OTA在线升级;数据积累闭环中,毫末通过自研自动化数据采集、自动化数据标注工具,在2022年底数据成本降低98%;数据价值闭环,让毫末的全新车型复用开发只需4个月时间即达到量产落地状态,全新车型匹配标定2个月内匹配完成,标定效率全行业第一;业务工程化闭环,让毫末可以做到智驾产品100%一次性过线率,毫末成为国内唯一的智能驾驶技术工程化经验最丰富的公司。
张凯在现场讲到,毫末数据智能驱动体系的六大闭环能力,助力客户的智能汽车快速规模化量产,真正为用户释放价值,使智能汽车的智能驾驶系统从用户尝鲜阶段过渡到用户依赖阶段。毫末成为中国最早且唯一一个进入产品快速迭代阶段的自动驾驶公司。
“2023年,智能驾驶下半场的竞争将进入加速期,高阶智能驾驶产品商业应用将迎来大规模落地。”基于这一基础判断,张凯从行业、技术、产品、人才等方面对2023年自动驾驶行业发展做出十大预测。
行业层面,2023年自动驾驶将全面进入3.0时代;高级别智能驾驶将成为中端车型标配;全新一代芯片、传感器进入市场,自动驾驶生态呈现更丰富多样性。技术层面,大模型在数据合成、知识提取等方面的能力将助力自动驾驶迭代速度实现量级提升;自动驾驶系统比拼将由功能竞争转变为通勤效率竞争;超算中心会成为自动驾驶企业的入门配置。产品层面,城市导航辅助驾驶进入重感知阶段,大规模量产交付大幕拉开;智能驾驶的用户体验将从尝鲜转变为用户依赖;末端物流自动配送车整体成本降至10万元以内,将进一步改善生产关系。人才领域,张凯判断AI自动驾驶领域激烈的人才竞争将会延续到2023年。
面对未来所要迎接的趋势和机遇,张凯正式宣布毫末2023年发展规划,毫末打响“2023年四大战役”。最重头的是“智能驾驶装机量王者之战”,毫末将完成多平台、数十款车型、数十个项目的异步并行开发,通过智能驾驶流程化开发和标准化交付,进一步推进未来搭载毫末辅助驾驶产品的乘用车达百万量级的目标;其次是“MANA大模型巅峰之战”,毫末将在智算中心助推下,将大模型的应用落地进行到底;第三场战役是“城市NOH百城大战”,毫末城市NOH将有序落地到国内100个城市,引领城市导航辅助驾驶的大规模量产落地;最后是“末端物流自动配送商业之战”,毫末将继续坚持5S合作服务模式,助力合作伙伴快速实现产品和解决方案落地,加速无人配送行业应用进程。
张凯宣布毫末正式打响“2023四大战役”
“毫末始终认为,伟大的机遇要靠内在的实力去把握,在激烈市场竞争中取胜的关键,仍然是掌握核心技术。”演讲中张凯强调了毫末在技术研发投入上的坚定决心。截止目前,毫末已获得专利证书146件,全面覆盖数据融合、智能感知、智能决策、控制执行、模型算力提升等领域。“未来,技术研发仍将是毫末投入的重中之重。”
中国自动驾驶最大智算中心MANA OASIS成立,毫末五大模型全新亮相升级
第七届HAOMO AI DAY,毫末智行宣布智算中心“雪湖·绿洲”(MANA OASIS)正式成立。MANA OASIS是中国自动驾驶行业最大智算中心,由毫末智行与火山引擎联合打造,每秒浮点运算达67亿亿次,存储带宽每秒2T,通信带宽每秒800G。
毫末智行CEO顾维灏表示,“MANA OASIS让毫末拥有了超级计算能力,数据、算力充沛,毫末的技术产品能力将更加强大。在‘MANA OASIS’加持下,毫末将冲刺进入自动驾驶3.0时代。”
火山引擎总裁谭待表示,“我们很荣幸与毫末智行一道在智算中心领域达成深度合作,共同推动自动驾驶智能训练平台跨越式发展,加速自动驾驶技术敏捷迭代和商业化落地。”
数据驱动是自动驾驶发展的方向与趋势,海量的产品数据、超大规模的数据训练、大模型的应用等,都对算力提出了更庞大的需求。基于火山引擎丰富的大数据积累和底层技术,MANA OASIS实现的计算、存储、通讯能力,让数据更快速转化成知识,以实现将本增效的目的。
在数据管理能力方面,为充分发挥智算中心价值,让GPU持续饱和运行,毫末历经两年研发,建立了全套面向大规模训练的Data Engine,实现了百P数据筛选速度提升10倍、百亿小文件随机读写延迟小于500微秒。在算力优化方面,毫末与火山引擎合作,部署了Lego高性能算子库、ByteCCL通信优化能力、以及大模型训练框架。软硬一体,把算力优化到极致。在训练效率方面,基于Sparse MoE,通过跨机共享,轻松完成千亿参数大模型训练,且百万个Clips(毫末视频最小标注单位)训练成本只需百卡周级别,训练成本降低100倍。
在MANA OASIS的加持下,毫末MANA五大模型全新亮相升级,助力毫末自动驾驶高速发展:其中,视觉自监督大模型,让毫末在中国首个实现4D Clip的自动标注;3D重建大模型,助力毫末做数据生成,用更低成本解决数据分布问题,提升感知效果;多模态互监督大模型,则可以完成通用障碍物的识别;动态环境大模型则进一步使用重感知技术,降低对高精地图依赖;人驾自监督认知大模型让毫末的驾驶策略更加拟人化,安全及顺畅。
首先,视频自监督大模型,让毫末4D Clip标注实现100%自动化,人工标注成本降低98%。为了更低成本、更高效获取更多高价值数据,需要解决从离散帧自动化扩充到Clips形态的问题。毫末首先利用海量videoclip,通过视频自监督方式,预训练出一个大模型,用少量人工标注好的Clip数据进行Finetune(微调),训练检测跟踪模型,使得模型具备自动标注的能力;然后,将已经标注好的千万级单帧数据所对应的原始视频提取出来组织成Clip,其中10%是标注帧,90%是未标注帧,再将这些Clip输入到模型,完成对90%未标注帧的自动标注,进而实现所有单帧标注向Clip标注的100%的自动转化,同时降低98%的Clip标注成本。毫末视频自监督大模型的泛化性效果极佳,即使是在一些非常困难的场景,例如严重遮挡的骑行者,远处的小目标,恶劣的天气和光照,都能准确地完成自动标注。
其次,3D重建大模型,让毫末实现了数据“无中生有”,获得海量corner case(长尾场景)不再是难事。面对“完全从真实数据中积累的corner case困难且昂贵”的行业难题,毫末将爆火的三维重建NeRF技术应用在自动驾驶场景重建和数据生成中,它通过改变视角、光照、纹理材质的方法,生成高真实感数据,实现以低成本获取normal case,生成各种高成本corner case。3D重建大模型生成的数据,不仅比传统的人工显式建模再渲染纹理的方法效果更好、成本更低,增加NeRF生成的数据后,还可将感知的错误率降低30%以上。
第三,多模态互监督大模型,让车辆长出“火眼金睛”,精准识别异形障碍物。在成功实现车道线和常见障碍物的精准检测后,针对城市多种异形障碍物的稳定检测问题,毫末正在思考和探索更加通用的解决方案。多模态互监督大模型引入了激光雷达作为视觉监督信号,直接使用视频数据来推理场景的通用结构表达。通用结构的检测,可以很好地补充已有的语义障碍物检测,有效提升自动驾驶系统在城市复杂工况下的通过率。
第四,动态环境大模型,可以精准预测道路的拓扑关系,让车辆始终行驶在正确的车道中。在重感知技术路线下,毫末为了将对高精地图的依赖度降到最低,面临着“道路拓扑结构实时推断”的挑战。为此,毫末在BEV(鸟瞰图)的feature map(特征图)基础上,以标精地图作为引导信息,使用自回归编解码网络,将BEV特征,解码为结构化的拓扑点序列,实现车道拓扑预测,让毫末的感知能力,能像人类一样在标准地图的导航提示下就可以实现对道路拓扑结构的实时推断。毫末认为,解决了路口问题实际就解决了大部分城市NOH问题,目前在保定、北京,毫末对于85%的路口拓扑推断准确率高达95%。即便是非常复杂、非常不规则的路口,毫末也能准确预测。
第五,人驾自监督认知大模型,掌握高水平司机的开车技法,让驾驶决策更聪明。在探索“使用大量人驾数据,直接训练模型做出拟人化决策”方面,毫末为了让模型能够学习到高水平司机的优秀开车方法,全新引入了用户真实的接管数据,同时用RLHF(从人类反馈中强化学习)思路先训练一个reward model(奖励模型)来挑选出更好的驾驶决策。通过这种方式,使毫末在掉头、环岛等公认的困难场景中,通过率提升30%以上。这与AGI领域爆火的ChatGPT的思路相同,通过人类行为反馈来选出最优答案。
MANA五大模型全面提升了毫末感知和认知层面系统化的底层技术能力。“在五大模型助力下,MANA最新的车端感知架构,从过去分散的多个下游任务集成到了一起,形成一个更加端到端的架构,包括通用障碍物识别、局部路网、行为预测等任务,毫末车端感知架构实现了跨代升级。”顾维灏表示。这也意味着毫末的感知能力更强,产品力更强,向全无人驾驶加速迈进。
2023毫末城市NOH大规模量产落地,2025全面迈入全无人驾驶时代
现场顾维灏正式公布了毫末辅助驾驶产品HPilot的发展计划:预计到2024年上半年,毫末将完成HPilot落地中国100个城市的计划,实现点点互达。到2025年,更大规模全场景的NOH将更快落地,全面迈入全无人驾驶时代。