文|刘俊宏
编|王一粟
2025刚开年,智能汽车今年竞争的主旋律便已经定调。随着武汉、北京等城市即将允许L3自动驾驶上路,卷了一年高阶智驾落地的玩家们终于到了“决战时刻”。
面对这场竞争,理想汽车(下简称“理想”)选择率先出手。
1月16日,理想汽车全量推送了OTA7.0版本车机系统,并将高阶智驾升级到 AD Max V13.0版本。与特斯拉的“期货”不同,理想已经给车主们准备好了拥有800万clips训练数据、无限接近零接管、全场景端到端、车位到车位“丝滑无断点”的智驾体验。
值得注意的是,此次明确的智驾版本号,背后是理想要让用户更好感知智能驾驶变化的决心。事实上,自理想OTA 5.0切换BEV架构,上线城市NOA以来,理想内部就启用了AD Max的独立版本号进行管理。如今的V13.0版本,意味着过去一年理想共完成了12次AD Max重大更新。并且后续AD Max版本号也将按照产品的更新及优化进行版本号迭代和维护。
政策的松口、无限接近“零接管”智驾的落地,意味着一个新的高阶智能驾驶的时代已经到来。
在智驾落地的压力下,车企和智驾供应商们开始“着急”起来。其中,奥迪和广汽全面抱上了华为的“大腿”;比亚迪宣称要在智能化方面投入1000亿;地平线新推出了智驾掉头和园区漫游功能。
就在智能汽车玩家们狂卷智驾能力的节点上。理想汽车CEO李想却在2024年12月25日-27日连续的三天理想AI Talk中,再次强调理想汽车将成为一家全球领先的人工智能企业。
为何理想要在汽车智能化竞争最激烈的时刻认为AI比汽车更重要?背后或许是李想洞察到公司落地AI所取得的成果。
聚焦产品层面,理想在2024年实现了汽车智能化从追赶、持平到领先的追越。在智驾上,理想仅用了3个月便完成了无图NOA到端到端+VLM智能驾驶的迭代。在技术的迭代下,消费者也形成了理想=智驾的认知。
统计数据显示,截至2024年12月31日,理想NOA导航智能驾驶里程已占智驾里程的70%。同时,在理想产品最主要的30万及以上的价格段内,AD Max(智驾顶配版)的交付量超过75%。
“增强我的能力、成为我的助手、成为我的硅基家人”。
随着用户对智驾逐渐依赖,李想也看到了一条AI连接物理世界和数字世界的道路。AI以汽车作为载体,为用户提供越来越丰富的服务和价值。或许在李想看来,未来Robotaxi提供的服务还是过于“冰冷”,有人情味的“车和家”才是更接近智能汽车产品的第一性。
为了实现AI能更懂人类的梦想,据理想汽车数据显示,每年投入上百亿元研发,有近50%用于投入AI。在大模型这边,李想也提出了公司要在未来几年内把大语言模型的基座模型做到行业前三的要求。如此,在视频(VLM)大模型的结合下,懂视觉和语言的AI,最终将彻底理解这个世界。
在2024年完成智驾赶超的理想,能实现李想宏大的AI理想吗?
L3智驾,理想准备好了
“下半年如果我还看不到变化,理想智驾拿不到头部位置的话,那你这个负责人就可以不用干了。”回忆起2024年初李想对智驾落地的督促,理想汽车自动驾驶研发副总裁郎咸朋至今都倍感压力。
在李想看来,理想汽车是否能顺利落地高阶智驾,已经到了影响“生死存亡”的地步。
而在此之前的2023年,郎咸朋带领的团队和国内大多数的智驾公司一样,一直在尝试用规则的方式解决Corner case(边界情况),就是出一个问题,写一个代码去解决。这导致理想汽车在2023年落地高阶智驾的节奏整体偏慢。
2024年上半年,高阶智驾已经成为消费者选车考虑的重要因素。根据工业和信息化部披露的数据显示,中国乘用车L2级辅助驾驶及以上新车渗透率达55.7%,其中具备领航辅助驾驶(NOA)功能的新车渗透率达到11%。
换句话说,是理想产品主打的30万及以上的价格段内(在整体车市的销量占比大概为15%左右),消费者已经形成了标配高阶智驾的共识。
事实上,理想智驾起步的目标非常高。早在2023年4月的上海车展,理想汽车就喊出了城市NOA落地100城的目标。但半年过后,这个目标就缩水为“在100城开通通勤NOA”。2024年初,李想带队前往美国体验特斯拉FSD,随后理想的智驾才开始转向无图NOA。
此时,各路智驾供应商们,开始向车企兜售无图NOA解决方案。同时,由于AI大模型的催化,智驾技术领先的玩家们也都开始了初步“端到端”的探索。
“还是回归产品和用户体验上,而不是追求指标的领先。”诚如郎咸朋所说,在与李想达成智驾研发要用“端到端”技术和注重体验的共识之后,2024年4月开始,理想的智驾能力“直线起飞”。
以OTA大版本为节点,在2024年5月,理想智驾主要还是聚焦在场景细节调优。从7月的6.0版本更新无图NOA开始,理想智驾开始更注重功能和体验。
作为佐证,理想在2024年8月更新的车位随心画功能,智驾能够理解用户的停车意图,想停哪里就停哪里。离车泊入功能也升级到了关门泊入,在用户对理想智驾的信任下,用户自动泊车再也不需要掏手机控制了。
10月,理想智驾更新至“端到端+VLM智能驾驶”后,理想的智驾能力再一次飞跃式提升。光锥智能在实际体验之后,发现这个版本的智驾不仅能顺利通过环岛。而且在无保护右转时,不会向其他厂商的智驾一样,还需要“踩一脚刹车”。
参考理想用户社区@仟仟爸爸的分享,理想智驾能够轻松面对环岛+突然加塞+变道绕行的复杂操作。用户全程只是吐槽了一下加塞车辆,然后用“也行”,点评了一下变道操作。
如今,随着已经推送的AD Max V13.0更新,可以预见,理想智驾在复杂的中国道路可以实现“零接管”。这也是符合自动驾驶L3标准的表现。
消费者也开始逐渐信任智驾,并愿意为此买单:“买理想就买智驾版”,成了消费者的共识。
李想曾经在采访中对光锥智能透露,2024年上半年,理想曾经有几个月被问界的销量压制的很难受,但在智驾能力上升后,理想的销售们都能挺起腰杆让消费者“随便对比”,而后,理想的销量也随之打了一个漂亮的翻身仗。
根据理想统计的数据显示,截至2024年12月31日,NOA导航智能驾驶里程已占智驾里程的70%。这意味着,NOA已经替代了原先大量辅助驾驶的使用,类似LCC(车道居中保持)等功能,正在“撤离”用户心智。另一边,在端到端全量推送一周内,理想注意到有3600位之前从未在城市使用NOA的车主开始每天使用该功能。并且,这些用户每天的导航里程提升了两倍,这意味着用户已经相当依赖智驾了。
在销售端,理想智驾也已经成了潜在客户最重要的购车原因之一。据统计,截至12月31日,理想NOA试驾占比超72%。30万以上车型AD Max交付量占比超75%,40万以上车型AD Max交付量占比超84%。这样的销量构成,意味着消费者几乎是因为理想智驾而选购理想汽车。
可以看到,在智驾经历不到一年的迭代中,理想不仅实现了智驾跨越式升级,还更新了品牌的消费者认知。如今的理想,已经从此前“冰箱、彩电、沙发”的标签,切换到了智驾(AI)实力派。
为何理想的AI进展能如此之快?
或许正如李想与郎咸朋在讨论智驾方向时所言, “要么做端到端,要么别做自动驾驶了”。在AI时代,选对路径比一味的努力更重要。
对标“人”,理想智驾的第一性原理
在人类研究AI的60余年里,科学家们得到次数最多的教训便是方向比努力更重要。
以AI大模型的基础架构Transformer为例,虽然谷歌的科学家在8年前提出了Transformer,但谷歌在研究方向的犹豫,让OpenAI率先完成了ChatGPT,颠覆了谷歌此前在NLP领域不少心血。
同样的感慨,也发生在理想转向“端到端”之后。
“比之前所有车的状态都要好,刹车非常拟人舒适,这些问题在规则阶段用很多代码都没办法解决。”在采用端到端仅仅15天之后,看到新技术架构对过去的颠覆,郎咸朋不禁惊叹道。而实现这种差异的过程,理想智驾算法研发部门负责人贾鹏总结说:“一行规则都没写,全是系统按照给的数据训练出来的。”
回顾理想的三次智驾技术变迁,从NPN(先验信息)到无图NOA,再到如今的端到端+VLM双系统架构,每一代都在根本上颠覆了上一代的设计架构。
其中,无图NOA为了替代NPN必须的先验信息(一般是指高精地图),智驾系统强化了感知和规划模块,将智驾从原本的“开卷答题”转向到“闭卷作答”。端到端对无图NOA的提升,主要在于端到端用AI学习取代了无图NOA的人力编写规则模块,相当于原本智驾“背公式”转向到“随机应变”。
由此看到,设计更好的AI架构,智驾也更接近实现全自动驾驶。
理想参考了人类逻辑思维中的下意识反应和深思熟虑,将整个智驾系统拆解成了“快慢”双系统(对应系统一和系统二)。
其中,系统一是完全的端到端架构。智驾模仿人类面对正常路况的操作,这时候控制车辆“加减速”不需要思考太多。系统二则是在端到端的基础上,理想“外接”了一个多模态大模型(VLM)。利用多模态大模型对图片、文字等信息的理解能力,系统二能为系统一提供真实世界的认知。
为何理想的架构与市面上玩家都不同,既不是特斯拉用单个端到端模型“暴力破解”人类操作,也不是小鹏、华为、蔚来等分段式端到端的路线?
因为,这么设计能带来更快的智驾迭代速度。
具体而言,是端到端部分负责快速学习投喂的clips(视频片段)。通过对人类操作的模仿,智驾系统能快速学到与“老司机”近似的操作水平。
“我们起初投喂80万clips的时候,还过不了环岛。后来当数据量达到100万clips时,他自己就能过环岛了。我觉得是100万clips里头刚好有一些环岛数据的原因。模型确实很神奇,你喂了什么数据,他就能学会相应能力。”贾鹏解释说。
另一边,借助能理解真实世界信息的VLM,整个智驾系统还能方便投入到世界模型中参与“考试”,从而实现针对能力训练和模拟智驾在Corner case中的表现。“我们还会根据所有的数据生成“模拟题”,针对模型容易出问题的部分,再生成一些内容训练。”郎咸朋说。
理想富有创意的架构设计,一经发布便斩获行业内多个奖项。2024年,理想智能驾驶的DiVE(世界模型)及StreetGaussians(世界模型)发表在了ECCV 2024上,DriveVLM(双系统)发表在了CoRL 2024上,获得行业的一致认可。
总之,面向2025年即将推广的L3自动驾驶,坐拥110.9万用户、智驾总里程累计达29.3亿公里、800万clips投喂、8.1EFLOPS训练算力,并且每年训练算力的投入超过10亿人民币(以上数据截至2024年12月31日)的理想,已经做好了十足的准备。
随着理想对智驾的深入研究,其AI基础能力也在快速升级。
其中,为了在芯片层继续优化智驾能力,理想即将流片自己专用的智驾SoC。原本用于座舱助手的理想同学,现在也登陆手机,对标ChatGPT、豆包等通用智能体。在汽车AI能理解人类之后,李想也开始考虑起人工智能的下一个形态——机器人。
汽车之外,理想要用AI做更多产品了。
李想的理想,打通硅基世界
理想汽车至今的成功,背后离不开李想顶级的产品能力。
细细复盘李想的每次创业,都能看到他以“超级产品经理”的姿态,对每个行业的高举高打。每次切入一个新赛道,李想都能看到行业最根本的发展主线。
例如,2005创立汽车之家时,李想看到了中国消费者巨大的汽车消费潜力,但缺乏了解渠道的困境。为了满足消费者对汽车产品的好奇,汽车之家主打汽车评测,一举打败了主做车友会的爱卡汽车网。
2015年创立理想汽车时,李想看到的是中国汽车在电动化和智能化存在机遇,同时传统汽车供应链早已成熟的情况。为了在最低限度打造一款智能汽车,李想尽可能采用成熟的技术和设计。避免了里程焦虑、空间不够、不舒适等新能源汽车常见问题的理想ONE,开卖即爆款。
在AI大模型时代刚刚开始的2023年初,看到ChatGPT的横空出世,李想在1月发布的全员信中提到,公司将在2030年成为全球领先的人工智能企业。随后在李想的号召下,理想快速跟上了行业每一个AI落地的风口,AI从隐藏战略变成了“阳谋”。
“AI意味着未来的全部。”诚如李想在2024年12月的理想AI Talk上对AI的看法。随着理想对AI的落地,李想也慢慢看到了AI应用更广袤的视野。
在智舱领域,是理想为了追赶大语言模型的热度,2023年一季度理想开始了Mind GPT项目,并在2023年6月的理想家庭科技日发布会上发布。2023年年底,Mind GPT随着OTA 5.0上车,跟上了行业用大语言模型提升车机智能化的趋势。如今,结合VLM对视觉世界的理解,理想“摸到”了AI融合的边界。
“基座模型到一定时刻,一定会变成VLA(视觉语言行动模型,可以理解成真正能理解世界的智能)。因为语言模型,也要通过语言和认知去理解三维的世界。”正如李想所说,随着AI对世界愈发理解,语言、图片、生成、硬件的边界即将被打破。
“一个真正的大模型产品,一定是能够去自主使用所有的设备,会拥有所有的服务,这才是真正的人工智能。”正如李想所言,AI产品的核心逻辑其实与智驾一模一样。
都是从小范围、标准化的场景出发,到逐渐适应更多场景,为客户提供更多样的服务。最终打破硬件的壁垒,同一个AI能同时落地到全场景的智能硬件。换句话说,能听懂指令并能自觉执行任务的机器人,何尝又不是一种带着乘客“逛街”的自动驾驶呢?
“普通老百姓都能用了,它能独立地、持续地、连续地完成任务,而不需要靠密集的提示词。”李想说。
或许,在AI即将大范围落地端侧的2025年里,李想看到了AI终将打通硅基世界的未来。
本文来自投稿,不代表增长黑客立场,如若转载,请注明出处:https://www.growthhk.cn/cgo/130141.html