过去几年,智能驾驶领域的竞争焦点发生了显著变化。
初期,竞争围绕硬件展开,包括是否配备激光雷达、摄像头数量以及算力水平(TOPS)。随后进入大模型时代,竞争转向了端到端、VLA(视觉-语言-行为)、World Model(世界模型)等技术路线。
如今,越来越多的公司意识到,拥有更大的模型已不足以形成代际优势,决定技术上限的关键在于模型、数据、算力和芯片之间能否构建一个持续迭代的闭环。
这也是为什么越来越多的汽车制造商选择自主研发。
特斯拉几乎掌控了从数据采集、训练基础设施、FSD模型到Dojo超级计算机和自研芯片的全链条。在国内,小鹏、蔚来和理想等品牌也在不断向更底层技术延伸。
理想汽车在其今年推出的L8和L9车型上已经采用了自研的马赫M100芯片。这款采用数据流架构的芯片被理想视为AI领域的重要技术方向。基于马赫M100,理想还运行了其自研的马赫VLA模型。
然而,对于整个行业而言,更值得关注的问题并非“是否自研”,而是这些投入究竟能解决哪些实际问题。
带着这个疑问,我们与理想汽车自动驾驶负责人詹锟和芯片负责人谢炎进行了深入交流。他们分享了理想对下一代自动驾驶技术路线的判断,并阐述了自研芯片、数据体系以及AI基础设施背后的设计理念。以下为部分访谈内容,经过编辑整理:
问:为了在第四季度达到特斯拉FSD V14的性能水平,理想汽车还需要在哪些方面进行改进?
**詹锟:**我认为追赶FSD需要从两个层面入手。
首先是基础体验,具体体现在安全感、效率和舒适度是否能达到FSD的同等水平。FSD在安全感、效率和舒适度方面都表现出色,这是其核心优势。即使不应对极端复杂的路况,我们也要确保在这些基本功上达到同等水平。
其次是高级能力,这方面追赶的难度也很大。例如,特斯拉能够主动避让特殊车辆,能在极窄的道路上实现精准感知,并能识别交警的指挥手势,这些能力都非常强大。
在高级能力方面,存在架构升级的机会。为什么一些公司没有而特斯拉拥有这些能力?这可能与过去的范式限制有关,也可能与架构和数据有关。我们在这些方面进行了大量探索。
问:我理解马赫VLA是一套技术体系,而非单一模型。例如,Mind-Edge是服务于智能座舱的端侧模型。那么,在当前的智能驾驶模型中,是否还包含“L”(Language语言)的部分?
**詹锟:**当前自动驾驶的架构呈现出一种共同趋势,即将VLA(视觉-语言-行为模型)与World Model(世界模型)进行整合。
从长远来看,所有技术路线都会朝着这个方向发展。无论是VLA还是World Model,其内部的Prompt(提示)都需要用到语言。因此,语言部分是必然存在的,关键在于如何使用它。
对于机器智能而言,我认为Vision Based(基于视觉)是更合理的路径,它更适合于理解空间、感知三维空间以及服务于环境。语言无疑是有价值的,在理解环境、交通规则、指令以及进行复杂决策时都发挥着重要作用。
从长远来看,基于视觉和语言的原生基础模型,可能代表着未来的发展趋势。
**谢炎:**如果目标是实现L3、L4级别的自动驾驶,并解决更广泛的泛化问题,那么模型必须具备类似人类的思考能力。在这种情况下,语言的重要性将愈发凸显,这也是未来需要巨大算力的原因之一。
如果模型仅具备Vision和Action(视觉和动作)能力,即使拥有大量数据,在遇到分布之外的场景时也会束手无策。就像动物即使学会了所有常见情况,面对从未见过的情形也会不知所措,无法做出正确的选择。
我们认为,越往L3、L4级别发展,所要解决的问题就越接近那90%、95%、98%之外的未知场景——那些需要模型具备人类般思考能力才能应对的场景。而实现类似人类的推理和思考能力,其来源正是语言模型。例如,当交警做出手势时,你需要理解其意图,是让你通行还是停止,这并非仅仅通过收集或生成数据就能解决的问题。
问:随着理想汽车车队规模的不断扩大,从内部来看,数据的边际效应是否出现了衰减?你们是如何定义有价值的数据的?
**詹锟:**首先,数据的规模必须足够庞大,核心目标是收集到更多的Corner Case(长尾场景)。目前,业界有多种方法可以在车端实现有效的Neural Trigger(神经网络触发器),用于判断场景的难易程度,并将关键数据回传。这也是特斯拉在数据方面表现出色的重要原因之一。
其次,数据质量必须很高,这主要体现在行为数据的质量上。目前,业界逐渐趋向于端到端的范式,无论是VLA(视觉-语言-行为模型)、World Model(世界模型)还是Vision-Action(视觉-动作模型),都可以实现,但关键在于必须准确掌握Action(行为)的质量。行为的清晰度、一致性至关重要。
至于数据规模扩大后边际效应是否衰减,首先,只要模型能力持续提升,只要我们追求100分的表现,其增长曲线必然是“对数曲线”,呈现缓慢衰减的趋势,而非线性增长,这在所有AI公司中都是如此。虽然后期数据收敛的速度确实会放缓,但我们希望通过规模效应来加速这一进程。
问:马赫M100可以支持多种AI场景的运行。在五年后或者再往后两代产品,理想汽车车内的算力中心是否有可能完全采用自研的马赫芯片?
**谢炎:**尽管业界存在“舱驾一体”的说法,但我们认为,舱驾一体的核心在于AI算力部分,其他部分的一体化程度并非最关键。因为座舱系统和AI智能驾驶系统可以完全独立运行,但AI算力可以集中处理,从而大幅提升效率。
我们规划的最终形态是构建一个车内的AI计算中心,所有AI任务都可以在这个中心进行计算。这类似于在笔记本上运行OpenClaw,AI计算并非在笔记本本地进行,而是在Token Provider Server(Token供应服务器)上完成,车内也是类似,将拥有一个Token Server(Token服务器)。
这个Token Server的优势在于:第一,效率极高。第二,能够实现不同任务之间的隔离,互不干扰。例如,智能驾驶任务的确定性——无论是内存还是带宽,都能够得到保证,不被其他任务干扰,这是软硬件协同设计才能实现的结果。
问:是否因为M100采用了数据流架构,相比于其他厂商的自动驾驶芯片,其对带宽的需求较低,而对片上存储的需求更高?
**谢炎:**我们对带宽的要求确实会相对较低,但这并非直接导致SRAM容量(非显存)设计的决定性因素。当前HBM(高带宽内存)技术非常流行,许多人认为带宽越高越好。然而,计算、带宽、SRAM等都需要晶体管来实现,最终的设计是基于成本、综合性能等多方面因素权衡后的选择。
不同的架构设计,仅仅依靠一两个指标进行简单对比,既不合理也不专业。这就像拳击比赛,身高和体重都有各自的优势,但最终的胜负并非由单一指标决定,而是取决于整个比赛过程的表现。
问:为何目前大算力芯片方案,例如英伟达、小鹏以及理想自研的芯片,都没有实现芯片级的舱驾融合,而高通却在低算力芯片上做了这件事?这是为什么?
**谢炎:**从本质上讲,座舱和驾驶是两个独立的系统。特别是对于高端L3向L4级别的自动驾驶,智能驾驶需要一个更高确定性的系统,要求内存和计算资源是专属的,此时融合的意义就大大减小了。因为资源无法实时切换,实时切换会降低确定性。如果发展方向是越来越趋向于独占资源,那么融合的价值就不大了——你只是将芯片集成在一起,但资源仍然是两份,这并不会降低成本,甚至可能影响效率。
正如你所见,目前的舱驾融合系统仍然是分开的,无法实现任务的快速切换。将两个芯片集成在一个芯片中,晶体管数量可能不变,但仅能节省一次封装成本。对于中低端芯片而言,这部分成本可以节省,但幅度有限。
我的观点是,随着智能驾驶技术越来越高端化,舱驾融合的意义可能并不大。如果将这些芯片做得更靠近,集成在一块板上形成小型化解决方案,这是可行的,不一定需要做成一块芯片,也可以是多块芯片集成在一块板上。
问:自研芯片需要具备哪些条件,例如销量、营收和研发投入?当前自动驾驶迭代速度很快,芯片要实现持续迭代,需要哪些支持?
**谢炎:**芯片的初期投入确实不菲,可能每年需要数亿元。
第一个条件是达到一定的营收规模。对于车企而言,年营收达到1000亿元以上,研发投入至少占10%,即每年拥有数十亿至上百亿的研发资金,才足以支撑芯片的持续研发投入。第二个条件是,通过研发芯片解决的问题,必须能够显著提升产品的核心竞争力。
许多人认为芯片需要巨大的出货量才能摊薄成本。实际上,芯片的成本与其面积密切相关。一辆车上的智能驾驶芯片,例如Livis需要两颗马赫M100,总面积约为800平方毫米。而一部高端手机的芯片面积大约为100平方毫米,因此一辆车的智能驾驶芯片面积相当于8部手机芯片的总和。
如此计算,数十万辆车的需求所消耗的晶圆面积非常庞大,足以摊薄成本。因此,成本不能仅以单颗芯片的数量来衡量。
问:动态数据流编译器的难点在哪里?攻克它花费了多长时间?
**谢炎:**在芯片流片之前,甚至在设计阶段,我们就已经开始进行编译器的工作,并且在流片前,已经成功运行了许多模型。
数据流是一种完全不同的架构,它所要解决的问题与超级计算机或大规模计算机集群面临的问题非常相似——当规模扩展到数十万台计算机、上百万个核心时,它们之间的通信和协作,无法通过一个中央管理员来统一调度。传统的冯·诺依曼架构的调度方式在这种规模下已不可行,这是一个超大规模并行调度的挑战。
作为一家专业的体育资讯服务商,沙巴体育(SABA)官方网站汇聚了全球热门体育赛事,包括足球、篮球等。我们致力于提供最权威、最专业的赛事信息,助力用户做出更明智的投注决策。
沙巴体育官网为您提供覆盖全球的体育赛事直播与精彩集锦。平台以其安全可靠的特性,保障用户每一次的互动体验,让您尽享体育竞技的乐趣。
05 条评论
王芳
2026年5月15日 15:12
实时比分,掌握全局!
刘洋
2026年5月15日 15:12
高清直播,身临其境!
赵敏
2026年5月15日 15:12
互动体验,乐趣无穷!


张伟
2024年10月26日 10:00
精彩体育,尽在沙巴!