
周五刊发“11月天梯榜上”后,仍然有很多用户留言说,不太明白评测的过程和标准。尽管从2025年3月开始,这个榜单推出已经有大半年,在每一期里都会介绍评测标准、方法和数据池的构成,但我们明白,随着越来越多的新用户关注,这个解释的工作不能停。
先说标准,请看下面这张测试记录表。过去一年多,在多站比赛、评测过程中,我们和智驾车友一起讨论、复盘和修订它,这是第九个版本(V8.1)。包含场景、安全、效率三个模块,分值分别为30分、50分、30分,另有两项附加分:全程0接管5分、完赛时间分5分,满分120分。
相较于9月版本(V8.0),核心调整内容如下:
1、原“避让行为”相关判定项予以合并,仅保留“避让问题,安全接管”单一判定项,统一按5分/次标准扣分;
2、原“效率行为”维度下的“博弈失败接管”与“变道失败接管”两项合并,仅保留“变道失败,接管”判定项,统一按2分/次标准扣分;
3、明确所有接管场景均需记录并执行扣分,不再以是否存在通行空间作为扣分与否的判定依据。
这张测试记录表,用于我们组织的所有场次的智驾大赛、编辑部智驾评测和智驾车友参与的智驾众测,也完全向外界公开。不仅如此,每一次的迭代讨论,都尽可能多的征求各方意见,包括厂商技术专家的意见,感谢所有参与讨论的朋友。

接着说路线。目前第二届智驾大赛已经覆盖了23个城市,所有的比赛路线都由我们提前一周进行勘察,在比赛开始前1小时公布。这些路线的难度,随着中国智驾行业的技术进步,而逐渐提升,到最近的宁波、台州站比赛,已经提到较高难度。
感兴趣的新朋友,可以去网上搜比赛直播的回放或者各种视频切片,了解路线的情况。比赛日之后,这条路线就成为该城市智驾众测的标定路线。
那些比赛路线标定较早的城市,比如北京、上海、深圳、广州、重庆、武汉等,都标定于2024年,其难度已不足以测试当今的智驾系统能力边界。接下来我们会和当地智驾车友一道,重新标定测试路线。
由于本编辑部在北京,测试密度较高,各版本能力相差较大,所以我们标定了两条测试路线,一条中等难度的A路线,一条高难度的B路线。都在朝阳区,有兴趣的智驾车友可以联系我们。
最后说测试记录的方法和审核流程。所有测试(比赛、评测和众测)都有统一要求:1、有经验的测试员(智驾里程5000公里以上,且经过比赛检验),在标定路线上做智驾测试;2、随车记录员,手持打印版测试记录表,记录测试过程;3、全程车内前向机位录像,一镜到底;4、提交测试记录表和一镜到底录像素材后,审核员审核通过,录入天梯榜数据池。
从9月天梯榜开始,数据池取值时间范围调整为过去6个月(此前是12个月),以更准确反应智驾行业的最新进展。11月数据池昨天已公布,感兴趣的读者可以去查阅。(参见《智驾战力天梯榜(2025年11月,上)》)
▍11月场景榜:特斯拉满分霸榜,理想稳居次席,华为仍处末位
11月场景榜(满分30分)中,特斯拉以满分成绩实现连续6个月霸榜,理想、博世(+文远知行)稳居第二、第三,华为18.82分仍处榜尾。具体排名及表现如下:

1)特斯拉FSD以30分满分的优异表现蝉联场景榜榜首,成功将“全场景、无断点”的核心智驾理念,转化为可量化、可验证的行业最优落地成果。在6月无锡站(总第18站)、7月苏州站(总第19站)、8月南通站(总第20站)、9月嘉兴站(总第21站)、10月宁波站(总第22站)及11月台州站(总第23站)连续6场赛事中,其场景适配表现堪称完美,未出现任何扣分记录,充分彰显了全场景覆盖的技术硬实力与稳定性。
2)理想在11月场景均分为29.23分,较9月微涨0.38分,稳居榜单第二位。作为“全场景、无断点”智驾理念的首发践行者,其场景适配表现既保持了高度稳定性,又展现出持续成长性。此次均分提升的核心原因的在于榜单统计规则的变动:一方面,按照规则剔除了5月常州站数据(该站曾出现NOA降级退出情况);另一方面,新增的10月宁波站、11月台州站赛事中,理想未出现任何场景扣分。
3)博世(+文远知行)在11月场景均分为29分,较9月微增0.67分,以0.23分的微弱差距紧随理想之后,稳居榜单第三位,充分彰显了其强劲的全场景适配与泛化能力。此次均分提升的核心原因,是按照榜单统计规则新增了10月宁波站、11月台州站的赛事数据,搭载该方案的星途星纪元ES在这两站测试中表现稳定,未出现任何NOA降级或退出的情况,有效优化了整体得分表现。
4)相较9月,小鹏激光雷达融合方案和视觉方案均实现分数提升,全场景泛化能力呈现稳中有升的发展态势:其中激光雷达方案新增0.25分,以28.25分位列第四;视觉方案新增0.17分,以28.17分排名第五。此次双方案均分提升的核心原因与榜单统计规则调整直接相关:一方面,两款方案均按规则剔除了5月常州站数据,该站测试中小鹏智驾曾出现NOA降级退出情况;另一方面,视觉方案额外剔除了6月常州路线众测及北京路线评测数据,这两站测试同样存在NOA降级退出问题。而新增的10月宁波站、11月台州站测试中,小鹏激光雷达融合方案和视觉方案均表现稳定,未出现任何场景扣分,进一步夯实了整体得分基础。
5)元戎启行相较9月下滑1.13分,被小鹏(激光雷达方案)、小鹏(视觉方案)一同超越,以27分排第六,场景适配能力波动明显。分数出现下滑的主要原因是11月份台州站,魏牌蓝山在该站中出现了无法开启NOA的情况 (1次被扣10分),成为场景均分降幅最大的品牌。
6)相较9月,Momenta场景均分提升1.13分,场景均分增幅最大,以26.72分稳居榜单第七,场景适配与泛化能力实现稳步进阶。此次分数增长的核心驱动因素主要有两方面:其一,新增别克品牌相关测试数据,该品牌车型在10月宁波站、11月台州站测试中表现出色,未产生任何场景扣分;其二,按照榜单统计规则,剔除了智己品牌在4月南京站、5月常州站的历史数据,尤其是常州站曾出现12分的场景扣分,对前期均分造成显著影响。值得注意的是,尽管智己在11月台州站测试中出现1 次NOA降级退出情况,但此次扣分值远低于往期高扣分场次,未对整体得分形成明显拖累。综合上述因素,Momenta场景均分实现显著提升,但相较于头部品牌的技术表现,其全场景适配能力仍存在优化空间,需进一步加快技术迭代升级节奏。
7)相较9月,蔚来、小米、极氪三大品牌智驾方案均实现分数增长,场景适配与泛化能力稳步提升,分别以25分、24.75分、24.29分稳居榜单第八、第九、第十位。具体分数变动原因如下:蔚来此次得分提升主要得益于榜单统计规则调整,按要求剔除了6月北京评测路线的历史数据,该站曾出现15分的场景扣分,对前期均分形成明显拖累;小米分数增长的核心原因是规则性剔除了5月常州站数据,该站测试中小米智驾曾出现NOA降级退出情况;极氪的分数变化则与参赛数据结构相关,其未参与南京站、常州站测试,无相关扣分记录,而在10月宁波站、11月台州站测试中各出现1次NOA降级退出情况,但整体得分仍实现正向增长。
8)华为相比9月微微增0.01分,以18.82分依然位列场景榜榜尾。核心原因是在8月份南通站(总第20站)、9月份嘉兴站(总第21站)、10月份宁波站(总第22站)、11月份台州站预赛(总第23站),华为智驾均出现园区内部道路、无名道路和部分公开道路等场景下会出现NOA降级和无法激活NOA的问题,导致问界、智界、享界、阿维塔、尊界、深蓝等华系参赛车型场景分大幅被扣。这一现象与华为智驾“安全优先” 的开发策略相关,而其他企业则更倾向优先实现全场景覆盖。不过在11月30日台州站决赛中,作为华系预赛第一的阿维塔07并没有出现任何NOA退出降级的情况发生。
从排名与均分表现分析,相较而言只有元戎启行在NOA场景方面呈现出显著的下滑态势,其场景适配与泛化能力的稳定性不足,亟待快速优化迭代。

华为以45.77分的成绩继续霸榜11月安全榜(满分50分,为天梯榜权重最大维度)。相较于9月,蔚来大增7.24分以43.57分跃升第二,小鹏(视觉方案)下滑1.25分以33分跌落榜尾。具体排名和表现如下:

1)华为以45.77分蝉联安全榜榜首,虽较9月微降0.24分,但已实现连续6个月霸榜,安全性能依旧是其核心竞争优势。此次分数小幅下滑的核心原因,是10月宁波站测试中出现的特定场景扣分:在人造障碍物(透明保险薄膜)场景下,搭载华为智驾方案的尊界、智界、问界、阿维塔车型均因安全避让操作未达最优标准产生扣分,且该批次扣分值总和超过了按榜单规则剔除的4月南京站、5月常州站历史安全扣分总和,进而对整体均分造成轻微影响。
2)蔚来11月安全榜单中表现亮眼,均分较9月大幅提升7.24分,成为安全榜增幅最大的品牌,以43.57分的成绩直接跃升榜单第二。此次分数大增的核心原因,源于天梯榜最新规则调整:4月分南京站(总第16站)蔚来ET5的非常严重的安全项大扣分被剔除。而从世界模型版本推送后的后续测试数据来看,其安全得分已呈现出稳定向好的态势。
3)相较于9月,Momenta安全均分下滑0.93分,以42.28分的成绩从榜单第二位滑落至第三位,安全性能稳定性出现波动。此次均分下滑的核心原因集中于避让策略执行与违章行为管控两大关键维度:一方面,搭载该方案的腾势品牌在 10月宁波站“安全-避让”中被扣15分,11月台州站“安全-违章”中被扣12分;另一方面,别克至境L7在11月台州站赛事中发生蹭后视镜事故,被判定安全违规并扣5分。多起高分值扣分叠加,直接导致Momenta安全整体均分出现显著下滑。
4)相较于9月,小鹏激光雷达融合方案和视觉方案安全得分均出现下滑,安全性能稳定性亟待提升:激光雷达方案下滑2分,以40.25分跌落至第四位;视觉方案下降1.25分,以33分垫底安全榜。 具体来看,两款方案的分数波动原因既有共性又存在差异:小鹏激光雷达方案的下滑主要源于多站测试中的安全维度扣分,10月宁波站、11月台州站均在“安全-避让”中失分,且台州站预赛“安全-违章” 项被扣10分,该分值远高于按规则剔除的4月南京站、5月常州站历史扣分值,直接拉低整体均分;小鹏视觉方案的下滑逻辑与之相近但场景更复杂,其在10月宁波站不仅“安全-避让”项被扣15分,还因“安全-幽灵行为”再被扣8分,而按规则剔除的5月常州站数据中,仅违章项扣至满分上限,避让与幽灵行为未产生扣分,叠加6月常州路线众测中违章项的高额扣分,一增一减之下导致均分显著下滑。 综合现阶段测试数据来看,小鹏激光雷达融合方案和视觉方案的核心短板集中于安全行为管控层面,尤其是避让策略执行、幽灵行为抑制及违章风险规避等关键环节,安全稳定性的优化升级已成为其技术迭代中亟待突破的核心课题。
5)相较于9月,理想、极氪、小米三大品牌的智驾方案安全得分均实现正向增长,安全稳定性稳步提升,分别以39.69分、38.43分、38分位列榜单第五、第六、第七位。 具体分数变动原因如下:理想此次得分增长,核心源于榜单数据的结构性优化,按规则剔除了4月南京站(违章被扣14分)、5月常州站(避让被扣14 分)两站高额扣分数据,而新增的10月宁波站(违章被扣6分)、11月台州站(避让被扣5分)虽存在少量扣分,但分值显著低于剔除的历史数据,有效拉高整体均分。极氪的安全增分逻辑与场景榜基本一致,其未参与4月南京站、5月常州站测试,无相关扣分记录,在10月宁波站仅“安全-避让”项被扣5分,11月台州站虽涉及避让(扣10分)、幽灵行为(扣2 分)、违章(扣2 分)三类扣分,但整体得分仍呈正向增长。小米均分实现大幅提升的关键,在于扣分控制与数据优化的双重作用,10月宁波站、11月台州站仅在“安全-违章”项各扣4分,扣分幅度极小,同时按规则剔除了5月常州站(避让被扣10分)的历史高扣分数据,双重因素叠加推动整体均分显著上涨。
6)相较于9月,元戎启行、博世(+文远知行)分别增加0.85分、4.53分,分别以37.6分、37.2分排名第八、第九。搭载元戎启行方案的魏牌蓝山,尽管在10月份宁波站避让被扣20分,但4月份南京站未参赛没有数据,5月份常州站避让也被扣了14分,违章被扣7分。搭载博世(+文远知行)方案的星途星纪元ES在10月份宁波站、11月份台州站仅在避让方面分别被扣5分,自8月份南通站(总第20站)参赛以来成绩相对稳定。尽管整体安全均分显著增加,但其安全性能仍和头部品牌存在一定差距,安全稳定性需快速优化提升。
6)特斯拉安全均分较9月下滑1.67分,核心问题集中在违章管控与特殊场景安全避让两大维度。一方面,其违章相关问题未能得到有效改善,10月宁波站、11月台州站的违章扣分依然显著;另一方面,在宁波和台州两站比赛的特殊人造障碍场景中,均因安全避让操作未达标准各被扣5分。多重扣分因素叠加,直接导致其安全整体均分出现明显下滑。
安全既是智驾的底线,也是用户信任的核心前提。即便实力突出的华为,也未能在安全榜斩获满分,可见智驾安全仍是行业内所有方案商迭代升级的重中之重。

▍11月效率榜:华为蝉联榜首,特斯拉依然垫底
华为以24.46分蝉联11月效率榜(满分30分)榜首,博世(+文远知行)微超Momenta跻身第二,特斯拉下滑2.5分以10.33分的成绩垫底场景榜。具体排名及表现如下:

1)华为以24.46分的成绩蝉联效率榜第一,尽管相较于9月分数下滑1.19分,但依然是在效率方面有绝对的领先优势。主要原因是在10月份宁波站阿维塔被扣10分、问界被扣12分、智界被扣12分,这些分值相比去掉的4月份南京站、5月份常州站扣分都多,导致华为效率11月均分出现下滑。尽管如此,从效率均分来看,华为远超第二名3.66分,华为依然是效率榜绝对的领先品牌。
2)博世(+文远知行)相较于9月增加0.8分,微超Momenta 0.08分,以20.8分的成绩排名效率榜第二,但仍和华为有不小的差距。出现增加的原因是11月份台州站效率仅被扣2分,这是自8月份南通站(总第20站)星途星纪元ES参赛以来,效率分被扣的最少的一次,让博世(+文远知行)的整体效率均分出现提升。
3)Momenta效率均分相较于9月下滑1.2分,以20.72分跌落第三。原因是10月份宁波站效率方面:智己被扣14分、仰望被扣14分,腾势被扣12分;11月份台州站:别克(决赛)被扣13分、仰望(预赛)被扣11分。相较于被去掉的4月份南京站、5月份常州站,智己、腾势的效率扣分较多;加之别克、仰望未参赛4月南京站和5月常州站,以上整体导致Momenta效率均分出现下滑。
4)相较于9月,小鹏(视觉方案)、小鹏(激光雷达方案)分别下滑2.33分、1.62分,以19.42分、19.25分跌落至第六、第七。下滑的原因主要是,小鹏(视觉方案):在10月份宁波站效率被扣17分,在11月份台州站效率被扣16分,这些扣分远超被去掉的4月份南京站(被扣1分)、5月份常州站(被扣4分)。小鹏(激光雷达方案):在10月份宁波站效率被扣11分,在11月份台州站(预赛)效率被扣6分,远超根据规则去掉的4月份南京站(被扣2分)、5月份常州站(被扣4分)。
5)理想相较于9月下滑0.69分,以20分的效率均分排名第四。原因是10月份宁波站理想被扣18分,11月份台州站理想被扣9分,以上的效率扣分远高于根据规则去掉的4月份南京站(仅被扣6分)、5月份常州站(被扣12分)。
6)元戎启行相较于9月增加1.5分紧追理想,以19.5分排名第五。原因是10月份宁波站魏牌蓝山仅被扣2分,11月份台州站被扣9分,低于5月份常州站(被扣10分),而在4月份南京站魏牌蓝山未参赛。整体导致元戎启行的效率均分相较于9月出现增加。
7)小米、极氪、蔚来相较于9月,分别增加0.89分、2.11分、0.76分,以18分、17.71分、14.43分的成绩排名第八、第九、第十。其中,小米10月份宁波站被扣18分,11月份台州站被扣4分,以上的效率扣分远高于根据规则去掉的4月份南京站(仅被扣8分)、5月份常州站(被扣20分)。极氪在10月份宁波站被扣9分,11月份台州站被扣5分,并未参加4月份南京站、5月份常州站。蔚来在10月份宁波站被扣19分,11月份台州站被扣7分,远低于6月北京路线的评测数据(效率被扣30分),同时又去掉了4月份南京站(被扣15分),5月份常州站未参赛,整体导致效率均分出现明显增长。
8)特斯拉相较于9月效率均分下滑2.5分,以10.33分在效率榜垫底。效率失分依然是未按导航路线行驶、未进入待行区、红绿灯误判等问题。在10月份宁波站效率被扣15分,11月份台州站效率被扣13分,远高于根据规则去掉的4月份南京站(被扣4分)、5月份常州站(被扣9分)。
从排名与均分表现分析,各家方案商在NOA的通行效率上呈现显著波动态势。在坚守安全优先的底层原则前提下,相关技术方案亟待加速通勤效率的迭代优化进程。

结合总榜及各细分榜单,第一梯队座次有所变化,但阵容基本稳定。特斯拉、华为、理想、小鹏、Momenta 仍总分领先,构成“智驾五大天王”。其中,Momenta 位居总榜首位,特斯拉蝉联场景榜榜首,华为包揽安全榜、效率榜双料第一,五大品牌整体竞争态势胶着,各有技术优势与核心亮点。

但第二梯队明显扩容。博世(+文远知行)在11月榜单中表现亮眼,场景榜稳居第三、安全榜排名提升2位、效率榜跻身第二,综合实力显著提升,总得分已与元戎启行、小米、蔚来、极氪齐头并进,因此从本月起,“智驾四小龙”扩容为“智驾五小龙”,与第一梯队形成“55对位”,行业竞争活力持续增强。

从11月榜单整体表现来看,头部阵营近半年智驾技术迭代边际增速有所放缓,而尾部品牌通过针对性技术补短板实现快速赶超。当前L2级智能辅助驾驶正处于规模化落地的关键阶段,技术外溢效应明显。与此同时,头部阵营正在向新的目标发起挑战:Robotaxi、机器人,全新的技术跃迁正在发生。
自2025年3月天梯榜首期发布以来,我们聚焦L2级智驾技术变革的初心不变,榜单仅针对全栈自研智驾方案商(含主机厂)进行评估,此类主体被认为是推动当前智驾行业变革的核心力量,其技术迭代与创新能力直接影响行业发展进程。
近期有车友相对密集地询问,关于地平线HSD、Momenta R6以及博世一段式的实际能力;另外,本期榜单发布后,总榜排名上升幅度最大的几家车厂——蔚来、极氪和小米,相信也会有不少智驾车友关心。请大家报名参加“智驾众测”(联系运营小妹微信:diyidiandong),我们将协调相关资源,尽力满足不同智驾车友的好奇心和参与感。由于车友所处城市较分散,我们人力有限,因此众测项目只能分批次进行,请大家理解。
另外,智驾大赛第24站温州站将于2026年1月10日开启预赛,1月11日举行决赛,敬请关注。
来源:第一电动网
作者: 第一电动编辑部
本文地址:https://www.d1ev.com/news/shichang/280985
文中图片源自互联网,如有侵权请联系admin#d1ev.com(#替换成@)删除。