1. 首页
  2. 大牛说
  3. 长城的「长城」,毫末AIDay全解读:数据体系+智慧领航+自建超算中心

长城的「长城」,毫末AIDay全解读:数据体系+智慧领航+自建超算中心

关注并标星电动星球News

每天打卡阅读

更深刻理解汽车产业变革

————————

出品:电动星球 News

作者:毓肥

12 月 23 日,也就是今天,自动驾驶 AI 公司毫末智行,举办了第一届 AI Day。

实际上,这是今年毫末智行第四届品牌日,以每个季度一场的节奏,高密度、广维度输出他们对自动驾驶软硬件的理解,以及成果。

毫末智行董事长张凯表示,毫末智行将在 2022 年打响三场关键且意义重大的战役,分别是数据智能的王者之战、辅助驾驶的场景决胜之战和末端无人配送解决方案的规模化之战

「数据是人工智能最大的驱动力,数据智能是毫末智行的思想钢印」,毫末智行 CEO 顾维灏则这样总结。

思想钢印是《三体》的科幻概念,毫末智行的「思想钢印」,则代表着用更低的成本和更快的迭代速度,提供更安全、更好用的产品给用户。

到了今天,活动本身的名字都变了,换成了很大胆的、一个汽车世界里只有特斯拉用过的名字。

作为毫末智行今年最后一次,也是最重要的一次发布会,改名 AI Day 只是其中一个变化。更重要的,是毫末智行的技术积淀正式从幕后走向台前,以功能-产品-体系的完整逻辑向大众展示

其中用户感知最明显的,是毫末智行首次推出的智能领航辅助驾驶系统 NOH,Navigation on HIPilot,即将于 2022 年中上市,对标特斯拉 FSD,以及小鹏城市 NGP。

但更完整体现毫末智行技术路线差异化思考的,我们认为是发布会上首次亮相的自动驾驶数据智能体系 MANA——它让毫末智行成为了中国首个宣布在自动驾驶领域,大规模研发落地数据智能体系的公司。

甚至于,毫末智行正在自研超算中心,用以承载 MANA 的发展潜力。

除了产品能力、体系能力,毫末智行还在本届 AI Day 上公布了详细的上车计划,以及目前已经取得的成果。

和上个季度品牌日一样,今天的报道有很多技术词汇,但如果你想了解毫末智行,这一定是今年最后的,更是最好的机会。

一、MANA 体系:一切为了数据,为了数据的一切

距离上次品牌日一个季度,毫末智行的数据积累量从 100 万公里翻倍增长到了400 万公里。而我们接收到的消息,是明年毫末智行数据积累量的增长速度,会比现在快得多。

这也对应了 3 个月前,毫末智行 CEO 顾维灏说过的:「谁能用最低的成本,得到最多的数据,用最快的速度进行产品迭代,谁就将获得未来竞争的胜利。」

这句话将作为贯穿本文的主线,同时也反映了智能汽车新维度的竞争法则:汽车不再是代步工具,而是海量数据的生产者,以及人工智能的承载者。

而 MANA(雪湖)自动驾驶数据智能体系,则是毫末智行对「数据智能」这四个字的完整思考,以及体系努力。

1. MANA,数据智能的基石

本届 AI Day,毫末智行提出了这样一条公式:F(x)=Z0+M(x)

其中 f 代表综合产品力,Z0 则是第一代产品。从 Z0 到 f,毫末智行认为需要通过 M,也就是「把数据转化为知识」实现。

是的,MANA 的一切都是为了数据,MANA 的意义则是为了自动驾驶数据的一切——获取、表达、存储、传输、计算、验证

车企实现智能驾驶的方法有很多,找供应商买个完整方案是最简单的,有钱就行;更难但是也更有价值的,是车企自己掌握数据,并且懂得运用数据。

对于长城旗下的毫末智行来说,数据是他们的核心,但也是难题——从上一次品牌日分享的信息看来,包括但不限于「寻找最有价值的数据」、「提高训练数据的速率」,等等。

而 MANA 体系,则是毫末智行解决这一系列难题的钥匙。也是本届 AI Day 上,毫末智行秀的最大一块「肌肉」。

这张 PPT 完整呈现了 MANA 的结构,相当详细,也很难看懂。根据官方定义,MANA 主要具有下面四大功能板块:

BASE 底层系统,负责传输,存储,计算,以及新的数据分析和数据服务;

TARS 数据原型系统,用于感知、认知、车端建图、和验证实践;

LUCAS 数据泛化系统,包括高性能计算、诊断、验证、转化等能力;

VENUS 数据可视化平台,包括软件和算法的执行情况,对场景的还原,以及数据洞察等能力。

换句话说,MANA 为毫末智行提供了从数据获取,到数据分析,再到建立算法,然后验证还原,最终推向量产实践的完整全栈自主闭环能力

2. MANA 怎么工作?

前面已经说到,MANA贯穿了毫末智行数据智能的每一方面。也就是说,MANA体系的运转,本质上就是毫末智行奔向自动驾驶的每一次努力。

2.1. 第一步,则是感知。

毫末智行即将在明年年中推出城市 NOH 智能领航辅助,量产最大的挑战,则自然来源于城市区域远要复杂的路况。包括天气、道路、交通参与者、交通流密度,甚至是约定俗成的行驶习惯,等等。

于是,更高效调用、融合不同传感器,就成了感知层面,MANA 需要解决的首要问题。

和我们开眼看世界不太一样,摄像头看到的是像素集合,因此神经网络要做的,是分析每个像素之间的联系,并判断哪些像素集合成哪些物体。

毫末智行将其划分为三大类:global、road、object,对应到我们日常开车,则是环境、道路划线,以及障碍物。MANA 的感知任务,很大一部分就是教会神经网络「认路」

三大任务群各自又由海量小目标组成,比如路况分类里面又包括了车道线、停车线、路基等等。

另一个认路的难点,在于自动驾驶会使用生成不同信号的不同传感器认路,比如位置/规格/视角均不同的摄像头,以及生成点云而不是图像的雷达等等。

密集但二维的图像+稀疏却立体的点云,这就是自动驾驶感知领域的「多模态融合」。没有一种算法将摄像头和雷达有机结合,传感器之间就会是牛头不搭马嘴。

为了解决多模态融合问题,毫末智行用的是「跨模态算法」+「时间序列算法」

跨模态算法有很多,比如拼接 concatenation、按位乘 element-wise product、按位加 element-wise sum、外积 outer product等等。多模态融合 Multimodal Compact Bilinear Pooling 则是将外积结果映射到低维空间中。

而毫末智行的具体操作,则是使用 Transformer 做多模态融合映射,然后加入时序的特征,使用 RNN 和光流 SLAM 进行时空融合。由此解决了摄像头和雷达之间的「交流问题」。

2.2. 认知

我们教会车子认路了,那怎么让它做动作?

答案是认知,也就是「人工智能重建客观世界之后,如何映射驾驶动作」。

这里新的问题出现了,感知有清晰标准——完全反映客观世界,越真实越优秀。评价标准没有歧义,剩下的就是用巨量数据逐步覆盖 corner case。

然而认知没有,比如中国司机和英国司机开车习惯不一样,比如不同驾驶风格的司机也许同样合法,但实际操作也会不一样。

针对认知智能,毫末智行通过知识图谱的方式,开发了原创的认知算法,为 MANA 体系搭建了协同安全敏感模型 CSS。

但 CSS 的目的并不止于「不犯错」,更在于「充分考虑从数据中学习到的,对其他交通参与者行为的理解和超时空历史经验」

举个例子,CSS目前已经实现了如行人礼让,大车同行避让,自动变道等方面的智能化场景处理。

也就是说,毫末智行希望 MANA 训练出来的模型不仅是个好司机,还希望是个老司机

怎么做老司机?一个答案是不断堆积驾驶经验和场景,比如用不同的天气、道路结构、交通参与者、交通流密度、彼此方位、主车路线、碰撞风险和碰撞时距等等因素,训练自动驾驶。

让人工智能熟悉人类驾驶的过程,本质上其实是场景的数字化感知

举个例子,这张 PPT 里面不同颜色的方块,代表一个时序范围内障碍物的运动。看似静态的图片,实际上表达了动态的影像。而主车根据这种运动,通过模仿学习的算法,可以直接生成驾驶决策。

2.3. 标注+验证

标注,是自动驾驶数据处理中极其重要的一步。如果拟人化一点形容,就像是小时候妈妈带着我们上街,指着路上种种告诉我们「看,那个叫XX」。

标注,本质上就是告诉深度学习模型,图片里面某一坨像素点是车道线,还是穿着白色衣服的人类。

而标注环节中,自动驾驶工程师们面临的问题是,浩如烟海的驾驶环境中,需要标注的数据量实在太过庞大,远非人力可以承载。

9 月份毫末智行的品牌日上,已经表示他们通过无监督聚类,实现了相当程度的自动标注。而且毫末智行的无监督自动标注算法,号称性能比市面上很多方案强 1 倍。

但毫末智行并没有满足,MANA 系统中提供了闭环的自动标注系统。使用更大的云端预标注模型做预标注,人工再进行简单的检查校正,整体提高效率、降低成本

验证,这是 MANA 系统的兜底,或者说对前面所有步骤的「考试」。

目前毫末智行已经实现了对感知的泛化验证。以这张 PPT 为例,仿真系统中经历风霜雨雪的同一场景,只花了 0.01 秒。

另外,包括已经上路的量产车、测试车,也可以不断生成新的场景反馈给MANA,持续迭代、叠加新的仿真场景。

3. One more thing

毫末智行有个中期小目标:未来三年高阶辅助驾驶上车 100 万辆;而更短期的目标,则是明年的城市 NOH 领航辅助。

更高阶的功能、更庞大的量产规模,都代表着毫末智行即将迎来更具挑战的数据压力。官方的表述则是,数据智能系统会对 ZB 级数据规模进行数据的获取、存储、计算,既要保障处理效果,又要对时效性有保障

大家也许对 ZB 有点陌生,这么说吧,1ZB=1024EB,1EB=1024PB,1PB=1024TB,1TB=1024GB,这样应该会比较直观。

面对如此浩瀚的数据,MANA 系统的最后一环,毫末智行决定用自建超算中心补上——是的,中国第一个官宣的,车企自建的自动驾驶超算中心。

二、毫末智行,开启数据智能 2022

前不久,毫末智行公布了首个城市 NOH 的 DEMO 视频。

视频里面城市 NOH 的表现非常稳定,一些城市领航的难点,比如环岛驾驶,处理得也非常丝滑。但让我们印象更深刻的,其实是城市 NOH 的全栈研发时间——截至目前,并行研发仅 8 个月

除了城市进阶版 NOH 以外,基础 NOH 的覆盖速度同样可圈可点。预计到 2022 年底,毫末智行辅助驾驶系统将落地长城汽车 34 款车型,约占其整体待上市车型 80%。

更具体的目标,就是那个「未来三年,搭载的乘用车总量超过 100 万台」了。

而驱动毫末智行 2022 的进击的,承载 MANA 数据能力的,则是智能驾驶硬件「小魔盒」

高通 8540+9000,这是毫末智行「小魔盒」3.0 的中枢芯片,这也是高通骁龙 Drive 方案在国内的首发。

使用高通方案的「小魔盒」,支持 6 路共 6Gbps 以太网、12 路 800 万像素超清摄像头、5 路毫米波雷达、3 路激光雷达。

7 纳米工艺加持下,单板算力达到了 360TOPS,最高可以实现四芯 1440TOPS 的峰值,比 4 芯英伟达 Orin X 1016TOPS 的算力高出接近 1/3。

写到这里,我们终于用尽量精简的字数,将毫末智行的软硬件数据闭环讲清楚了。

MANA,这是毫末智行数据智能的万物起源。它是毫末智行从收集、处理到利用数据全方面的架构支撑,同时是从辅助驾驶进阶到更高阶智能驾驶的数据体系。

全场景 NOH,则是 MANA 数据体系的软件具象,为车主提供辅助驾驶服务,同时为 MANA 反馈数据,实现有效循环。

超算中心和小魔盒 3.0,则是上面两套数据体系的硬件承载,扮演着大脑和器官的角色。超算中心为 MANA 的宏大构思提供算力,小魔盒则为 NOH 的功能提供算力。

数据驾驶时代,毫末智行正式交卷。而且从今天的 AI Day 看来,他们的「答题速度」正在不断加快。

(完)

来源:第一电动网

作者:电动星球News蟹老板

本文地址:https://www.d1ev.com/kol/164553

返回第一电动网首页 >

收藏
50
  • 分享到:
发表评论
新闻推荐
热文榜
日排行
周排行
第一电动网官方微信

反馈和建议 在线回复

您的询价信息
已经成功提交我们稍后会联系您进行报价!

第一电动网
Hello world!
-->