同济大学朱西产:谁宣布实现了端到端,他这车你就别买

周信2024-08-17 21:16

周信/文 特斯拉今年3月份推出了V12版本的FSD(全称Full-Self Driving,完全自动驾驶),该版本删除了几十万行的人工规则代码,采用了“端到端”自动驾驶解决方案。

端到端技术随即成为当下最热的话题,国内车企也纷纷开始卷“端到端”。小鹏汽车在“520AI DAY”发布会上宣布,小鹏国内首个端到端大模型量产上车。理想汽车在去年底为端到端模型单独成立了一个团队,理想汽车CEO李想也在6月初表示,理想今年第三季度将向测试用户推送端到端+VLM(视觉语言模型)的智驾方案。

上汽集团近日也表示,纯视觉和端到端技术已进入面向量产的开发阶段。截止目前,国内几乎所有的自动驾驶头部企业,都发布了自己的“端到端”方案和上车计划。

8月16日,在第四届沈阳智能网联汽车挑战赛上,同济大学汽车学院教授朱西产向表示:“特斯拉的端到端、人工智能让自动驾驶更加成为可能,端到端被特斯拉带火了,国内的车企都在说端到端,但现在,谁宣布端到端(量产上车)了,他的这个车你就别买。”

一周前,在享界S9发布会上,华为终端董事长、智能汽车解决方案BU董事长余承东评价特斯拉FSD称,商用版本进步非常大,上限挺高但下限也很低,“我们去测试,路上停着静止不动的白色货车,都不减速直接撞过去了,还有绿色的货车,也不减速,也去撞。”

所谓端到端自动驾驶,一般指控制系统读取原始传感器的数据后,仅通过神经网络直接计算出控制指令,其中不包含任何人为设计的规则模块。

主流的自动驾驶系统会采取分模块方案,将AD系统按照感知、规划和控制进行划分,先对周围的动静态交通参与者和路网结构进行准确感知,再规划自车的行车轨迹,最后通过执行机构对车辆进行闭环控制。

据了解,特斯拉FSD的端到端大模型,消除了自动驾驶系统的感知和定位、决策和规划、控制和执行之间的断面,将三大模块合在一起,形成了一个大的神经网络。

“端到端的模型是把准则模型全部拿掉,准则模型拿掉后,AI的泛化能力更强”,朱西产表示,然后各个AI模块之间用transformer链接起来,信息通过隐性传递,这样就会减少信息传输过程中的丢失,也可以让整个网络实现优化,余承东说特斯拉FSD上限能提高就是如此。

“但余承东说的‘下限也很低’,是指准则模型扔掉后,用AI来训练安全的下限,很难知道它学会没有”,朱西产进一步表示,特斯拉FSD V12版本,尤其是12.4版本,上限的确很高,泛化能力很强,能够处理的事情多了,让驾驶更像老司机,但还有很多问题。

4月份,美国一位特斯拉车主撞死了一名摩托车手,这名56岁的司机承认,自己当时开启了Autopilot,但开车时分神了。

朱西产表示,特斯拉FSD V12版本是3月份推送全美的,但NTSB(National Transportation Safety Board,美国国家运输安全委员会)还在调查中,到底是V11还是V12还未明确。如果肇事用户更新了,那使用的就是V12版本,安全方面就是一个大难题。

他认为,感知的端到端或者说分段的端到端,国内做到了,但现在与特斯拉相比,国内企业在数据量和AI训练的算力与特斯拉还有不小差距。“小鹏汽车的AI算力在国内比较大,但跟特斯拉比也差了几十倍。”

在数据采集方面,目前,车企纷纷依靠用户车辆采集数据,车辆销量越大,数据就越丰富。特斯拉在美国销售了170多万辆车,完成了从数据闭环到用户闭环。“智能驾驶、人工智能采集数据的车谁先破100万辆,谁就有可能率先突破,”朱西产说,华为鸿蒙智行和理想汽车到明年可能达到100万辆。

值得一提的是,在近日的第四届焉知汽车年会上,朱西产表示,大模型的表现非常惊艳,但估计近两年上车的可能性不大,因为大模型需要的高算力还很难在车端布置,并且大模型也同样解决不了安全的长尾难题。

朱西产认为,根据国内车企目前在智能驾驶开发的数据能力和AI训练算力,做感知端到端,融合激光雷达的感知方案,在规控算法上保留安全准则模型,这种分段式端到端方案模型是比较合理的技术路线。

版权声明:以上内容为《经济观察报》社原创作品,版权归《经济观察报》社所有。未经《经济观察报》社授权,严禁转载或镜像,否则将依法追究相关行为主体的法律责任。版权合作请致电:【010-60910566-1260】。
行业产业报道部记者
关注汽车产业发展,对新能源、储能及动力电池关注较多,擅长深入报道及行业分析。
联系邮箱:zhouxin@eeo.com.cn
微信号:zx13552437427
Baidu
map