智駕終局還是營銷亂局?
技術(shù)演進(jìn)的腳步已經(jīng)超越了消費者的認(rèn)知速度,國內(nèi)智駕的一汪池水已然是波濤洶涌。
從今年年初開始,習(xí)慣于造詞的汽車行業(yè)炒熱了一個新詞——“端到端”,并且以前所未有的頻率反復(fù)在消費者的耳朵里磨繭。造詞是企業(yè)的事,但解釋都交給了銷售。
從各大品牌的培訓(xùn)話術(shù)中,幾乎所有的銷售都把“端到端”智駕用AI一言以蔽之。“我們最新的智駕系統(tǒng)用了AI技術(shù),是目前最強(qiáng)的。”
馬斯克曾介紹端到端End-to-End Deep Learning(端到端深度學(xué)習(xí))的能力,稱之為“圖像端輸入,控制端輸出”。以此為基礎(chǔ),特斯拉在美國推出了自動駕駛系統(tǒng) FSD v12.3 的版本,廣受好評。
這個好評不僅僅來自于美國用戶,更來自于在國內(nèi)汽車新勢力的大佬們。
小鵬汽車何小鵬表示,去美國測試了特斯拉FSD,很絲滑。
小米公司副董事長林斌表示,去美國測試了特斯拉FSD,很絲滑。
華為終端BG董事長余承東說,派團(tuán)隊去美國測試了特斯拉FSD,發(fā)現(xiàn)華為智駕遙遙領(lǐng)先。
無論嘴上態(tài)度如何,在特斯拉之后,所有車企都開始大手筆投入,將未來自動駕駛的方向瞄準(zhǔn)“端到端”。
辰韜資本聯(lián)合三方發(fā)布的《端到端自動駕駛行業(yè)研究報告》,30余位自動駕駛行業(yè)一線受訪專家中,90%表示自己所供職的公司已投入研發(fā)端到端技術(shù),大部分技術(shù)公司都認(rèn)為難以承受錯過這一次技術(shù)革命的后果。
這也算是在一定范圍內(nèi)形成了一個共識,原本混亂的智駕專有名詞包括NOA、NGP、NCA、NOP……等等逐漸變得統(tǒng)一起來。
從哪一端到哪一端?
事實上,端到端并不是一個全新的概念。在人工智能領(lǐng)域,它是一種普遍使用的方法。比如在各種AI翻譯、語音轉(zhuǎn)文字應(yīng)用中,基本都使用端到端:原始數(shù)據(jù)被送進(jìn)一張神經(jīng)網(wǎng)絡(luò)中,經(jīng)過一系列運(yùn)算后,直接給出最終結(jié)果。
落地到智駕領(lǐng)域里,也是如此,汽車上的雷達(dá)以及各類傳感器在感知到路面信息和,通過決策并直接做出反映,體現(xiàn)到汽車智駕的動作上,包括方向盤轉(zhuǎn)角、油門踏板開度等。
這與之前的幾乎所有的智能輔助駕駛系統(tǒng)依賴于事先定義好的規(guī)則判斷形成巨大對比。
在端到端出現(xiàn)之前,智駕系統(tǒng)需要先通過傳感器識別車道、行人、車輛、標(biāo)志等關(guān)鍵資訊,再由工程師編寫數(shù)十萬行C++ 程式碼,應(yīng)對紅燈停、綠燈行等各種場景,任何一個行為都有相對應(yīng)的規(guī)則、條件判斷的方程式,但這種做法終究難以涵蓋復(fù)雜多變的真實路況。
而端到端則是通過AI的不斷學(xué)習(xí)運(yùn)算直接做出反應(yīng),中間的邏輯幾乎全部省略。
因為涉及到AI涉及到大模型以及深度學(xué)習(xí)等相關(guān)專業(yè)領(lǐng)域,端到端天然自帶一些復(fù)雜地前沿科技屬性,就像很多人知道ChatGPT但依舊不懂大模型是怎么回事一樣。類比一下,ChatGPT,它就是一個典型的端到端模型,輸入文字語句,直接就能得到回答。
到目前為止,沒有哪一家企業(yè)試圖用最通俗的語言向消費者傳遞過關(guān)于端到端最基本的認(rèn)識,甚至直接用門到門、出發(fā)一端至終點一端這樣的概念將其具像化——讓車輛自動把你從A端帶到B端。
前文中關(guān)于端到端的釋義也是終極版本,與現(xiàn)在市面上絕大多數(shù)的宣傳的端到端智駕都還有較大差距。
極越CEO夏一平表示,“端到端這件事情很難一蹴而就,首先我不認(rèn)為現(xiàn)在市場上有任何一家是百分百的端到端,這個世界上現(xiàn)在沒有人是完全的端到端。我覺得無論是端到端也好,無圖也好,都是營銷的噱頭,對老百姓來說,我覺得還是體驗好最重要。”
從自動駕駛架構(gòu)演進(jìn)的角度,端到端也可以分為幾個階段或者說幾種技術(shù)路線。在最初級的“感知端到端”中,整個自動駕駛架構(gòu)被拆分成了感知和預(yù)測決策規(guī)劃兩個主要模塊,其中,感知模塊已經(jīng)通過基于多傳輸器融合的BEV (Bird Eye View,鳥瞰圖視角融合 ) 技術(shù)實現(xiàn)了模塊級別的 “ 端到端 ”。通過引入 transformer 神經(jīng)網(wǎng)絡(luò)模型,對于識別結(jié)果精度及穩(wěn)定性相對之前都有比較大的提升。但在最終的規(guī)劃決策模塊中仍然以規(guī)則基礎(chǔ)為主。
第二階段才是端到端決策,把預(yù)測到?jīng)Q策到規(guī)劃的功能模塊已經(jīng)被集成到同一個神經(jīng)網(wǎng)絡(luò)當(dāng)中。
單一模型端到端才算是終極版本。在這個背景下,就不再有感知、決策規(guī)劃等功能的明確劃分。從原始信號輸入到最終規(guī)劃軌跡的輸出直接采用同一個深度學(xué)習(xí)模型。是真正意義上的端到端。
國內(nèi)最近一些企業(yè)則聲稱自己是端到端感知,或者端到端決策,只是各種細(xì)枝末節(jié)的“端到端”,這只能算作是純數(shù)據(jù)驅(qū)動的感知和純數(shù)據(jù)驅(qū)動的決策規(guī)劃階段。
換句話說,做得好點的還只是前兩個模塊的融合,根本做不到輸出控制(執(zhí)行)的結(jié)果。
小馬智行CTO樓天城就表示,“端到端并不是一個特別大的模型,比如理想汽車的端到端方案其實在一個orin-x上就能跑通,其中還牽扯到大量的規(guī)則。”
相比于模塊化方案,單一模型的端到端方案雖然在訓(xùn)練以及調(diào)試上更為復(fù)雜,但在理論上,其最終效果具有更高的天花板。
被“神化”的端到端
在鋪天蓋地的“端到端”轟炸中,一場關(guān)于廣義與狹義的技術(shù)分野就此鋪開。
端到端相關(guān)企業(yè)本分為兩派,一邊是以探索研究前沿科技的技術(shù)人員以及學(xué)者為主的“技術(shù)原教旨主義派”,他們認(rèn)為,市場上很多公司所宣傳的端到端并不是真正意義上的端到端。
同濟(jì)大學(xué)汽車學(xué)院教授朱西產(chǎn)就曾直言,“車企宣傳端到端更多是為了流量,實際上國內(nèi)車企具備做“端到端”的技術(shù)實力的沒幾個,但是嘴上不能輸,打仗呢,一躺下就再也起不來了。”
一邊是以急于落地項目的車企供應(yīng)商為主的“實用主義派”。他們則表示,只要基本原理符合,并且產(chǎn)品性能提升,端到端的準(zhǔn)確內(nèi)涵并不重要。
圖森未來CTO王乃巖在今年上半年就就發(fā)文呼吁,業(yè)界要避免陷入狹義端到端的誤區(qū),因為這對智駕量產(chǎn)不利。
畢竟,只要定語加得多,哪款車都可以是最暢銷車型;同樣的只要定義范圍足夠小,任何企業(yè)都能掌握某個板塊的端到端。
2017年6月,馬斯克從OpenAI挖走了一個斯洛伐克籍的研究員。這個人叫Andrej Karpathy,后來成為特斯拉的AI總監(jiān)。
再后來,Andrej Karpathy在特斯拉直接帶領(lǐng)團(tuán)隊重寫了自動駕駛算法,并開發(fā)出BEV純視覺感知技術(shù),也就是目前炙手可熱的端到端,讓特斯拉自動駕駛進(jìn)入新階段。由此也影響了國內(nèi)一大批企業(yè)的技術(shù)路徑。
看到未來的特斯拉不惜重寫了自動駕駛算法,并對訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)設(shè)施進(jìn)行了重構(gòu)。但這并不代表此時此刻的端到端或者說特斯拉的端到端,就是智駕領(lǐng)域的最優(yōu)解。
問界汽車智駕學(xué)院張奇在一場公開課上就向BC表示,“端到端也并非萬能,其自身的‘黑盒’特性決定了無法簡單通過明確的、可解釋的規(guī)則約束系統(tǒng)的安全邊界,存在安全性挑戰(zhàn)。”
為了具象化,張奇舉了幾個簡單的例子,以國內(nèi)目前效果比較好的豆包大模式為例,在某些特定問題上,大模型也會答非所問胡說八道。
“AI的底層算法是計算事物關(guān)聯(lián)性的統(tǒng)計學(xué)邏輯,推導(dǎo)的因果鏈可能有違常識,甚至提供一個錯誤的并且不可預(yù)知的答案。這在業(yè)內(nèi)被稱為幻覺(hallucination)傾向。”
聊天可以胡說八道,但在智駕領(lǐng)域,任何一次錯誤的輸出,導(dǎo)致的結(jié)果都可能是致命的。
另一方面,端到端無法復(fù)現(xiàn)復(fù)雜的、偶發(fā)的極端事件,考驗可解釋性和泛用性能力,把上限提高的同時拉低了下限,即所謂的“蹺蹺板效應(yīng)”。所以在端到端之外,幾乎所有車企都會采取規(guī)則兜底的方式。
以問界為例,會有本能安全網(wǎng)絡(luò)守住紅線,小鵬也同樣有用到XNPG的一些系列規(guī)則基礎(chǔ)兜底。
不管是端到端無法窮盡所有的極端場景,還是在短期內(nèi)學(xué)會選擇和辨別,并穩(wěn)定地輸出最優(yōu)解,就目前來看還不太現(xiàn)實,至少是有風(fēng)險存在。
對此,知行科技創(chuàng)始人兼CEO宋陽表示:“端到端方案具有‘上限高,但下限低’的特點。通俗來說就是,做得好可以達(dá)到很好的效果,做得不好比傳統(tǒng)方案更差。”
山雨欲來風(fēng)滿樓
從最早的有賴于高精地圖的智駕到后來的無圖智駕,再到現(xiàn)如今的多種形式的端到端,技術(shù)演進(jìn)的腳步已經(jīng)超越了消費者的認(rèn)知速度,更是將國內(nèi)智駕的一汪池水?dāng)嚨貌龥坝俊?/p>
首當(dāng)其沖的就是配套智駕業(yè)務(wù)的圖商,在邁向無圖智駕乃至端到端的過程中,地圖供應(yīng)商是最先被拋棄的一方,曾經(jīng)被認(rèn)為是高階智駕不可或缺的高精地圖正在被邊緣。
伴隨車企端到端發(fā)展的“去圖化”的行動,四維圖新CEO程鵬在公開場合炮轟,“部分車企之所以強(qiáng)調(diào)‘無圖’技術(shù)路線,主要是因為無地圖資質(zhì)、無知識產(chǎn)權(quán)、無安全敬畏。”
有些車企高管層明確表示,如果鮮度無法保證,強(qiáng)行在城市使用高精地圖,只會徒增成本不增效果,且無法保證準(zhǔn)確性。但在程鵬看來,近些年,大家都在喊無圖,事實上每一家車企,每一家自動駕駛解決方案商,也依然都在用著高精度地圖。
盡管嘴上不愿意妥協(xié),但身體上依舊很誠實。圖商們也在快速反應(yīng)調(diào)整中,比方過去,高精地圖全部裝在車機(jī)端,但現(xiàn)在變成配備在訓(xùn)練端:汽車智駕的開發(fā)模式形成了云端+車端的開發(fā)閉環(huán),模型在云端進(jìn)行訓(xùn)練和驗證,隨后部署到車端,完成應(yīng)用和數(shù)據(jù)收集回傳。
四維圖新、高德、百度都相繼推出了自己的輕量化地圖產(chǎn)品,相比高精地圖的厘米級精度,輕地圖一般是米級精度,但可實現(xiàn)更高的更新鮮度。
相比起圖商的轉(zhuǎn)型,智駕從業(yè)人員或許才是技術(shù)進(jìn)步中最苦的一群人,如果說時代的一;沂莻人的一座山,那端到端對于他們而言更像是時代的一座山。
某AI芯片公司的自動駕駛總監(jiān)就曾對媒體表示,整體端到端的更改,等于重新做。曾經(jīng)一大批炙手可熱的智駕工程師面臨著不重新學(xué)習(xí)就走人的殘酷現(xiàn)實。
此前,在各品牌城市 NOA 的開城過程中,會遇到大量的極端場景,需要一定程度數(shù)量的規(guī)控程序員和測試工程師處理。在切換至端到端架構(gòu)后,“ 高質(zhì)量數(shù)據(jù) ” 和 “ 頂尖 AI 人才 ” 可能成為更加重要的資源要素。
曾經(jīng)動輒一千多人的研發(fā)團(tuán)隊如今只需要兩三百人足以。2023年,蔚來的智駕人數(shù)超過1000規(guī)模,在今年的NIO IN上面對媒體的提問,李斌也正面回應(yīng)到,智駕不需要其他領(lǐng)域還是大量需要的,公司內(nèi)部會進(jìn)行分流。
理想1300人的智駕團(tuán)隊在今年四月份也啟動了一波大范圍的裁員,甚至一度裁到大動脈后緊急返聘。
小鵬P7+產(chǎn)品團(tuán)隊也向BC表示,智駕這邊從去年年底開始也走了不少人,不學(xué)習(xí)就要淘汰。甚至特斯拉之前 planning control(規(guī)劃控制)的負(fù)責(zé)人也在今年早些時候離職。
端到端團(tuán)隊需要的人數(shù)變少,但人才門檻要求變得更高了。大模型本身要求團(tuán)隊有很強(qiáng)的深度學(xué)習(xí)背景,搭建方案階段,更需要很強(qiáng)的infra(基礎(chǔ)架構(gòu))人才,對感知、規(guī)劃控制每個模塊都有深刻認(rèn)知,了解不同芯片算力平臺的支持力度、不同AI推理框架等。
畢竟,這之前從事寫規(guī)則的規(guī)控程序員們大多沒有深度學(xué)習(xí)的AI背景,在奔涌的時代浪潮下不被裹挾向前就只能拍向岸邊。
盡管在全行業(yè)來看,傳統(tǒng)做規(guī)則算法的工程師,目前還沒有遭遇到大規(guī)模的裁員事件,但可以遇見的是,十字路口就在眼前。
注:圖片部分來源網(wǎng)絡(luò),如有侵權(quán),聯(lián)系刪除
原文標(biāo)題 : 智駕終局還是營銷亂局?

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?