自動(dòng)駕駛中提到的WEWA架構(gòu)是個(gè)啥?
最近有小伙伴在留言區(qū)留言,想讓我聊聊現(xiàn)在非;馃岬腤EWA架構(gòu),相較于VLA,WEWA有何區(qū)別,今天就簡單聊聊這個(gè)內(nèi)容,也期待大家在評(píng)論區(qū)留言討論。
什么是WEWA?
WEWA全稱可以理解為“World Engine+World Action”。它把實(shí)現(xiàn)自動(dòng)駕駛的思路拆成兩層,一層在云端,負(fù)責(zé)“造世界、訓(xùn)練模型、把難題推演透”;另一層在車端,負(fù)責(zé)“看世界、理解世界、直接下決定并把車開出去”。云端是大腦的訓(xùn)練工廠,車端是實(shí)時(shí)決策與執(zhí)行的現(xiàn)場(chǎng)指揮。這樣做有一個(gè)好處,那就是可以把稀有但危急的邊緣場(chǎng)景用數(shù)據(jù)和模型在云端“補(bǔ)齊”,把實(shí)力更強(qiáng)的行為模型蒸餾、裁剪后放到車上,讓車能用盡可能低的延遲、盡可能接近人類的方式去處理突發(fā)狀況。
WEWA的“World Engine”其實(shí)更側(cè)重生成和仿真,尤其是長尾和“難例”場(chǎng)景的合成;“World Action”則是車端的行為模型,依賴多模態(tài)感知(攝像頭、毫米波/雷達(dá)/激光雷達(dá)、車內(nèi)外麥克風(fēng)等),并通過一種多專家(Mixture of Experts,MoE)機(jī)制在運(yùn)行時(shí)選擇或組合最佳決策路徑。訓(xùn)練在云,推理在車,這是它最核心的運(yùn)作節(jié)奏。
WEWA和VLA有何區(qū)別?
與現(xiàn)在自動(dòng)駕駛行業(yè)非常火熱的VLA相比,WEWA有什么區(qū)別?VLA的核心思想是把視覺理解和語言推理聯(lián)系起來,讓模型用類似“語言”的中間表示來解釋、推理世界,進(jìn)而生成動(dòng)作。這種方式的優(yōu)點(diǎn)是可解釋性更強(qiáng),好的VLA系統(tǒng)在推理鏈路上能讓工程師更容易理解為什么會(huì)做出某個(gè)決策,也便于用文本/符號(hào)做高層規(guī)劃或嵌入人機(jī)交互。
WEWA則選擇跳過“語言”這一步,直接把世界狀態(tài)映射到動(dòng)作。它不把感知到的信息先翻譯成符號(hào)化的語言再推理,而是把云端訓(xùn)練出的世界模型(擅長物理推演與行為預(yù)測(cè))蒸餾成車端可運(yùn)行的行為模型,由多模態(tài)輸入直接驅(qū)動(dòng)決策與軌跡輸出。這樣做的直接效果就是省去了從“感知→符號(hào)化語言→推理→動(dòng)作”這段可能產(chǎn)生的精度損耗與時(shí)間延遲。
VLA路線通常更仰仗大規(guī)模真實(shí)路測(cè)數(shù)據(jù),把大量實(shí)車?yán)锍坍?dāng)作模型上限的重要組成部分;而WEWA更強(qiáng)調(diào)用高質(zhì)量的仿真與合成數(shù)據(jù)去補(bǔ)齊那些在現(xiàn)實(shí)中幾乎見不到但安全關(guān)鍵的邊緣場(chǎng)景。
WEWA的幾個(gè)技術(shù)優(yōu)勢(shì)
汽車是高實(shí)時(shí)性、高安全邊界的系統(tǒng),任何多一步的數(shù)據(jù)轉(zhuǎn)換或延遲都會(huì)放大風(fēng)險(xiǎn)。WEWA的設(shè)計(jì)選擇正是從這類工程約束出發(fā)的,因此它在幾個(gè)地方有明顯的工程優(yōu)勢(shì)。
1)低延時(shí)更利于“車端即時(shí)控制”
WEWA把訓(xùn)練好的行為模型蒸餾到車端并與多模態(tài)感知直接聯(lián)動(dòng),避免了把信息先翻譯成語言符號(hào)再做二次推理的過程。少一次轉(zhuǎn)換,就少一次可能的精度損失和延遲。華為ADS4就是采用WEWA技術(shù)架構(gòu),據(jù)其官方介紹,這一架構(gòu)下的端到端時(shí)延降低了約一半,這種延時(shí)改進(jìn)在高速與突發(fā)場(chǎng)景下直接等同于多一層安全緩沖。
2)更高效覆蓋長尾“難例”
真正危及安全的罕見場(chǎng)景在現(xiàn)實(shí)中其實(shí)非常稀少,單靠車隊(duì)跑數(shù)據(jù)很難在可接受的時(shí)間內(nèi)覆蓋所有會(huì)導(dǎo)致嚴(yán)重后果的邊緣場(chǎng)景。WEWA把“難例擴(kuò)散生成模型”放在云端,通過合成與仿真生成高密度的極端場(chǎng)景用于訓(xùn)練,云端能在短時(shí)間內(nèi)把非常多、非常罕見但具有代表性的危險(xiǎn)場(chǎng)景喂給模型,提升模型在這些極端場(chǎng)景下的魯棒性。VLA路線雖也重視仿真,但往往更依賴真實(shí)路測(cè)去獲得臨界狀態(tài)數(shù)據(jù),這會(huì)受限于采集效率和時(shí)間窗口。
3)蒸餾與MoE帶來資源與性能的折衷
WEWA架構(gòu)下,云端可以訓(xùn)練體量更大的“世界模型”,車端運(yùn)行的是蒸餾后、經(jīng)過剪枝和專門優(yōu)化的“世界行為模型”。再結(jié)合MoE這種運(yùn)行時(shí)只激活部分專家(而不是總調(diào)用全部模型)的策略,能在有限算力下實(shí)現(xiàn)接近大模型的決策能力。這能讓整套系統(tǒng)在車端對(duì)算力的需求更溫和,也讓軟硬件協(xié)同調(diào)優(yōu)的可能性變多。
4)端云協(xié)同提升迭代效率
WEWA把復(fù)雜訓(xùn)練放在云端,更新和能力提升可以通過OTA把改進(jìn)快速推到車上;同時(shí),云端的仿真與真實(shí)回放能形成閉環(huán),理論上能更快把在車上發(fā)現(xiàn)的“新難例”補(bǔ)回到訓(xùn)練集中去,這種端云的正反饋對(duì)能力加速很有幫助。
以上這些都是WEWA的技術(shù)賣點(diǎn),但其也有一些潛在的問題。仿真生成的場(chǎng)景質(zhì)量決定了訓(xùn)練結(jié)果的上限,如果生成模型沒把物理細(xì)節(jié)或光學(xué)特性還原好,訓(xùn)練出的行為模型在現(xiàn)實(shí)會(huì)遭遇分布偏差。還有就是跳過“語言”層,所帶來的可解釋性劣勢(shì)也是必須面對(duì)的事實(shí),沒有清晰的中間符號(hào),工程師在調(diào)試復(fù)雜失敗案例時(shí)會(huì)更難定位問題根源。再者,蒸餾雖能壓縮模型,但在極端態(tài)下有可能喪失一些細(xì)微但關(guān)鍵的決策能力,如何在壓縮與安全之間做平衡,是需要解決的問題。
體驗(yàn)才是檢驗(yàn)一切的標(biāo)尺
無論架構(gòu)上講得多漂亮,只有用戶體驗(yàn)和道路實(shí)測(cè)才是判斷一個(gè)技術(shù)最好的場(chǎng)所。WEWA要保證的是在真實(shí)路況下“看起來順、開起來安全”。體驗(yàn)好不好往往由系統(tǒng)在突發(fā)情境下反應(yīng)是否自然、是否能避免過度干預(yù)、能否在復(fù)雜場(chǎng)景下給出穩(wěn)定而可預(yù)測(cè)的行為等幾個(gè)直觀感受決定的。
VLA把語言中間表示作為橋梁,某些場(chǎng)景下能更容易解釋“為什么這么做”,這對(duì)用戶信任和工程調(diào)試有幫助。但解釋性并不等于效果好,解釋性強(qiáng)的推理若因延遲或精度損失導(dǎo)致決策遲鈍或不穩(wěn),用戶同樣不會(huì)買單。因此這兩條路線的終極較量,還是體現(xiàn)在“誰能在真實(shí)道路上、在成千上萬小時(shí)的運(yùn)行中,把安全與舒適都做實(shí)”的能力。
其實(shí)用戶體驗(yàn)是一個(gè)長期的迭代的過程。哪怕初期某個(gè)架構(gòu)在某些場(chǎng)景表現(xiàn)更優(yōu),持續(xù)的場(chǎng)景采集、仿真增強(qiáng)、模型更新和OTA能力同樣決定最終勝負(fù)。廠商之間或會(huì)越來越多地把注意力放在閉環(huán)能力上,車上出了事情是否能快速回傳并被云端吸收?云端又是否能快速把改進(jìn)推回車上?這個(gè)循環(huán)的快慢直接影響能力演進(jìn)速率。
最后的話
WEWA的思路是把有限的車端資源和高實(shí)時(shí)性需求放在首位,用云端補(bǔ)齊真實(shí)世界難以采集的長尾場(chǎng)景,通過蒸餾和MoE在車端做出及時(shí)且穩(wěn)健的決策。這樣做的好處在于延遲更低、能更系統(tǒng)地覆蓋難例、并且在量產(chǎn)與成本上有更現(xiàn)實(shí)的考量。VLA的長處在于解釋性、用真實(shí)數(shù)據(jù)打磨行為和把語言能力作為更高階的人機(jī)交互與推理工具。
其實(shí)對(duì)用戶而言真正有價(jià)值的,是在復(fù)雜路況下系統(tǒng)不會(huì)“慌”,在突發(fā)場(chǎng)景下決策既安全又合乎人的直覺。這意味著技術(shù)路線之爭(zhēng)的背后,本質(zhì)是對(duì)“可信賴體驗(yàn)”的追求,系統(tǒng)不僅不能出錯(cuò),更要讓人安心。無論是WEWA的實(shí)時(shí)響應(yīng)還是VLA的行為可解釋,最終都是為了實(shí)現(xiàn)一種連貫、自然的駕駛風(fēng)格,讓乘客在無意識(shí)中感受到技術(shù)的可靠性。也只有當(dāng)系統(tǒng)能像人類一樣從容應(yīng)對(duì)不確定性,才能真正贏得用戶的長期信任,推動(dòng)自動(dòng)駕駛從功能走向陪伴。
-- END --
原文標(biāo)題 : 自動(dòng)駕駛中提到的WEWA架構(gòu)是個(gè)啥?

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字
最新活動(dòng)更多
-
10月23日火熱報(bào)名中>> 2025是德科技創(chuàng)新技術(shù)峰會(huì)
-
10月23日立即報(bào)名>> Works With 開發(fā)者大會(huì)深圳站
-
10月24日立即參評(píng)>> 【評(píng)選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評(píng)選
-
11月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
12月18日立即報(bào)名>> 【線下會(huì)議】OFweek 2025(第十屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
精彩回顧立即查看>> 【限時(shí)福利】TE 2025國際物聯(lián)網(wǎng)展·深圳站
推薦專題
- 1 人形機(jī)器人廠商,正在批量復(fù)刻宇樹G1
- 2 【行業(yè)深度研究】退居幕后四年后,張一鳴終于把算法公司變成AI公司?
- 3 自動(dòng)駕駛誰將笑傲江湖?如何把握無人駕駛“財(cái)富密碼”?
- 4 AI 時(shí)代,阿里云想當(dāng)“安卓” ,那誰是“蘋果”?
- 5 一家被嚴(yán)重低估的國產(chǎn)AI巨頭
- 6 華為公布昇騰芯片三年計(jì)劃,自研HBM曝光
- 7 特斯拉機(jī)器人獲得10,000臺(tái)訂單?馬斯克抄底成功
- 8 一文看懂|宇樹科技:年?duì)I收破10億,機(jī)器人賽道迎來關(guān)鍵檢驗(yàn)
- 9 硬剛英偉達(dá)!華為發(fā)布全球最強(qiáng)算力超節(jié)點(diǎn)和集群
- 10 一萬億美元!馬斯克薪酬細(xì)節(jié)拆解