端到端將重塑智駕?獲10億美金融資,解密英國(guó)AI獨(dú)角獸Wayve
作者 |張馬也
編輯 |德新
就在前兩天,英國(guó)AI公司W(wǎng)ayve宣布獲得新一輪10.5億美元融資,投資方為軟銀、英偉達(dá)和現(xiàn)有投資人微軟,可以說(shuō)是頂級(jí)豪華陣容。
作為一家英國(guó)公司,Wayve這輪融資也創(chuàng)造了英國(guó)AI公司有史以來(lái)最大的單筆融資。甚至英國(guó)首相也在一份聲明中表示,它「鞏固了英國(guó)作為人工智能超級(jí)大國(guó)的地位」。
在通用人工智能領(lǐng)域,Open.ai在過(guò)去兩年成為全球頂級(jí)的熱門(mén)標(biāo)的;而智能駕駛領(lǐng)域,曾經(jīng)獲得過(guò)10億美金級(jí)融資的公司不多,只有Waymo、Argo、Cruise等少數(shù)幾家。
Wayve的巨額融資也勾起人們對(duì)于未來(lái)的強(qiáng)烈好奇:它有沒(méi)有可能成為智能駕駛領(lǐng)域的Open.ai,又或者說(shuō),成為端到端這代技術(shù)上的Waymo/Cruise?
到目前為止,Wayve已完成三輪融資,累計(jì)融資金額超過(guò)13億美元。除了資本大鱷和商業(yè)巨頭,有「深度學(xué)習(xí)三巨頭」美譽(yù)、現(xiàn)Meta首席人工智能科學(xué)家Yann LeCun,也是Wayve的投資人。
Wayve上一次引發(fā)關(guān)注是在不久前3月份,原Mobileye中國(guó)區(qū)的負(fù)責(zé)人 Erez Dagan加入Wayve擔(dān)任總裁,主要負(fù)責(zé)產(chǎn)品、業(yè)務(wù)和戰(zhàn)略。
本輪融資后,Wayve將加速推出首款用于量產(chǎn)車(chē)輛的自動(dòng)駕駛軟件,包括L2+智駕軟件以及實(shí)現(xiàn)完全自動(dòng)駕駛的軟件系統(tǒng)。Erez加入后,其重點(diǎn)關(guān)注的方向也是面向OEM的交付。據(jù)說(shuō),Wayve正在與全球前幾大車(chē)廠商洽談合作。
一、自動(dòng)駕駛2.0:押注端到端
Wayve由Alex Kendall(聯(lián)創(chuàng)兼現(xiàn)任CEO)和Amar Shah(已離開(kāi))于2017年共同創(chuàng)立,兩為均來(lái)自劍橋大學(xué)。
其公司總部英國(guó)倫敦,目前約有300名左右的員工。
Wayve稱(chēng)自己是第一個(gè)在公共道路上,開(kāi)發(fā)和測(cè)試端到端深度學(xué)習(xí)自動(dòng)駕駛系統(tǒng)的公司。
2015年,Alex Kendall與Vijay Badrinarayanan(現(xiàn)任AI副總裁)、Roberto Cipolla等人,一起提出了SegNet,這是第一個(gè)使用端到端深度學(xué)習(xí)進(jìn)行語(yǔ)義分割的實(shí)時(shí)方法,無(wú)需高精地圖即可理解復(fù)雜環(huán)境。
從2017年開(kāi)始,Wayve就在汽車(chē)上對(duì)神經(jīng)網(wǎng)絡(luò)強(qiáng)化學(xué)習(xí)的一些早期成果進(jìn)行了應(yīng)用。公司把這套系統(tǒng)在道路上進(jìn)行了模擬部署,隨后逐漸擴(kuò)大規(guī)模,最終實(shí)現(xiàn)在倫敦市中心的交通環(huán)境下進(jìn)行真實(shí)駕駛。
Wayve將自己的智駕系統(tǒng)稱(chēng)為AV2.0。
Wayve認(rèn)為,基于傳統(tǒng)機(jī)器學(xué)習(xí)方法的AV1.0架構(gòu),所面臨的根本問(wèn)題是技術(shù)可擴(kuò)展性。
因?yàn)樗蕾?lài)復(fù)雜的傳感器、高精度地圖和手工編碼的規(guī)則,使得系統(tǒng)成本居高不下,在行為預(yù)測(cè)、規(guī)劃和處理長(zhǎng)尾場(chǎng)景問(wèn)題上,效果很難提升。
AV2.0不依賴(lài)傳統(tǒng)的高清地圖和手工編碼的規(guī)則,而是專(zhuān)注于構(gòu)建數(shù)據(jù)驅(qū)動(dòng)的學(xué)習(xí)型駕駛系統(tǒng),而且可以擴(kuò)展、適應(yīng)、推廣到系統(tǒng)從未見(jiàn)過(guò)的場(chǎng)景。
AV2.0的特點(diǎn)如下:
采用端到端深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu);
無(wú)需高精地圖;
以安全為核心設(shè)計(jì),符合行業(yè)安全期望;
傳感器靈活性,兼容純視覺(jué)到包括雷達(dá)和激光雷達(dá)的多種架構(gòu);
通過(guò)數(shù)據(jù)驅(qū)動(dòng)進(jìn)行泛化擴(kuò)展;
在全球范圍內(nèi),經(jīng)濟(jì)適用;
其中最重要的,就是端到端架構(gòu)。
它拋棄傳統(tǒng)的「感知 - 規(guī)劃 - 執(zhí)行」的架構(gòu),將車(chē)輛傳感器原始的輸入數(shù)據(jù),直接轉(zhuǎn)換為駕駛操作輸出。
在行業(yè)內(nèi),端到端的方法已經(jīng)得到了初步的驗(yàn)證。特斯拉此前發(fā)布的FSD v12,就采用了端到端架構(gòu)。國(guó)內(nèi)外很多用戶(hù)試用過(guò)后,普遍的評(píng)價(jià)是,基本達(dá)到了人類(lèi)駕駛的水準(zhǔn)。
這種方法的核心是自我監(jiān)督學(xué)習(xí)。就像大語(yǔ)言模型LLM預(yù)測(cè)下一個(gè)單詞一樣,駕駛系統(tǒng)可以從原始的、未標(biāo)記的數(shù)據(jù)中進(jìn)行無(wú)監(jiān)督學(xué)習(xí)。
自動(dòng)駕駛和大型語(yǔ)言模型之間有許多相似之處,從根本上講,它們都是大型的、高數(shù)據(jù)量的、復(fù)雜的決策問(wèn)題。輸入模型的數(shù)據(jù)越多,AI模型的特定應(yīng)用就越豐富,越具有表現(xiàn)力,無(wú)需人工輸入即可對(duì)大量駕駛記錄進(jìn)行訓(xùn)練。
二、核心技術(shù)棧:解決可解釋性,建立人機(jī)信任
Wayve為自動(dòng)駕駛的迭代升級(jí)開(kāi)發(fā)了一個(gè)快速、連續(xù)和無(wú)縫的學(xué)習(xí)循環(huán)系統(tǒng)Fleet Learning Loop,不斷記錄數(shù)據(jù)、訓(xùn)練模型、評(píng)估性能和部署更新的模型,以此循環(huán)。
在量產(chǎn)車(chē)隊(duì)中,它能從OEM的各種車(chē)輛中收集真實(shí)世界的駕駛數(shù)據(jù),然后上傳到云端處理,再將迭代后的模型部署到車(chē)端,升級(jí)車(chē)輛的自動(dòng)駕駛功能。
Wayve還一直在開(kāi)發(fā)智能駕駛基礎(chǔ)模型(foundation model for driving)。該模型利用多模態(tài)數(shù)據(jù),包括文本和非駕駛視頻源,來(lái)優(yōu)化對(duì)駕駛環(huán)境的內(nèi)部表征。
Wayve認(rèn)為,這能增強(qiáng)AI模型的駕駛能力,允許從不同來(lái)源交叉學(xué)習(xí)與駕駛相關(guān)的概念,并提高與駕駛?cè)蝿?wù)目標(biāo)的一致性。
簡(jiǎn)單來(lái)說(shuō),就是通過(guò)從多個(gè)數(shù)據(jù)源學(xué)習(xí),可以提高車(chē)輛對(duì)傳感器流中最有意義和可操作性的方面的理解,從而提高智能駕駛的流暢度和安全性。
除此之外,Wayve還開(kāi)發(fā)了LINGO和GAIA兩個(gè)模型,用來(lái)解決智駕場(chǎng)景的可解釋性和信任等問(wèn)題。
行業(yè)內(nèi)對(duì)端到端架構(gòu)的其中一大擔(dān)憂(yōu)是它是一個(gè)黑盒方案,其過(guò)程不可解釋。LINGO能用自然語(yǔ)言描述自己的駕駛決策,并解釋決策的原因。
例如在行駛過(guò)程中,LINGO做出了繞行路邊?寇(chē)輛的判斷時(shí),它可以向用戶(hù)輸出判斷依據(jù):由于交通堵塞,我正在緩慢靠近;我正在經(jīng)過(guò)一輛停在路邊的車(chē);因?yàn)榍胺降缆窌惩,所以我加速前進(jìn)。
Wayve在去年下半年推出過(guò)LINGO-1,當(dāng)時(shí)該模型以視覺(jué)和語(yǔ)言信息為輸入,但只能輸出語(yǔ)言結(jié)果。LINGO-2的輸入和輸出都可以是視覺(jué)和語(yǔ)言信息,甚至也包括駕駛行為,也就是能控制車(chē)輛的行駛。
按官方說(shuō)法,LINGO-2是一種將視覺(jué)、語(yǔ)言和行動(dòng)綜合起來(lái),以解釋和確定駕駛行為的駕駛模型,是第一個(gè)在公開(kāi)道路上測(cè)試的,閉環(huán)「視覺(jué)-語(yǔ)言-行動(dòng)」駕駛模型(VLAM)。
LINGO-2 架構(gòu)
LINGO-2 的亮點(diǎn)在于:通過(guò)語(yǔ)言提示,調(diào)整駕駛行為。
可以使用一些限定的導(dǎo)航命令,如「靠邊停車(chē)」、「右轉(zhuǎn)」等,讓LINGO-2調(diào)整車(chē)輛的行為。這也能幫助模型訓(xùn)練,并且增強(qiáng)人車(chē)交互。
LINGO-2在指令的要求下停車(chē)
LINGO-2回答場(chǎng)景問(wèn)題,并解釋駕駛操作
通過(guò)直接將語(yǔ)言和動(dòng)作聯(lián)系起來(lái),LINGO可以一定程度上揭示出AI系統(tǒng)如何做出決策,使得自動(dòng)駕駛模型不再是一個(gè)「黑盒子」。
更重要的是,LINGO可以增強(qiáng)人類(lèi)對(duì)智能駕駛系統(tǒng)的信任。
目前,LINGO-2還只在Ghost Gym模擬器中進(jìn)行了驗(yàn)證,在現(xiàn)實(shí)世界中用語(yǔ)言控制汽車(chē)的行為是否可以可靠、安全地完成,還需要更多研究。
三、將世界模型融入駕駛模型
對(duì)于長(zhǎng)尾場(chǎng)景,Wayve給出的一個(gè)解決方法是GAIA-1,一個(gè)為智能駕駛打造的生成式世界模型。
GAIA-1架構(gòu)
GAIA-1首先是一個(gè)多模態(tài)生成模型,利用視頻、文本和動(dòng)作輸入,生成逼真的駕駛場(chǎng)景視頻。它能夠?qū)?chē)輛的行為和其他基本場(chǎng)景特征,進(jìn)行細(xì)粒度控制。無(wú)論是改變車(chē)輛的行為,還是修改整體場(chǎng)景,模型都能完成。
這樣,GAIA-1可以作為仿真模擬中的重要一環(huán),生成無(wú)限的數(shù)據(jù),來(lái)訓(xùn)練和驗(yàn)證自動(dòng)駕駛系統(tǒng),解決極端場(chǎng)景,特別是在獲取真實(shí)世界數(shù)據(jù)成本高或風(fēng)險(xiǎn)大的情況下。
GAIA-1可根據(jù)各種提示,生成駕駛場(chǎng)景
它還是一個(gè)真實(shí)的世界模型,可以學(xué)習(xí)、理解駕駛中的重要概念,比如什么是卡車(chē)、公共汽車(chē)、行人、騎自行車(chē)的人、道路布局、建筑物和交通信號(hào)燈。
所謂世界模型,是對(duì)環(huán)境及其未來(lái)動(dòng)態(tài)的表征,能實(shí)現(xiàn)對(duì)周?chē)h(huán)境的結(jié)構(gòu)化理解,就像人類(lèi)對(duì)自己周?chē)沫h(huán)境進(jìn)行建模理解一樣。
將世界模型整合到駕駛模型中,使得自動(dòng)駕駛車(chē)輛能夠預(yù)測(cè)未來(lái)事件,從而提前規(guī)劃行動(dòng),在復(fù)雜或未知的情況下做出更加明智的決策。
目前版本的GAIA-1擁有超過(guò)90億個(gè)可訓(xùn)練參數(shù),訓(xùn)練數(shù)據(jù)集包含了2019年至2023年在倫敦收集的4700小時(shí)的專(zhuān)有駕駛數(shù)據(jù)。模型可以預(yù)測(cè)視頻序列中的后續(xù)幀,從而在不需要任何標(biāo)簽的情況下,實(shí)現(xiàn)自回歸預(yù)測(cè)能力。
四、邁向商業(yè)化量產(chǎn)
目前,Wayve在商業(yè)化上的作為不多。
此前,它一直在英國(guó)生鮮配送公司Ocado的車(chē)上訓(xùn)練模型,這家公司也是投資方之一,曾投資了1360萬(wàn)美元。
據(jù)稱(chēng),Wayve已經(jīng)在全球100多個(gè)城市開(kāi)始了系統(tǒng)測(cè)試。
本輪融資后,Wayve將加速推出首款用于量產(chǎn)車(chē)輛的自動(dòng)駕駛軟件,包括L2+智駕系統(tǒng),以及實(shí)現(xiàn)完全自動(dòng)駕駛的軟件系統(tǒng)。
它也在與全球前幾大車(chē)廠商洽談合作,但具體名單未知。
原Mobileye中國(guó)區(qū)的負(fù)責(zé)人Erez Dagan加入Wayve擔(dān)任總裁,其重要的關(guān)注方向也是面向OEM的交付。Erez在Mobileye工作了20年,是全世界第一款純視覺(jué)ADAS產(chǎn)品的創(chuàng)始團(tuán)隊(duì)成員,后來(lái)?yè)?dān)任產(chǎn)品和戰(zhàn)略執(zhí)行副總裁,并在Mobileye被收購(gòu)后擔(dān)任英特爾集團(tuán)副總裁。
聯(lián)系到此前馬斯克表示,特斯拉將于今年8月8日發(fā)布Robotaxi,種種跡象似乎表明完全自動(dòng)駕駛的技術(shù)路線正在逐漸清晰。
Wayve的目標(biāo)甚至不止于此。在最近Techcrunch的一次采訪中,Alex Kendall說(shuō)到,Wayve的駕駛大模型不僅在駕駛數(shù)據(jù)上進(jìn)行訓(xùn)練,還對(duì)互聯(lián)網(wǎng)規(guī)模的文本和其他來(lái)源進(jìn)行訓(xùn)練,甚至使用英國(guó)政府的PDF文檔來(lái)訓(xùn)練模型。
Wayve正在構(gòu)建具身AI(Embodied AI)基礎(chǔ)模型,一個(gè)基于非常多樣化的數(shù)據(jù)進(jìn)行訓(xùn)練的通用系統(tǒng),能夠在復(fù)雜的現(xiàn)實(shí)世界環(huán)境中感知、行動(dòng)、學(xué)習(xí)和適應(yīng)人類(lèi)行為。智能駕駛只是這一系統(tǒng)目前最大的應(yīng)用場(chǎng)景。
原文標(biāo)題 : 端到端將重塑智駕?獲10億美金融資,解密英國(guó)AI獨(dú)角獸Wayve
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
技術(shù)文庫(kù)
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車(chē)電子技術(shù)在線大會(huì)
-
免費(fèi)參會(huì)立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
-
精彩回顧立即查看>> 【線上直播】新能源汽車(chē)熱管理行業(yè)應(yīng)用新進(jìn)展
-
精彩回顧立即查看>> 【線上直播】西門(mén)子電池行業(yè)研討會(huì)-P4B如何加速電池開(kāi)發(fā)
-
精彩回顧立即查看>> 【線下會(huì)議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
精彩回顧立即查看>> 【線下論壇】華邦電子與萊迪思聯(lián)合技術(shù)論壇
推薦專(zhuān)題
-
10
- 1 2025上海車(chē)展看什么?看這一篇就夠了!
- 2 關(guān)稅大戰(zhàn),汽車(chē)芯片會(huì)漲價(jià)嗎
- 3 工信部召開(kāi)智能網(wǎng)聯(lián)汽車(chē)產(chǎn)品準(zhǔn)入及軟件在線升級(jí)管理工作推進(jìn)會(huì)提的內(nèi)容,將如何影響智駕行業(yè)發(fā)展?
- 4 地平線智駕方案軟硬結(jié)合,大眾、保時(shí)捷的合作紛至沓來(lái)
- 5 高呼的“全民智駕”真的做到“全民”了嗎?
- 6 一季度汽車(chē)產(chǎn)量省份排名大洗牌!誰(shuí)在異軍突起?
- 7 奇瑞的混動(dòng)技術(shù):厚積薄發(fā),從發(fā)動(dòng)機(jī)到混動(dòng)系統(tǒng)
- 8 三條人命,給全民智駕潑了三盆冷水
- 9 東風(fēng)+華為,還是華為借東風(fēng)?華為ADS3.0技術(shù)詳解
- 10 工信部對(duì)浮躁的智駕說(shuō)“不”
