侵權(quán)投訴
訂閱
糾錯(cuò)
加入自媒體

端到端將重塑智駕?獲10億美金融資,解密英國(guó)AI獨(dú)角獸Wayve

‍作者 |張馬也

編輯 |德新

圖片

就在前兩天,英國(guó)AI公司W(wǎng)ayve宣布獲得新一輪10.5億美元融資,投資方為軟銀、英偉達(dá)和現(xiàn)有投資人微軟,可以說(shuō)是頂級(jí)豪華陣容。

作為一家英國(guó)公司,Wayve這輪融資也創(chuàng)造了英國(guó)AI公司有史以來(lái)最大的單筆融資。甚至英國(guó)首相也在一份聲明中表示,它「鞏固了英國(guó)作為人工智能超級(jí)大國(guó)的地位」。

在通用人工智能領(lǐng)域,Open.ai在過(guò)去兩年成為全球頂級(jí)的熱門(mén)標(biāo)的;而智能駕駛領(lǐng)域,曾經(jīng)獲得過(guò)10億美金級(jí)融資的公司不多,只有Waymo、Argo、Cruise等少數(shù)幾家。

Wayve的巨額融資也勾起人們對(duì)于未來(lái)的強(qiáng)烈好奇:它有沒(méi)有可能成為智能駕駛領(lǐng)域的Open.ai,又或者說(shuō),成為端到端這代技術(shù)上的Waymo/Cruise?

到目前為止,Wayve已完成三輪融資,累計(jì)融資金額超過(guò)13億美元。除了資本大鱷和商業(yè)巨頭,有「深度學(xué)習(xí)三巨頭」美譽(yù)、現(xiàn)Meta首席人工智能科學(xué)家Yann LeCun,也是Wayve的投資人。

Wayve上一次引發(fā)關(guān)注是在不久前3月份,原Mobileye中國(guó)區(qū)的負(fù)責(zé)人 Erez Dagan加入Wayve擔(dān)任總裁,主要負(fù)責(zé)產(chǎn)品、業(yè)務(wù)和戰(zhàn)略。

本輪融資后,Wayve將加速推出首款用于量產(chǎn)車(chē)輛的自動(dòng)駕駛軟件,包括L2+智駕軟件以及實(shí)現(xiàn)完全自動(dòng)駕駛的軟件系統(tǒng)。Erez加入后,其重點(diǎn)關(guān)注的方向也是面向OEM的交付。據(jù)說(shuō),Wayve正在與全球前幾大車(chē)廠商洽談合作。

一、自動(dòng)駕駛2.0:押注端到端

Wayve由Alex Kendall(聯(lián)創(chuàng)兼現(xiàn)任CEO)和Amar Shah(已離開(kāi))于2017年共同創(chuàng)立,兩為均來(lái)自劍橋大學(xué)。

其公司總部英國(guó)倫敦,目前約有300名左右的員工。

圖片

Wayve稱(chēng)自己是第一個(gè)在公共道路上,開(kāi)發(fā)和測(cè)試端到端深度學(xué)習(xí)自動(dòng)駕駛系統(tǒng)的公司。

2015年,Alex Kendall與Vijay Badrinarayanan(現(xiàn)任AI副總裁)、Roberto Cipolla等人,一起提出了SegNet,這是第一個(gè)使用端到端深度學(xué)習(xí)進(jìn)行語(yǔ)義分割的實(shí)時(shí)方法,無(wú)需高精地圖即可理解復(fù)雜環(huán)境

從2017年開(kāi)始,Wayve就在汽車(chē)上對(duì)神經(jīng)網(wǎng)絡(luò)強(qiáng)化學(xué)習(xí)的一些早期成果進(jìn)行了應(yīng)用。公司把這套系統(tǒng)在道路上進(jìn)行了模擬部署,隨后逐漸擴(kuò)大規(guī)模,最終實(shí)現(xiàn)在倫敦市中心的交通環(huán)境下進(jìn)行真實(shí)駕駛。

Wayve將自己的智駕系統(tǒng)稱(chēng)為AV2.0。

圖片

Wayve認(rèn)為,基于傳統(tǒng)機(jī)器學(xué)習(xí)方法的AV1.0架構(gòu),所面臨的根本問(wèn)題是技術(shù)可擴(kuò)展性。

因?yàn)樗蕾?lài)復(fù)雜的傳感器、高精度地圖和手工編碼的規(guī)則,使得系統(tǒng)成本居高不下,在行為預(yù)測(cè)、規(guī)劃和處理長(zhǎng)尾場(chǎng)景問(wèn)題上,效果很難提升。

AV2.0不依賴(lài)傳統(tǒng)的高清地圖和手工編碼的規(guī)則,而是專(zhuān)注于構(gòu)建數(shù)據(jù)驅(qū)動(dòng)的學(xué)習(xí)型駕駛系統(tǒng),而且可以擴(kuò)展、適應(yīng)、推廣到系統(tǒng)從未見(jiàn)過(guò)的場(chǎng)景。

AV2.0的特點(diǎn)如下:

采用端到端深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu);

無(wú)需高精地圖;

以安全為核心設(shè)計(jì),符合行業(yè)安全期望;

傳感器靈活性,兼容純視覺(jué)到包括雷達(dá)和激光雷達(dá)的多種架構(gòu);

通過(guò)數(shù)據(jù)驅(qū)動(dòng)進(jìn)行泛化擴(kuò)展;

在全球范圍內(nèi),經(jīng)濟(jì)適用;

其中最重要的,就是端到端架構(gòu)。

它拋棄傳統(tǒng)的「感知 - 規(guī)劃 - 執(zhí)行」的架構(gòu),將車(chē)輛傳感器原始的輸入數(shù)據(jù),直接轉(zhuǎn)換為駕駛操作輸出。

在行業(yè)內(nèi),端到端的方法已經(jīng)得到了初步的驗(yàn)證。特斯拉此前發(fā)布的FSD v12,就采用了端到端架構(gòu)。國(guó)內(nèi)外很多用戶(hù)試用過(guò)后,普遍的評(píng)價(jià)是,基本達(dá)到了人類(lèi)駕駛的水準(zhǔn)。

這種方法的核心是自我監(jiān)督學(xué)習(xí)。就像大語(yǔ)言模型LLM預(yù)測(cè)下一個(gè)單詞一樣,駕駛系統(tǒng)可以從原始的、未標(biāo)記的數(shù)據(jù)中進(jìn)行無(wú)監(jiān)督學(xué)習(xí)。

自動(dòng)駕駛和大型語(yǔ)言模型之間有許多相似之處,從根本上講,它們都是大型的、高數(shù)據(jù)量的、復(fù)雜的決策問(wèn)題。輸入模型的數(shù)據(jù)越多,AI模型的特定應(yīng)用就越豐富,越具有表現(xiàn)力,無(wú)需人工輸入即可對(duì)大量駕駛記錄進(jìn)行訓(xùn)練。

二、核心技術(shù)棧:解決可解釋性,建立人機(jī)信任

Wayve為自動(dòng)駕駛的迭代升級(jí)開(kāi)發(fā)了一個(gè)快速、連續(xù)和無(wú)縫的學(xué)習(xí)循環(huán)系統(tǒng)Fleet Learning Loop,不斷記錄數(shù)據(jù)、訓(xùn)練模型、評(píng)估性能和部署更新的模型,以此循環(huán)。

在量產(chǎn)車(chē)隊(duì)中,它能從OEM的各種車(chē)輛中收集真實(shí)世界的駕駛數(shù)據(jù),然后上傳到云端處理,再將迭代后的模型部署到車(chē)端,升級(jí)車(chē)輛的自動(dòng)駕駛功能。

Wayve還一直在開(kāi)發(fā)智能駕駛基礎(chǔ)模型(foundation model for driving)。該模型利用多模態(tài)數(shù)據(jù),包括文本和非駕駛視頻源,來(lái)優(yōu)化對(duì)駕駛環(huán)境的內(nèi)部表征。

Wayve認(rèn)為,這能增強(qiáng)AI模型的駕駛能力,允許從不同來(lái)源交叉學(xué)習(xí)與駕駛相關(guān)的概念,并提高與駕駛?cè)蝿?wù)目標(biāo)的一致性。

簡(jiǎn)單來(lái)說(shuō),就是通過(guò)從多個(gè)數(shù)據(jù)源學(xué)習(xí),可以提高車(chē)輛對(duì)傳感器流中最有意義和可操作性的方面的理解,從而提高智能駕駛的流暢度和安全性。

除此之外,Wayve還開(kāi)發(fā)了LINGO和GAIA兩個(gè)模型,用來(lái)解決智駕場(chǎng)景的可解釋性和信任等問(wèn)題。

行業(yè)內(nèi)對(duì)端到端架構(gòu)的其中一大擔(dān)憂(yōu)是它是一個(gè)黑盒方案,其過(guò)程不可解釋。LINGO能用自然語(yǔ)言描述自己的駕駛決策,并解釋決策的原因。

例如在行駛過(guò)程中,LINGO做出了繞行路邊?寇(chē)輛的判斷時(shí),它可以向用戶(hù)輸出判斷依據(jù):由于交通堵塞,我正在緩慢靠近;我正在經(jīng)過(guò)一輛停在路邊的車(chē);因?yàn)榍胺降缆窌惩,所以我加速前進(jìn)。

Wayve在去年下半年推出過(guò)LINGO-1,當(dāng)時(shí)該模型以視覺(jué)和語(yǔ)言信息為輸入,但只能輸出語(yǔ)言結(jié)果。LINGO-2的輸入和輸出都可以是視覺(jué)和語(yǔ)言信息,甚至也包括駕駛行為,也就是能控制車(chē)輛的行駛。

按官方說(shuō)法,LINGO-2是一種將視覺(jué)、語(yǔ)言和行動(dòng)綜合起來(lái),以解釋和確定駕駛行為的駕駛模型,是第一個(gè)在公開(kāi)道路上測(cè)試的,閉環(huán)「視覺(jué)-語(yǔ)言-行動(dòng)」駕駛模型(VLAM)。

LINGO-2 架構(gòu)

LINGO-2 的亮點(diǎn)在于:通過(guò)語(yǔ)言提示,調(diào)整駕駛行為

可以使用一些限定的導(dǎo)航命令,如「靠邊停車(chē)」、「右轉(zhuǎn)」等,讓LINGO-2調(diào)整車(chē)輛的行為。這也能幫助模型訓(xùn)練,并且增強(qiáng)人車(chē)交互。

LINGO-2在指令的要求下停車(chē)

 

LINGO-2回答場(chǎng)景問(wèn)題,并解釋駕駛操作

通過(guò)直接將語(yǔ)言和動(dòng)作聯(lián)系起來(lái),LINGO可以一定程度上揭示出AI系統(tǒng)如何做出決策,使得自動(dòng)駕駛模型不再是一個(gè)「黑盒子」。

更重要的是,LINGO可以增強(qiáng)人類(lèi)對(duì)智能駕駛系統(tǒng)的信任。

目前,LINGO-2還只在Ghost Gym模擬器中進(jìn)行了驗(yàn)證,在現(xiàn)實(shí)世界中用語(yǔ)言控制汽車(chē)的行為是否可以可靠、安全地完成,還需要更多研究。

三、將世界模型融入駕駛模型

對(duì)于長(zhǎng)尾場(chǎng)景,Wayve給出的一個(gè)解決方法是GAIA-1,一個(gè)為智能駕駛打造的生成式世界模型。

GAIA-1架構(gòu)

GAIA-1首先是一個(gè)多模態(tài)生成模型,利用視頻、文本和動(dòng)作輸入,生成逼真的駕駛場(chǎng)景視頻。它能夠?qū)?chē)輛的行為和其他基本場(chǎng)景特征,進(jìn)行細(xì)粒度控制。無(wú)論是改變車(chē)輛的行為,還是修改整體場(chǎng)景,模型都能完成。

這樣,GAIA-1可以作為仿真模擬中的重要一環(huán),生成無(wú)限的數(shù)據(jù),來(lái)訓(xùn)練和驗(yàn)證自動(dòng)駕駛系統(tǒng),解決極端場(chǎng)景,特別是在獲取真實(shí)世界數(shù)據(jù)成本高或風(fēng)險(xiǎn)大的情況下。

GAIA-1可根據(jù)各種提示,生成駕駛場(chǎng)景

它還是一個(gè)真實(shí)的世界模型,可以學(xué)習(xí)、理解駕駛中的重要概念,比如什么是卡車(chē)、公共汽車(chē)、行人、騎自行車(chē)的人、道路布局、建筑物和交通信號(hào)燈。

所謂世界模型,是對(duì)環(huán)境及其未來(lái)動(dòng)態(tài)的表征,能實(shí)現(xiàn)對(duì)周?chē)h(huán)境的結(jié)構(gòu)化理解,就像人類(lèi)對(duì)自己周?chē)沫h(huán)境進(jìn)行建模理解一樣。

將世界模型整合到駕駛模型中,使得自動(dòng)駕駛車(chē)輛能夠預(yù)測(cè)未來(lái)事件,從而提前規(guī)劃行動(dòng),在復(fù)雜或未知的情況下做出更加明智的決策。

目前版本的GAIA-1擁有超過(guò)90億個(gè)可訓(xùn)練參數(shù),訓(xùn)練數(shù)據(jù)集包含了2019年至2023年在倫敦收集的4700小時(shí)的專(zhuān)有駕駛數(shù)據(jù)。模型可以預(yù)測(cè)視頻序列中的后續(xù)幀,從而在不需要任何標(biāo)簽的情況下,實(shí)現(xiàn)自回歸預(yù)測(cè)能力。

四、邁向商業(yè)化量產(chǎn)

目前,Wayve在商業(yè)化上的作為不多。

此前,它一直在英國(guó)生鮮配送公司Ocado的車(chē)上訓(xùn)練模型,這家公司也是投資方之一,曾投資了1360萬(wàn)美元。

圖片

據(jù)稱(chēng),Wayve已經(jīng)在全球100多個(gè)城市開(kāi)始了系統(tǒng)測(cè)試。

本輪融資后,Wayve將加速推出首款用于量產(chǎn)車(chē)輛的自動(dòng)駕駛軟件,包括L2+智駕系統(tǒng),以及實(shí)現(xiàn)完全自動(dòng)駕駛的軟件系統(tǒng)。

它也在與全球前幾大車(chē)廠商洽談合作,但具體名單未知。

原Mobileye中國(guó)區(qū)的負(fù)責(zé)人Erez Dagan加入Wayve擔(dān)任總裁,其重要的關(guān)注方向也是面向OEM的交付。Erez在Mobileye工作了20年,是全世界第一款純視覺(jué)ADAS產(chǎn)品的創(chuàng)始團(tuán)隊(duì)成員,后來(lái)?yè)?dān)任產(chǎn)品和戰(zhàn)略執(zhí)行副總裁,并在Mobileye被收購(gòu)后擔(dān)任英特爾集團(tuán)副總裁。

聯(lián)系到此前馬斯克表示,特斯拉將于今年8月8日發(fā)布Robotaxi,種種跡象似乎表明完全自動(dòng)駕駛的技術(shù)路線正在逐漸清晰。

Wayve的目標(biāo)甚至不止于此。在最近Techcrunch的一次采訪中,Alex Kendall說(shuō)到,Wayve的駕駛大模型不僅在駕駛數(shù)據(jù)上進(jìn)行訓(xùn)練,還對(duì)互聯(lián)網(wǎng)規(guī)模的文本和其他來(lái)源進(jìn)行訓(xùn)練,甚至使用英國(guó)政府的PDF文檔來(lái)訓(xùn)練模型

Wayve正在構(gòu)建具身AI(Embodied AI)基礎(chǔ)模型,一個(gè)基于非常多樣化的數(shù)據(jù)進(jìn)行訓(xùn)練的通用系統(tǒng),能夠在復(fù)雜的現(xiàn)實(shí)世界環(huán)境中感知、行動(dòng)、學(xué)習(xí)和適應(yīng)人類(lèi)行為。智能駕駛只是這一系統(tǒng)目前最大的應(yīng)用場(chǎng)景。

       原文標(biāo)題 : 端到端將重塑智駕?獲10億美金融資,解密英國(guó)AI獨(dú)角獸Wayve

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)