相較于特斯拉的自動(dòng)駕駛技術(shù),Waymo在訓(xùn)練數(shù)據(jù)上處于明顯劣勢(shì)?
還有其它的表態(tài):
“每一次有人干預(yù)駕駛,即接管了自動(dòng)駕駛系統(tǒng)之后,我們的自動(dòng)駕駛系統(tǒng)便會(huì)保存這些信息并將其上傳到我們的系統(tǒng)里。我們真的開(kāi)始變得非常擅長(zhǎng)訓(xùn)練系統(tǒng),甚至不需要人為輸入訓(xùn)練數(shù)據(jù)、標(biāo)記人工標(biāo)簽了。基本上,當(dāng)一個(gè)駕駛員駛過(guò)一個(gè)交叉路口時(shí),他就會(huì)訓(xùn)練自動(dòng)駕駛系統(tǒng)應(yīng)該怎么做!
當(dāng)然你可以認(rèn)為馬斯克的表態(tài)含糊不清,有多種可能的解釋。但是對(duì)于我來(lái)說(shuō),我認(rèn)為模仿學(xué)習(xí)和馬斯克所說(shuō)的東西最為吻合。
要進(jìn)行模仿學(xué)習(xí),特斯拉不需要上傳視頻等任何原始傳感器數(shù)據(jù),它直接上傳感知型神經(jīng)網(wǎng)絡(luò)對(duì)其所看到的場(chǎng)景和駕駛員行為的判斷。特斯拉一位名叫g(shù)reentheonly的黑客可視化地展現(xiàn)了在特斯拉上運(yùn)行的神經(jīng)網(wǎng)絡(luò)所做出的這種感知判斷:
首先,表示“駕駛場(chǎng)景”的可視化信息包括車(chē)輛周?chē)?D形式邊界、表示車(chē)輛類(lèi)型和距離的文本標(biāo)簽以及顯示可行車(chē)道的“綠色地毯”。
要進(jìn)行模仿學(xué)習(xí),需要將人類(lèi)駕駛員對(duì)方向盤(pán)和踏板的動(dòng)作數(shù)據(jù)和可視化的“駕駛場(chǎng)景”信息進(jìn)行配對(duì)。這些狀態(tài)-動(dòng)作配對(duì)不需要人類(lèi)的注釋?zhuān)祟?lèi)進(jìn)行標(biāo)記實(shí)在是過(guò)于昂貴而且緩慢的學(xué)習(xí)過(guò)程。他們只需要上傳到特斯拉的服務(wù)器,然后就可以用來(lái)訓(xùn)練神經(jīng)網(wǎng)絡(luò)了。
除了Waymo對(duì)模仿學(xué)習(xí)技術(shù)的背書(shū)和特斯拉含混其詞的表述,我們還有什么理由相信模仿學(xué)習(xí)可以訓(xùn)練神經(jīng)網(wǎng)絡(luò)來(lái)執(zhí)行復(fù)雜的任務(wù)呢?對(duì)于我來(lái)說(shuō),成功實(shí)施了模仿學(xué)習(xí)的最典型案例是AlphaStar,這是由Alphabet的子公司DeepMind創(chuàng)建的一個(gè)神經(jīng)網(wǎng)絡(luò)。DeepMind使用模仿學(xué)習(xí)來(lái)訓(xùn)練AlphaStar玩一個(gè)有數(shù)百萬(wàn)人類(lèi)玩家的星際爭(zhēng)霸游戲。星際爭(zhēng)霸是一款相當(dāng)復(fù)雜的游戲,里面設(shè)計(jì)長(zhǎng)遠(yuǎn)規(guī)劃、高級(jí)戰(zhàn)略部署和對(duì)軍事單位的實(shí)施戰(zhàn)術(shù)控制,這樣一個(gè)燒腦的游戲?qū)τ贏(yíng)I來(lái)說(shuō)是一個(gè)相當(dāng)艱難的挑戰(zhàn)。但是,AlphaStar僅使用了模仿學(xué)習(xí)技術(shù),就通過(guò)在星際爭(zhēng)霸這個(gè)游戲的排名證明了相當(dāng)于人類(lèi)玩家的實(shí)力,達(dá)到了DeepMind估計(jì)的性能指標(biāo)。換句話(huà)說(shuō),AlphaStar使用模仿學(xué)習(xí)技術(shù),在星際爭(zhēng)霸中達(dá)到了中等人類(lèi)技能水準(zhǔn)。
和DeepMind使用模仿學(xué)習(xí)訓(xùn)練其神經(jīng)網(wǎng)絡(luò)玩星際爭(zhēng)霸游戲一樣,在自主駕駛的訓(xùn)練中,特斯拉利用其車(chē)輛自主駕駛系統(tǒng)上傳的數(shù)百萬(wàn)駕駛場(chǎng)景-駕駛行為配對(duì)數(shù)據(jù)訓(xùn)練神經(jīng)網(wǎng)絡(luò),就可以達(dá)到中等水平人類(lèi)駕駛員的水準(zhǔn)。駕駛行為當(dāng)然很復(fù)雜,但是星際爭(zhēng)霸游戲也很復(fù)雜。所以我不認(rèn)為使用模仿學(xué)習(xí)達(dá)到的自主駕駛效果達(dá)不到AlphaStar玩星際爭(zhēng)霸的程度。
要想使模仿學(xué)習(xí)奏效,一個(gè)非常重要的條件就是感知必須正確。如果特斯拉的感知神經(jīng)網(wǎng)絡(luò)出了錯(cuò),系統(tǒng)將無(wú)法識(shí)別駕駛環(huán)境的真實(shí)狀態(tài),也就無(wú)法獲得正確的駕駛場(chǎng)景-駕駛行為配對(duì)。舉個(gè)例子,如果感知神經(jīng)網(wǎng)絡(luò)將紅色交通信號(hào)燈錯(cuò)認(rèn)成了綠色,它觀(guān)察人類(lèi)停在了這樣一個(gè)信號(hào)燈前面,它就會(huì)得出一個(gè)汽車(chē)應(yīng)該停在綠色交通燈處的錯(cuò)誤結(jié)論。即使它學(xué)會(huì)了如何對(duì)一個(gè)環(huán)境進(jìn)行正確反應(yīng),它也需要檢測(cè)出這些環(huán)境。因此,如果它知道紅燈停綠燈行,它還必須準(zhǔn)確地識(shí)別出信號(hào)燈的顏色才能做出正確的響應(yīng)。系統(tǒng)需要準(zhǔn)確地感知環(huán)境以便學(xué)習(xí)要做什么動(dòng)作,而且必須準(zhǔn)確地感知環(huán)境才能應(yīng)用學(xué)習(xí)成果做出這些動(dòng)作。
特斯拉新的神經(jīng)網(wǎng)絡(luò)計(jì)算機(jī)可以解決環(huán)境感知問(wèn)題,被稱(chēng)為Hardware 3。特斯拉人工智能主管Andrej Karpathy說(shuō),特斯拉已經(jīng)“訓(xùn)練了效果很好的大型神經(jīng)網(wǎng)絡(luò)”,但是“由于計(jì)算性能的約束無(wú)法把它們部署到汽車(chē)中”。現(xiàn)在有了Hardware 3,特斯拉將能夠運(yùn)行規(guī)模更大、更為準(zhǔn)確的感知神經(jīng)網(wǎng)絡(luò)。
對(duì)于Waymo這樣無(wú)法獲得大量行駛車(chē)輛數(shù)據(jù)的公司而言,很難在模擬學(xué)習(xí)上找到可以走下去的路來(lái)。由于沒(méi)有足夠的訓(xùn)練樣例來(lái)完成整個(gè)駕駛?cè)蝿?wù)的模仿學(xué)習(xí),它不得不依賴(lài)手工編碼算法。在計(jì)算機(jī)視覺(jué)應(yīng)用中,手工編碼算法這種方式早已被神經(jīng)網(wǎng)絡(luò)完全淘汰,機(jī)器翻譯應(yīng)用也是如此。對(duì)于像星際爭(zhēng)霸這樣復(fù)雜級(jí)別的游戲而言,手工編碼的機(jī)器人不可能接近AlphaStar這樣的神經(jīng)網(wǎng)絡(luò)的性能。在自主駕駛上,神經(jīng)網(wǎng)絡(luò)方法似乎也比手工編碼算法更有前途。
想推進(jìn)模仿學(xué)習(xí),Waymo必須將其訓(xùn)練車(chē)隊(duì)的數(shù)量擴(kuò)大好幾個(gè)數(shù)量級(jí)。一個(gè)可行的方法是,Waymo可以向汽車(chē)制造商出售高級(jí)駕駛輔助系統(tǒng),并通過(guò)它來(lái)收集數(shù)據(jù),就像特斯拉現(xiàn)在的做法一樣。這就要求Waymo打造一個(gè)比自主駕駛的功能涵蓋范圍更小的精簡(jiǎn)型新產(chǎn)品。這個(gè)新系統(tǒng)必須在沒(méi)有激光雷達(dá)的情況下能夠使用,或者至少不需要那種通常用于自主駕駛汽車(chē)的高范圍、高分辨率的激光雷達(dá)。因?yàn)檫@種激光雷達(dá)成本過(guò)高,不可能普及到消費(fèi)級(jí)的車(chē)輛中。如果這種方式意味著Waymo可以獲取到所有的駕駛數(shù)據(jù)的話(huà),汽車(chē)制造商可能不大愿意這么做。所以,Waymo可能需要以某種方式和汽車(chē)制造商分享成果,也許它可以同意汽車(chē)制造商合作伙伴分享未來(lái)的自主駕駛服務(wù)的收入,或者允許合作伙伴購(gòu)買(mǎi)它的大量股權(quán)。
對(duì)于福特和通用這樣的巨頭來(lái)說(shuō),他們傾向于垂直整合,不大可能建立這種合作關(guān)系。我可以花10億美元小錢(qián)購(gòu)買(mǎi)自己的“Waymo”,干嘛和谷歌的Waymo合作呢?從經(jīng)濟(jì)學(xué)原理上來(lái)說(shuō),可以購(gòu)買(mǎi)自主駕駛初創(chuàng)公司,這會(huì)讓W(xué)aymo處于艱難的談判地位。而且,這些汽車(chē)制造商似乎并沒(méi)有他們的汽車(chē)收集訓(xùn)練數(shù)據(jù)。
兩相比較下來(lái),特斯拉完全占了上風(fēng)。出于這個(gè)原因,我認(rèn)為特斯拉更有可能分走現(xiàn)在市場(chǎng)上分配給Waymo的1000多億美元估值。也許完全自主駕駛永遠(yuǎn)不可能實(shí)現(xiàn),那就不用說(shuō)了。但是如果真的實(shí)現(xiàn)了,這個(gè)市場(chǎng)可能價(jià)值三萬(wàn)億美金。據(jù)我所知,在這個(gè)賽道上,特斯拉比Waymo以及所有其他公司都處于更有利的位置上,特斯拉可以憑借在模仿學(xué)習(xí)上的優(yōu)勢(shì)分走很大很大一塊蛋糕。

發(fā)表評(píng)論
登錄
手機(jī)
驗(yàn)證碼
立即登錄即可訪(fǎng)問(wèn)所有OFweek服務(wù)
還不是會(huì)員?免費(fèi)注冊(cè)
忘記密碼請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
-
機(jī)器人奧運(yùn)會(huì)戰(zhàn)報(bào):宇樹(shù)機(jī)器人摘下首金,天工Ultra搶走首位“百米飛人”
-
存儲(chǔ)圈掐架!江波龍起訴佰維,索賠121萬(wàn)
-
長(zhǎng)安汽車(chē)母公司突然更名:從“中國(guó)長(zhǎng)安”到“辰致科技”
-
豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
-
字節(jié)AI Lab負(fù)責(zé)人李航卸任后返聘,Seed進(jìn)入調(diào)整期
-
員工持股爆雷?廣汽埃安緊急回應(yīng)
-
中國(guó)“智造”背后的「關(guān)鍵力量」
-
小米汽車(chē)研發(fā)中心重磅落地,寶馬家門(mén)口“搶人”
最新活動(dòng)更多
-
10月23日火熱報(bào)名中>> 2025是德科技創(chuàng)新技術(shù)峰會(huì)
-
10月23日立即報(bào)名>> Works With 開(kāi)發(fā)者大會(huì)深圳站
-
10月24日立即參評(píng)>> 【評(píng)選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評(píng)選
-
11月27日立即報(bào)名>> 【工程師系列】汽車(chē)電子技術(shù)在線(xiàn)大會(huì)
-
12月18日立即報(bào)名>> 【線(xiàn)下會(huì)議】OFweek 2025(第十屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
精彩回顧立即查看>> 【限時(shí)福利】TE 2025國(guó)際物聯(lián)網(wǎng)展·深圳站
推薦專(zhuān)題
- 1 人形機(jī)器人,正狂奔在批量交付的曠野
- 2 3 AI版“四萬(wàn)億刺激”計(jì)劃來(lái)了
- 4 2025年8月人工智能投融資觀(guān)察
- 5 一家被嚴(yán)重低估的國(guó)產(chǎn)AI巨頭
- 6 a16z最新AI百?gòu)?qiáng)榜:硅谷頂級(jí)VC帶你讀懂全球生成式AI賽道最新趨勢(shì)
- 7 Manus跑路,大廠(chǎng)掉線(xiàn),只能靠DeepSeek了
- 8 地平線(xiàn)的野心:1000萬(wàn)套HSD上車(chē)
- 9 一萬(wàn)億美元!馬斯克薪酬細(xì)節(jié)拆解
- 10 蘋(píng)果把身家押在Siri上:一場(chǎng)輸不起的自我革命