相較于特斯拉的自動駕駛技術,Waymo在訓練數據上處于明顯劣勢?
模仿學習可能成為自動駕駛的關鍵;
大規(guī)模的訓練數據是進行模仿學習的關鍵;
特斯拉擁有大量的訓練數據;
Waymo沒有多少訓練數據。
如果可以實現的話,自動駕駛將成為我們這個瑰麗的時代最大的商機之一。單在美國,所有汽車每年的駕駛里程就達到了3.22萬億英里。如果這些里程都是通過自動駕駛駛跑出來,而且自動駕駛服務供應商每英里可以得到10美分的利潤,那么,自動駕駛服務提供商每年在美國市場就能獲得3220億美元的利潤。正是基于這種邏輯,谷歌旗下的自動駕駛公司Waymo的估值高達2500億美金。
對于我來說,近期關于自動駕駛的一個最為吸引人的消息就是Waymo正在其自動駕駛中使用模仿學習技術。模仿學習是機器學習技術中的一種,它的神經網絡觀察人類所做的事情,學習在某些環(huán)境狀態(tài)下執(zhí)行的動作。通過訓練人類行為,神經網絡學習到“如果你遇到這種環(huán)境狀態(tài),就模仿人類那樣去執(zhí)行動作吧”。比如,“如果你看到前面有一個停車標志,請停下車。”或者,“如果你看到一輛停止狀態(tài)的汽車擋了你的路,就這樣慢慢繞開它!
Waymo的研究團隊負責人Drago Anguelov最近在麻省理工學院發(fā)表了一次演講,深入探討了這個話題。
Waymo在可以收集大量數據時使用模仿學習。但是對于Anguelov來說,Waymo的數據集中并沒有足夠的訓練樣例來進行模仿學習。在數據不足的情況下,它必須依賴手工編碼算法,而無法使用機器學習來替代。
根據推斷,Waymo應該已經自動駕駛跑了大約1500萬英里。假設每3000萬英里出現一次需要人類接管自動駕駛系統(tǒng)的情況,自動駕駛系統(tǒng)可以借此模仿的人類行為,那么,按照Waymo現在的行駛里程,它可能還沒有遇到過模仿學習的樣例。即便是每100萬英里有一次人類接管行為可供模仿,它也不過只有15個樣例。我不知道對模仿學習來說,多少個樣例才能訓練出判斷為“真”,但是對于那些進行圖像分類的神經網絡來說,一般經驗是需要至少一千個樣例才能識別出來一種圖像(比如大白鯊)。顯然,Waymo不可能遭遇過這么多次可供模仿學習的樣例。
雖然Anguelov很愿意在人類的駕駛行為中進行模仿學習,但是它并沒有足夠的數據樣例。那么,誰有這些數據呢?
特斯拉有這些數據。據估計,搭載了特斯拉最新一代自動駕駛硬件的汽車數量已經超過了40萬輛,所有這些車每天的行駛里程超過1300萬英里。如果汽車數量增長到100多萬輛時,每月的行駛里程將達到10億英里。顯然,車輛越多,里程數也越多,可供模仿學習的人類行為樣例也就越多。
The Information的記者Amir Efrati寫道,特斯拉正在利用這些里程中出現的人類行為進行模仿學習,他引用了至少一位在特斯拉自動駕駛部門工作的未具名消息人士的說法:
“知情人士表示,特斯拉的汽車手機了大量的攝像頭數據和來自其它各類傳感器的數據,當特斯拉車主開車時,即使他們沒有啟用車輛的自動駕駛系統(tǒng),自動駕駛研究團隊也可以檢查人類在各種駕駛場景中的行為并模仿它。特斯拉的工程師認為,將足夠多的人類駕駛行為數據輸入到神經網絡中,神經網絡便可以學習如何在大多數情況下進行正確轉向、加速或者制動。一位團隊成員表示,特斯拉車主的日常駕駛會產生足夠多的數據,“你不需要其它任何東西”來教系統(tǒng)如何自動駕駛!
特斯拉官方還沒有證實這種說法,但是其首席執(zhí)行官埃隆馬斯克最近在ARK Invest的一次采訪中發(fā)表了一些評論,可能就是針對模仿學習的表態(tài),在采訪中有一句話值得注意:
“我認為我們特斯拉有一個別人很難超越的優(yōu)勢,那就是我們擁有大量的人工干預駕駛行為數據?梢赃@樣認為,車主自己正在訓練自動駕駛系統(tǒng)如何駕駛汽車。駕駛中有大量的模糊和奇怪的場景,你肯定都想不到......”

請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 北電數智主辦酒仙橋論壇,探索AI產業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關稅,能否乘機器人東風翻身?