訂閱
糾錯
加入自媒體

埃隆·馬斯克為何繼續(xù)豪賭純視覺?

2021-04-13 15:22
智車科技IV
關注

本文來源:智車科技

/ 導讀 /

大多數人都認為,特斯拉的傳感器融合是做得最好的,盡管它對激光雷達不屑一顧。可是,4月9日,特斯拉首席執(zhí)行官埃隆·馬斯克(Elon Musk)在社交媒體上透露,最近對其自動駕駛Autopilot和全自動駕駛套件FSD Beta V9.0的升級已漸進尾聲。特斯拉希望最終將使其系統(tǒng)稱為完全基于攝像頭——純視覺方法的系統(tǒng)。這意味著,未來特斯拉的全電動汽車將在不使用雷達等部件的情況下自行導航并執(zhí)行駕駛員輔助功能。

特斯拉的FSD Beta V9.0一直備受市場關注,本來預計是在2020年年底上市,不過,到目前為止該系統(tǒng)仍處于測試階段。馬斯克理由是,推遲FSD的發(fā)布是為了完善其系統(tǒng),以便給用戶充分的使用信心。

純粹的視覺,沒有雷達

馬斯克對特斯拉車主和FSD Beta用戶@WholeMarsBlog一篇帖子的回應表達了上述觀點,后者分享了他的Model 3從停車場駛向目的地的片段,其間沒有司機的介入。馬斯克在回應中透露,被電動車界寄予厚望的FSD Beta V9.0已經基本就緒。

FSD Beta V9.0即將推出。步進變化的改善是巨大的,特別是對怪異的極端情況和惡劣的天氣。純粹的視覺,沒有雷達。

——埃隆·馬斯克(@elonmusk)2021年4月9日

馬斯克進一步解釋說,V9.0的更新將提高FSD測試版在極端情況下和惡劣天氣條件下的適應性,同時改善了車輛的轉彎能力。他承認,這些仍然是今天先進的駕駛輔助系統(tǒng)的挑戰(zhàn)。但這并不是全部,因為馬斯克指出,更新將是“純視覺的,沒有雷達!闭劦竭M一步的發(fā)展,馬斯克承認,特斯拉最終計劃在其未來的車輛中完全擺脫雷達。這可不是猜測,馬斯克親口證實特斯拉連毫米波雷達都不用!

不出所料,馬斯克有關特斯拉即將摒棄雷達的言論也招致了相當一部分人士的抨擊,其中許多人認為,純視覺方法是一種倒退。這一點尤其值得注意,因為與通用汽車自動駕駛汽車部門Cruise和韋莫(Waymo),還有蔚來、小鵬等競爭對手相比,特斯拉在駕駛輔助系統(tǒng)上使用的傳感器已經很少了,這兩家公司都依賴一些激光雷達和高清地圖進行導航。

馬斯克回應了這些擔憂,他強調,最終視覺有可能遠遠優(yōu)于雷達。他曾表示:“當雷達和視覺不一致時,你相信哪一個?視覺具有更高的精度,所以在視覺上加倍比傳感器融合更好!

傳感器是一種比特流,而攝像頭的比特/秒比雷達(或激光雷達)多幾個數量級。

雷達必須有目的地增加比特流的信噪比,使其遇到了集成的復雜性。

隨著視覺處理的能力越來越好,它正在將雷達遠遠地甩在身后。

——埃隆·馬斯克(@elonmusk)2021年4月10日

視覺“很有可能”有用

特斯拉實現全自動駕駛的方法部分基于這樣一種理念,即人類100%的駕駛都是通過視覺完成的,沒有使用任何雷達或激光雷達。自2019年的特斯拉Autonomy Day以來,特斯拉的高管們就強調了這一點,當時該公司推出了定制的FSD電腦。至于攝像頭能否提供與雷達相同的安全級別來檢測前方幾輛車的情況,馬斯克指出,視覺很有可能也能發(fā)揮同樣的作用。

最好把這些看作是概率。有5個前向攝像頭。其中至少有一個極有可能看到前方有多輛車。

——埃隆·馬斯克(@elonmusk)2021年4月10日

“這些事情最好被認為是概率。有5個前向攝像頭。他們中至少有一個很有可能看到前方有多輛車,”馬斯克說。

特斯拉并非唯一

事實上,特斯拉并不是市場上唯一一家尋求視覺唯一方法的公司。2020年5月,英特爾公司發(fā)布了一段視頻,顯示MobileEye的一輛自動駕駛汽車在耶路撒冷道路上行駛了大約20分鐘。與其他自動駕駛車輛不同,MobileEye的車只配備了一套攝像頭,其他什么都沒有。這段簡短的視頻給人留下了深刻的印象,顯示了MobileEye自動駕駛汽車在沒有紅綠燈的情況下通過了四個路口,而這需要車輛在市內車道上避開行人和其他車輛。

MobileEye的車只配備一套攝像頭

自動駕駛安全靠什么保障?

上述有一些“可能”、“概率”的說法,對于駕駛安全能不能這么賭,這么玩兒?是要畫一個問號的。純視覺方法是不是一種倒退可能是“公說公有理,婆說婆有理”,但算力的問題,冗余的問題還要不要考慮?即使人類100%的駕駛都是通過視覺完成的,沒有使用任何雷達或激光雷達,并不代表不應該用機器代替人類或人類所不及的能力。

智能駕駛專家郭繼舜博士就在評論MobileEye純視覺方案時表示:“攝像頭視覺方案雖然能夠通過車規(guī),但是對視覺算法的要求更高,開發(fā)難度很大,失效可能性較高。所以,一個考慮可前裝量產的好的L4自動駕駛技術感知方案,最好是考慮使用車規(guī)級的多傳感器融合的感知套件(固態(tài)或混合固態(tài)激光雷達+視覺+毫米波等)!

他認為,在多傳感器融合的感知套件的支持下,L4自動駕駛需要具備更加智能的感知認知能力。而現在的感知算法實際上更多是實現“目標識別”的感知智能,也就是只能夠獲得感知場景中的物體的類別、方位、速度、大小等等淺層認知屬性。

而對于目標所關聯的更加抽象的語義信息,多個目標互相作用可能造成的場景事件信息,都只能做到有限的認知,如紅綠燈、交通標志、學校標記等,更加深層抽象的事件意義的認知就無能為力了,比如交警的手勢、小學生過馬路等等。這些需要更多的社會常識與交通規(guī)則數據庫的支持,才能夠實現真正的“認知智能”。

既然是純視覺,為什么不用雙目?

現在,一些豪華車都搭載了雙目攝像頭,而作為一些人心目中“豪車”的特斯拉并未量產搭載。單目攝像頭要獲得距離信息,必須先識別目標;而雙目攝像頭不僅能精確測量距離,還可以識別剎車燈、車道線、路旁交通標志等。不過,雙目攝像頭是對每一個像素點進行立體匹配,需要超大運算量。特斯拉有自研芯片,在算力方面應該不輸他人。

保隆科技視覺產品總監(jiān)孫路認為:“單目自身存在的問題在于,窮舉法不可能完全覆蓋所有場景,仍然會出現一些操控失誤風險;而雙目具有一定技術門檻,不易實現高性能指標,行業(yè)還沒有專用芯片,目前普遍采用FPGA,工藝難度高。此外,結構精度要求高,耐久性、一致性、溫度適應性要求也高。需要自動校準(AA)算法、靜態(tài)標定算法保存內參等,投入很大!

毫米波雷達和激光雷達的擁躉認為,目前主流攝像頭只能提供2D圖像信息,缺少深度。使用攝像頭作主傳感器的主要難點就在于深度恢復。而自動駕駛的路徑規(guī)劃需要有3D道路信息和3D障礙物信息。如果攝像頭想成為主傳感器,就必須能夠提供準確的深度感知。

從特斯拉公開的資料看,其深度恢復做的相當好,為感知、定位和規(guī)劃提供了堅實的基礎。不過,這樣做必須讓系統(tǒng)訓練有素,雖然它有海量數據可以用來訓練深度模型,但實際上仍無法保證能正確處理所有場景,也就是馬斯克說的“怪異的極端情況”。所以,一旦出現深度預測失準,出現訓練的“漏網之魚”(比如顏色識別),就會錯誤估計道路環(huán)境和障礙物位置,可能車毀人亡。

只能等待

我們是不是應該期待,不用激光雷達,甚至也將不用其他雷達的特斯拉,這回是不是會搭載雙目(不要期盼三目,三目成本高)攝像頭呢?也讓駕駛者獲得額外的安全保障,寬慰一下投資者的心?

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號