訂閱
糾錯(cuò)
加入自媒體

埃隆·馬斯克為何繼續(xù)豪賭純視覺(jué)?

本文來(lái)源:智車科技

/ 導(dǎo)讀 /

大多數(shù)人都認(rèn)為,特斯拉的傳感器融合是做得最好的,盡管它對(duì)激光雷達(dá)不屑一顧?墒牵4月9日,特斯拉首席執(zhí)行官埃隆·馬斯克(Elon Musk)在社交媒體上透露,最近對(duì)其自動(dòng)駕駛Autopilot和全自動(dòng)駕駛套件FSD Beta V9.0的升級(jí)已漸進(jìn)尾聲。特斯拉希望最終將使其系統(tǒng)稱為完全基于攝像頭——純視覺(jué)方法的系統(tǒng)。這意味著,未來(lái)特斯拉的全電動(dòng)汽車將在不使用雷達(dá)等部件的情況下自行導(dǎo)航并執(zhí)行駕駛員輔助功能。

特斯拉的FSD Beta V9.0一直備受市場(chǎng)關(guān)注,本來(lái)預(yù)計(jì)是在2020年年底上市,不過(guò),到目前為止該系統(tǒng)仍處于測(cè)試階段。馬斯克理由是,推遲FSD的發(fā)布是為了完善其系統(tǒng),以便給用戶充分的使用信心。

純粹的視覺(jué),沒(méi)有雷達(dá)

馬斯克對(duì)特斯拉車主和FSD Beta用戶@WholeMarsBlog一篇帖子的回應(yīng)表達(dá)了上述觀點(diǎn),后者分享了他的Model 3從停車場(chǎng)駛向目的地的片段,其間沒(méi)有司機(jī)的介入。馬斯克在回應(yīng)中透露,被電動(dòng)車界寄予厚望的FSD Beta V9.0已經(jīng)基本就緒。

FSD Beta V9.0即將推出。步進(jìn)變化的改善是巨大的,特別是對(duì)怪異的極端情況和惡劣的天氣。純粹的視覺(jué),沒(méi)有雷達(dá)。

——埃隆·馬斯克(@elonmusk)2021年4月9日

馬斯克進(jìn)一步解釋說(shuō),V9.0的更新將提高FSD測(cè)試版在極端情況下和惡劣天氣條件下的適應(yīng)性,同時(shí)改善了車輛的轉(zhuǎn)彎能力。他承認(rèn),這些仍然是今天先進(jìn)的駕駛輔助系統(tǒng)的挑戰(zhàn)。但這并不是全部,因?yàn)轳R斯克指出,更新將是“純視覺(jué)的,沒(méi)有雷達(dá)!闭劦竭M(jìn)一步的發(fā)展,馬斯克承認(rèn),特斯拉最終計(jì)劃在其未來(lái)的車輛中完全擺脫雷達(dá)。這可不是猜測(cè),馬斯克親口證實(shí)特斯拉連毫米波雷達(dá)都不用!

不出所料,馬斯克有關(guān)特斯拉即將摒棄雷達(dá)的言論也招致了相當(dāng)一部分人士的抨擊,其中許多人認(rèn)為,純視覺(jué)方法是一種倒退。這一點(diǎn)尤其值得注意,因?yàn)榕c通用汽車自動(dòng)駕駛汽車部門Cruise和韋莫(Waymo),還有蔚來(lái)、小鵬等競(jìng)爭(zhēng)對(duì)手相比,特斯拉在駕駛輔助系統(tǒng)上使用的傳感器已經(jīng)很少了,這兩家公司都依賴一些激光雷達(dá)和高清地圖進(jìn)行導(dǎo)航。

馬斯克回應(yīng)了這些擔(dān)憂,他強(qiáng)調(diào),最終視覺(jué)有可能遠(yuǎn)遠(yuǎn)優(yōu)于雷達(dá)。他曾表示:“當(dāng)雷達(dá)和視覺(jué)不一致時(shí),你相信哪一個(gè)?視覺(jué)具有更高的精度,所以在視覺(jué)上加倍比傳感器融合更好!

傳感器是一種比特流,而攝像頭的比特/秒比雷達(dá)(或激光雷達(dá))多幾個(gè)數(shù)量級(jí)。

雷達(dá)必須有目的地增加比特流的信噪比,使其遇到了集成的復(fù)雜性。

隨著視覺(jué)處理的能力越來(lái)越好,它正在將雷達(dá)遠(yuǎn)遠(yuǎn)地甩在身后。

——埃隆·馬斯克(@elonmusk)2021年4月10日

視覺(jué)“很有可能”有用

特斯拉實(shí)現(xiàn)全自動(dòng)駕駛的方法部分基于這樣一種理念,即人類100%的駕駛都是通過(guò)視覺(jué)完成的,沒(méi)有使用任何雷達(dá)或激光雷達(dá)。自2019年的特斯拉Autonomy Day以來(lái),特斯拉的高管們就強(qiáng)調(diào)了這一點(diǎn),當(dāng)時(shí)該公司推出了定制的FSD電腦。至于攝像頭能否提供與雷達(dá)相同的安全級(jí)別來(lái)檢測(cè)前方幾輛車的情況,馬斯克指出,視覺(jué)很有可能也能發(fā)揮同樣的作用。

最好把這些看作是概率。有5個(gè)前向攝像頭。其中至少有一個(gè)極有可能看到前方有多輛車。

——埃隆·馬斯克(@elonmusk)2021年4月10日

“這些事情最好被認(rèn)為是概率。有5個(gè)前向攝像頭。他們中至少有一個(gè)很有可能看到前方有多輛車,”馬斯克說(shuō)。

特斯拉并非唯一

事實(shí)上,特斯拉并不是市場(chǎng)上唯一一家尋求視覺(jué)唯一方法的公司。2020年5月,英特爾公司發(fā)布了一段視頻,顯示MobileEye的一輛自動(dòng)駕駛汽車在耶路撒冷道路上行駛了大約20分鐘。與其他自動(dòng)駕駛車輛不同,MobileEye的車只配備了一套攝像頭,其他什么都沒(méi)有。這段簡(jiǎn)短的視頻給人留下了深刻的印象,顯示了MobileEye自動(dòng)駕駛汽車在沒(méi)有紅綠燈的情況下通過(guò)了四個(gè)路口,而這需要車輛在市內(nèi)車道上避開行人和其他車輛。

MobileEye的車只配備一套攝像頭

自動(dòng)駕駛安全靠什么保障?

上述有一些“可能”、“概率”的說(shuō)法,對(duì)于駕駛安全能不能這么賭,這么玩兒?是要畫一個(gè)問(wèn)號(hào)的。純視覺(jué)方法是不是一種倒退可能是“公說(shuō)公有理,婆說(shuō)婆有理”,但算力的問(wèn)題,冗余的問(wèn)題還要不要考慮?即使人類100%的駕駛都是通過(guò)視覺(jué)完成的,沒(méi)有使用任何雷達(dá)或激光雷達(dá),并不代表不應(yīng)該用機(jī)器代替人類或人類所不及的能力。

智能駕駛專家郭繼舜博士就在評(píng)論MobileEye純視覺(jué)方案時(shí)表示:“攝像頭視覺(jué)方案雖然能夠通過(guò)車規(guī),但是對(duì)視覺(jué)算法的要求更高,開發(fā)難度很大,失效可能性較高。所以,一個(gè)考慮可前裝量產(chǎn)的好的L4自動(dòng)駕駛技術(shù)感知方案,最好是考慮使用車規(guī)級(jí)的多傳感器融合的感知套件(固態(tài)或混合固態(tài)激光雷達(dá)+視覺(jué)+毫米波等)。”

他認(rèn)為,在多傳感器融合的感知套件的支持下,L4自動(dòng)駕駛需要具備更加智能的感知認(rèn)知能力。而現(xiàn)在的感知算法實(shí)際上更多是實(shí)現(xiàn)“目標(biāo)識(shí)別”的感知智能,也就是只能夠獲得感知場(chǎng)景中的物體的類別、方位、速度、大小等等淺層認(rèn)知屬性。

而對(duì)于目標(biāo)所關(guān)聯(lián)的更加抽象的語(yǔ)義信息,多個(gè)目標(biāo)互相作用可能造成的場(chǎng)景事件信息,都只能做到有限的認(rèn)知,如紅綠燈、交通標(biāo)志、學(xué)校標(biāo)記等,更加深層抽象的事件意義的認(rèn)知就無(wú)能為力了,比如交警的手勢(shì)、小學(xué)生過(guò)馬路等等。這些需要更多的社會(huì)常識(shí)與交通規(guī)則數(shù)據(jù)庫(kù)的支持,才能夠?qū)崿F(xiàn)真正的“認(rèn)知智能”。

既然是純視覺(jué),為什么不用雙目?

現(xiàn)在,一些豪華車都搭載了雙目攝像頭,而作為一些人心目中“豪車”的特斯拉并未量產(chǎn)搭載。單目攝像頭要獲得距離信息,必須先識(shí)別目標(biāo);而雙目攝像頭不僅能精確測(cè)量距離,還可以識(shí)別剎車燈、車道線、路旁交通標(biāo)志等。不過(guò),雙目攝像頭是對(duì)每一個(gè)像素點(diǎn)進(jìn)行立體匹配,需要超大運(yùn)算量。特斯拉有自研芯片,在算力方面應(yīng)該不輸他人。

保隆科技視覺(jué)產(chǎn)品總監(jiān)孫路認(rèn)為:“單目自身存在的問(wèn)題在于,窮舉法不可能完全覆蓋所有場(chǎng)景,仍然會(huì)出現(xiàn)一些操控失誤風(fēng)險(xiǎn);而雙目具有一定技術(shù)門檻,不易實(shí)現(xiàn)高性能指標(biāo),行業(yè)還沒(méi)有專用芯片,目前普遍采用FPGA,工藝難度高。此外,結(jié)構(gòu)精度要求高,耐久性、一致性、溫度適應(yīng)性要求也高。需要自動(dòng)校準(zhǔn)(AA)算法、靜態(tài)標(biāo)定算法保存內(nèi)參等,投入很大!

毫米波雷達(dá)和激光雷達(dá)的擁躉認(rèn)為,目前主流攝像頭只能提供2D圖像信息,缺少深度。使用攝像頭作主傳感器的主要難點(diǎn)就在于深度恢復(fù)。而自動(dòng)駕駛的路徑規(guī)劃需要有3D道路信息和3D障礙物信息。如果攝像頭想成為主傳感器,就必須能夠提供準(zhǔn)確的深度感知。

從特斯拉公開的資料看,其深度恢復(fù)做的相當(dāng)好,為感知、定位和規(guī)劃提供了堅(jiān)實(shí)的基礎(chǔ)。不過(guò),這樣做必須讓系統(tǒng)訓(xùn)練有素,雖然它有海量數(shù)據(jù)可以用來(lái)訓(xùn)練深度模型,但實(shí)際上仍無(wú)法保證能正確處理所有場(chǎng)景,也就是馬斯克說(shuō)的“怪異的極端情況”。所以,一旦出現(xiàn)深度預(yù)測(cè)失準(zhǔn),出現(xiàn)訓(xùn)練的“漏網(wǎng)之魚”(比如顏色識(shí)別),就會(huì)錯(cuò)誤估計(jì)道路環(huán)境和障礙物位置,可能車毀人亡。

只能等待

我們是不是應(yīng)該期待,不用激光雷達(dá),甚至也將不用其他雷達(dá)的特斯拉,這回是不是會(huì)搭載雙目(不要期盼三目,三目成本高)攝像頭呢?也讓駕駛者獲得額外的安全保障,寬慰一下投資者的心?

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)