侵權(quán)投訴
訂閱
糾錯(cuò)
加入自媒體

自動(dòng)駕駛中純視覺(jué)替代不了激光雷達(dá)?

隨著自動(dòng)駕駛技術(shù)的不斷發(fā)展,純視覺(jué)和激光雷達(dá)(LiDAR)兩種主流環(huán)境感知成為了大家的熱議話題;跀z像頭的“純視覺(jué)”方案在成本、分辨率和語(yǔ)義理解方面取得顯著優(yōu)勢(shì),不少人設(shè)想“移除LiDAR,只用攝像頭+AI”也能實(shí)現(xiàn)可靠感知。但現(xiàn)實(shí)遠(yuǎn)比想象復(fù)雜,為什么純視覺(jué)難以完全替代LiDAR?

首先要知道,攝像頭與LiDAR的工作原理截然不同。攝像頭通過(guò)光學(xué)透鏡和圖像傳感器獲取二維彩色圖像,記錄場(chǎng)景的顏色、紋理和光照等信息。LiDAR則發(fā)射激光脈沖,測(cè)量光脈沖從發(fā)射到接收的飛行時(shí)間(Time-of-Flight),直接計(jì)算出與物體間的距離,生成高精度、三維結(jié)構(gòu)的點(diǎn)云。二者獲取的信息維度和性質(zhì)也不同,攝像頭擅長(zhǎng)提取紋理與語(yǔ)義,但不具備直接的物理深度測(cè)量能力;LiDAR以毫米至厘米級(jí)精度測(cè)距,但缺乏顏色與細(xì)節(jié)紋理信息。

想要實(shí)現(xiàn)三維空間重建,攝像頭需要借助雙目立體視覺(jué)或深度學(xué)習(xí)算法來(lái)推測(cè)深度。雙目視覺(jué)通過(guò)左右攝像頭之間的視差進(jìn)行三角測(cè)量,短距離內(nèi)準(zhǔn)確度尚可,但隨著目標(biāo)距離加大,視差越來(lái)越小,深度誤差迅速放大。此外,紋理稀少的平面、強(qiáng)光直射或陰影區(qū)域,都會(huì)導(dǎo)致特征匹配失敗,使深度誤差進(jìn)一步增大。而基于單目深度估計(jì)的深度學(xué)習(xí)模型雖然在某些公開(kāi)數(shù)據(jù)集上表現(xiàn)不錯(cuò),但本質(zhì)上依賴(lài)于統(tǒng)計(jì)推斷,一旦訓(xùn)練數(shù)據(jù)與實(shí)際駕駛場(chǎng)景存在分歧,就會(huì)出現(xiàn)誤判;而且單目網(wǎng)絡(luò)只能輸出相對(duì)尺度深度,需要結(jié)合里程計(jì)等其他信息才能還原絕對(duì)距離,這些外部信息自身也會(huì)引入額外誤差。

同時(shí),攝像頭對(duì)光照條件極其敏感。在夜間、隧道口或迎光行駛時(shí),圖像容易出現(xiàn)噪點(diǎn)或過(guò)曝,嚴(yán)重影響目標(biāo)檢測(cè)和跟蹤算法的準(zhǔn)確性。即使加裝紅外補(bǔ)光或高感光度傳感器,也會(huì)增加系統(tǒng)成本和功耗。相比之下,LiDAR幾乎不受外界可見(jiàn)光影響,可以在弱光甚至全黑環(huán)境下正常工作,保證夜間的距離測(cè)量精度。再有,惡劣天氣對(duì)攝像頭的影響也尤為顯著,大霧會(huì)散射可見(jiàn)光,使圖像對(duì)比度驟減,輪廓模糊;大雨時(shí),雨滴附著在鏡頭上會(huì)造成圖像畸變;積雪則可能遮擋車(chē)道線和障礙物。雖然可以用去霧、去雨等圖像恢復(fù)算法在一定程度上緩解問(wèn)題,但要恢復(fù)到無(wú)瑕影響的狀態(tài),在真實(shí)高速行駛環(huán)境下非常困難。LiDAR在雨雪天氣下也會(huì)受到水滴和雪花的影響,但LiDAR可以通過(guò)多脈沖濾波、強(qiáng)度抑制和硬件優(yōu)化,能在一定程度上濾除雜波并保持測(cè)距穩(wěn)定性。

不可否認(rèn),攝像頭具有顏色和紋理優(yōu)勢(shì),可用于像素級(jí)的語(yǔ)義分割、交通標(biāo)志識(shí)別、車(chē)道線檢測(cè)等任務(wù);谏疃葘W(xué)習(xí)的語(yǔ)義分割網(wǎng)絡(luò),能夠準(zhǔn)確區(qū)分行人、車(chē)輛、建筑物等不同類(lèi)別信息,為自動(dòng)駕駛決策提供豐富上下文。而LiDAR僅提供稀疏點(diǎn)云,缺乏顏色信息,需要通過(guò)點(diǎn)云深度學(xué)習(xí)算法進(jìn)行分類(lèi)和分割,不如圖像直觀,但近年來(lái),點(diǎn)云深度學(xué)習(xí)技術(shù)取得了顯著進(jìn)展,使LiDAR在語(yǔ)義分割領(lǐng)域性能不斷提升。

現(xiàn)如今,自動(dòng)駕駛系統(tǒng)往往采用多傳感器融合,將LiDAR與攝像頭數(shù)據(jù)進(jìn)行緊耦合,使二者優(yōu)勢(shì)互補(bǔ)。如將點(diǎn)云投影到圖像平面,用深度學(xué)習(xí)網(wǎng)絡(luò)對(duì)圖像進(jìn)行語(yǔ)義分割后,再與LiDAR點(diǎn)云進(jìn)行配準(zhǔn),可同時(shí)獲得高精度的三維幾何信息與豐富的語(yǔ)義標(biāo)簽。這樣,即便在夜間視線差時(shí),LiDAR也能補(bǔ)充深度信息;在交通標(biāo)志識(shí)別場(chǎng)景中,攝像頭的彩色高分辨率畫(huà)面更易于識(shí)別標(biāo)志細(xì)節(jié)。若僅憑純視覺(jué)進(jìn)行三維測(cè)距與語(yǔ)義理解,一旦遭遇突發(fā)光照變化或遮擋情況,就可能導(dǎo)致感知系統(tǒng)失靈,進(jìn)而危及行車(chē)安全。

為什么大家會(huì)研究純視覺(jué),其實(shí)這是從成本方面在考慮,攝像頭價(jià)格僅為幾百至幾千元人民幣,而高精度的多線束LiDAR動(dòng)輒數(shù)萬(wàn)元甚至十幾萬(wàn)元。很多車(chē)企都試圖通過(guò)純視覺(jué)方案降低傳感器成本,但想要滿足自動(dòng)駕駛系統(tǒng)的安全冗余與法規(guī)合規(guī),就不得不選配更高分辨率、更高靈敏度的工業(yè)級(jí)相機(jī),或者增加紅外輔助設(shè)備,其成本已經(jīng)接近或超過(guò)低端LiDAR。為了提取和推斷深度信息以及運(yùn)行復(fù)雜的圖像算法,還需要更強(qiáng)大的算力平臺(tái),使得算力成本和功耗大幅提升。相比之下,LiDAR輸出的點(diǎn)云數(shù)據(jù)本身就是幾何化的物理量,后端處理鏈路相對(duì)簡(jiǎn)單,對(duì)算力需求更低,綜合來(lái)看,LiDAR或許并非想象中那么難以承受。

在可靠性與冗余設(shè)計(jì)上,LiDAR表現(xiàn)也更勝一籌。知名LiDAR廠商如Velodyne、Innoviz、Ouster等,通過(guò)不斷優(yōu)化硬件與散熱結(jié)構(gòu),使設(shè)備在高溫、低溫、震動(dòng)、雨雪等惡劣環(huán)境下保持穩(wěn)定性能。攝像頭在極端溫度或劇烈顛簸時(shí),鏡頭可能出現(xiàn)對(duì)焦漂移、圖像模糊或傳感器噪聲,影響圖像質(zhì)量與算法輸出。一旦攝像頭失效或性能大幅下降,就需依賴(lài)其他傳感器保證冗余,而最可靠的備份傳感器正是LiDAR。若放棄LiDAR,僅靠攝像頭與毫米波雷達(dá)的組合,在探測(cè)遠(yuǎn)距離小目標(biāo)(如行人、騎行者)時(shí)依舊存在盲區(qū);毫米波雷達(dá)分辨率較低,無(wú)法準(zhǔn)確區(qū)分近距離障礙物的精細(xì)輪廓,更談不上生成高精度三維地圖。

在高精度地圖構(gòu)建與實(shí)時(shí)定位方面,LiDAR也具備顯著優(yōu)勢(shì)。稠密的三維點(diǎn)云可直接用于構(gòu)建高精度地圖,記錄道路兩側(cè)護(hù)欄、路緣、建筑物等靜態(tài)環(huán)境特征,為車(chē)輛定位提供可靠參考。視覺(jué)SLAM(同時(shí)定位與地圖構(gòu)建)技術(shù)不斷進(jìn)步,但在光照變化劇烈、重復(fù)紋理或者弱光場(chǎng)景時(shí),特征點(diǎn)提取與跟蹤易失敗,導(dǎo)致定位漂移。LiDAR SLAM則基于高精度距離測(cè)量,即使在夜間或灰暗環(huán)境下也能穩(wěn)定定位,整體魯棒性更高。要想用純視覺(jué)方案構(gòu)建與LiDAR相媲美的高精度地圖,必須投入海量標(biāo)定、手動(dòng)修正和算法開(kāi)發(fā),成本與復(fù)雜度極大增加。

當(dāng)然,在部分如倉(cāng)庫(kù)自動(dòng)搬運(yùn)、校園巡檢或低速Robotaxi低速、場(chǎng)景可控的應(yīng)用中,純視覺(jué)方案結(jié)合毫米波雷達(dá)或超聲波傳感器,也能實(shí)現(xiàn)較為穩(wěn)健的感知效果且成本較低。但一旦涉及高速公路、高密度城市道路或多變天氣場(chǎng)景,僅靠攝像頭就難以確保足夠的安全。LiDAR提供的高精度、高幀率三維點(diǎn)云,能夠降低測(cè)速測(cè)距誤差,給系統(tǒng)留出更寬裕的反應(yīng)時(shí)間,顯著提高行駛安全性。

隨著技術(shù)發(fā)展,LiDAR正朝著更小型化、低成本、高精度方向快速迭代。固態(tài)LiDAR(Static LiDAR)通過(guò)硅光子或MEMS微鏡實(shí)現(xiàn)無(wú)需機(jī)械旋轉(zhuǎn)的光束掃描,成本與尺寸不斷下降,可靠性日益提高。隨著生產(chǎn)規(guī)模擴(kuò)大,LiDAR價(jià)格有望逐漸逼近平民價(jià)位,使其與攝像頭在成本上的差距進(jìn)一步縮小。而想要讓純視覺(jué)在所有行駛場(chǎng)景下達(dá)到LiDAR級(jí)別的測(cè)距與魯棒性能,需要在算法和硬件層面實(shí)現(xiàn)跨越式突破,短期內(nèi)難以實(shí)現(xiàn)。

從算法角度考慮,深度學(xué)習(xí)可以通過(guò)海量數(shù)據(jù)訓(xùn)練網(wǎng)絡(luò)提取圖像特征,并基于視覺(jué)內(nèi)容進(jìn)行深度推斷,但這始終是一種經(jīng)驗(yàn)性感知,缺乏物理測(cè)量的可解釋性與確定性。一旦遇到如某條陌生道路、特殊建筑物外觀、不同天氣條件下的新型障礙物訓(xùn)練數(shù)據(jù)覆蓋不到的場(chǎng)景,純視覺(jué)系統(tǒng)就可能發(fā)生盲區(qū)或誤判。LiDAR輸出的點(diǎn)云代表真實(shí)的幾何距離,噪聲與誤差可以在濾波階段進(jìn)行定量處理,可解釋性更強(qiáng),能為決策模塊提供更穩(wěn)定的輸入。

對(duì)于很多消費(fèi)者來(lái)說(shuō),LiDAR的存在證明該自動(dòng)駕駛汽車(chē)更加安全。當(dāng)用戶看到車(chē)頂或車(chē)窗旁安裝著LiDAR時(shí),更容易相信車(chē)輛的感知能力。純視覺(jué)方案盡管在演示中表現(xiàn)良好,但用戶對(duì)“僅靠相機(jī)來(lái)測(cè)距”的擔(dān)憂依然存在。在短期商業(yè)化推廣中,LiDAR不僅是技術(shù)選型,更是品牌與安全承諾的象征。

綜上所述,盡管純視覺(jué)感知技術(shù)在目標(biāo)檢測(cè)、語(yǔ)義分割和深度估計(jì)等方面取得了顯著進(jìn)展,并且在成本層面具備一定優(yōu)勢(shì),但由于其先天無(wú)法獲得高精度物理距離、對(duì)光照和天氣條件敏感、算法對(duì)算力依賴(lài)高以及可解釋性不足等多重局限,純視覺(jué)難以完全取代LiDAR。LiDAR憑借高精度、高魯棒性和良好環(huán)境適應(yīng)性,依舊是自動(dòng)駕駛感知系統(tǒng)中的核心傳感器。未來(lái)的最優(yōu)方案,仍是通過(guò)攝像頭與LiDAR、毫米波雷達(dá)等多種傳感器的跨模態(tài)融合,構(gòu)建多冗余、多維度的全場(chǎng)景感知體系,為自動(dòng)駕駛提供更高水平的安全保障與智能駕駛體驗(yàn)。

-- END --

       原文標(biāo)題 : 自動(dòng)駕駛中純視覺(jué)替代不了激光雷達(dá)?

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)