侵權投訴
訂閱
糾錯
加入自媒體

使用相機和深度學習制作偽LiDAR

2020-07-24 08:57
智車科技IV
關注

1.監(jiān)督深度估計

“監(jiān)督”深度學習背后的概念很簡單,收集RGB圖像及其相應的深度圖,訓練類似于“自動編碼器”的體系結構進行深度估計。(盡管訓練起來不那么簡單,但如果不通過訓練過程整合一些特殊技巧,FCN就永遠無法真正發(fā)揮作用:)。

盡管此方法更易于掌握,但在現(xiàn)實生活中收集深度圖是一項昂貴的任務。LiDAR數(shù)據(jù)可用于訓練這類網(wǎng)絡,因此,如果我們對由LiDAR收集的數(shù)據(jù)進行訓練,則神經(jīng)網(wǎng)絡的性能將明顯優(yōu)于LiDAR,但仍然可以,因為我們不需要那種級別的準確性來駕駛汽車例如,知道樹上是否有葉子的確切距離。

2.無監(jiān)督深度估計

僅在一系列環(huán)境中記錄質量深度數(shù)據(jù)是一個具有挑戰(zhàn)性的問題。無監(jiān)督方法可以在沒有地面真實深度圖的情況下學習深度!

“這種方法只是查看未標記的視頻,并找到一種方法來創(chuàng)建深度圖,方法不是嘗試正確,而是嘗試保持一致!

3.神經(jīng)網(wǎng)絡架構

該網(wǎng)絡具有類似于U-Net的架構,編碼器部分是在ImageNet數(shù)據(jù)集上訓練的預訓練DenseNet模型。解碼器部分使用雙線性上采樣而不是簡單的上采樣。

簡而言之,我們使用雙線性上采樣是因為它在上采樣后會整體上產(chǎn)生“平滑”圖像。輸出是深度圖,深度圖是圖像大小的一半,這有助于網(wǎng)絡學習更快。

4.圖像增強

對于圖像增強,可以使用以下技術:圖像翻轉,輸入圖像的色彩通道改組,向輸入圖像添加噪點,增加輸入圖像的對比度,亮度,溫度等。這樣可以確保模型在整個訓練過程中始終看到新數(shù)據(jù),并更好地泛化未見數(shù)據(jù)。

目前,深度估計在AR / VR中已經(jīng)得到了許多應用。


<上一頁  1  2  
聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    智能汽車網(wǎng) 獵頭職位 更多
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號