Holopix50k發(fā)布: 最多最豐富的雙目數(shù)據(jù)集大幅提升多個相關(guān)任務(wù)性能?
針對單視圖深度估計任務(wù),研究人員選擇了自監(jiān)督方法的Monodepth2模型并與其在KITTI上訓(xùn)練的結(jié)果進行了比較。下圖顯示基于Holopix訓(xùn)練的結(jié)果圖像較為清晰,邊緣也得到了更好的保留,a列為KITTI上訓(xùn)練的結(jié)果、b列為Holopix50k上訓(xùn)練的結(jié)果。
下表展示了模型在Middlebury和MPI數(shù)據(jù)集上測試的結(jié)果,表明這一數(shù)據(jù)集同樣可以適用于道路等多種數(shù)據(jù)集不包含的場景中,讓模型可以學(xué)到具有泛化性的結(jié)果。
針對視差估計任務(wù),研究人員基于U-Net構(gòu)建了自己的模型,同時還優(yōu)化后得到了較小的實時視差估計模型,利用Pix2Pix類似的架構(gòu)來構(gòu)建單目深度估計模型,下圖a,b,c分辨顯示了立體視差估計、實時視差估計和單目深度估計的結(jié)果。視差估計可以很好的區(qū)分出場景中的不同目標(biāo),經(jīng)過優(yōu)化后的模型只有約15k參數(shù)能夠部署于邊緣設(shè)備中;而針對單目深度估計則可以在沒有先驗的條件下得到可觀的深度層次結(jié)果。
這里只是簡要地列舉了一些數(shù)據(jù)集的特征和應(yīng)用任務(wù),如果想要了解更多的細節(jié)請參看數(shù)據(jù)集網(wǎng)站。

最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機器人東風(fēng)翻身?