Holopix50k發(fā)布: 最多最豐富的雙目數(shù)據(jù)集大幅提升多個相關任務性能?
針對單視圖深度估計任務,研究人員選擇了自監(jiān)督方法的Monodepth2模型并與其在KITTI上訓練的結(jié)果進行了比較。下圖顯示基于Holopix訓練的結(jié)果圖像較為清晰,邊緣也得到了更好的保留,a列為KITTI上訓練的結(jié)果、b列為Holopix50k上訓練的結(jié)果。
下表展示了模型在Middlebury和MPI數(shù)據(jù)集上測試的結(jié)果,表明這一數(shù)據(jù)集同樣可以適用于道路等多種數(shù)據(jù)集不包含的場景中,讓模型可以學到具有泛化性的結(jié)果。
針對視差估計任務,研究人員基于U-Net構(gòu)建了自己的模型,同時還優(yōu)化后得到了較小的實時視差估計模型,利用Pix2Pix類似的架構(gòu)來構(gòu)建單目深度估計模型,下圖a,b,c分辨顯示了立體視差估計、實時視差估計和單目深度估計的結(jié)果。視差估計可以很好的區(qū)分出場景中的不同目標,經(jīng)過優(yōu)化后的模型只有約15k參數(shù)能夠部署于邊緣設備中;而針對單目深度估計則可以在沒有先驗的條件下得到可觀的深度層次結(jié)果。
這里只是簡要地列舉了一些數(shù)據(jù)集的特征和應用任務,如果想要了解更多的細節(jié)請參看數(shù)據(jù)集網(wǎng)站。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語權(quán)
- 3 深度報告|中國AI產(chǎn)業(yè)正在崛起成全球力量,市場潛力和關鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級獨角獸:獲上市公司戰(zhàn)投,干人形機器人
- 5 國家數(shù)據(jù)局局長劉烈宏調(diào)研格創(chuàng)東智
- 6 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 7 百億AI芯片訂單,瘋狂傾銷中東?
- 8 Robotaxi新消息密集釋放,量產(chǎn)元年誰在領跑?
- 9 一文看懂視覺語言動作模型(VLA)及其應用
- 10 格斗大賽出圈!人形機器人致命短板曝光:頭腦過于簡單