CVPR2020 Oral: 一張照片三維重建你的房間
總 結(jié)
我們提出了一種基于單張圖像的端到端室內(nèi)場景重建方法。此方法對場景理解和網(wǎng)格重建進行聯(lián)合訓(xùn)練,自動生成房間布局、攝像機姿態(tài)、物體包圍盒和三維網(wǎng)格,以完全恢復(fù)房間和室內(nèi)物體的幾何信息。實驗表明,本文的聯(lián)合學(xué)習(xí)方法顯著地提高了每個子任務(wù)的性能,且每個階段的場景解析過程都對其他階段有著潛在的影響。這說明了對所有階段進行聯(lián)合訓(xùn)練的必要性。本文方法的一個局限是,學(xué)習(xí)物體的三維網(wǎng)格形狀時,需要用稠密點云進行全監(jiān)督訓(xùn)練。而在真實場景中獲取較精確的稠密點云需要耗費大量的人力。為了解決這個問題,我們計劃在未來的工作中嘗試自監(jiān)督或弱監(jiān)督的學(xué)習(xí)方式。
關(guān)于團隊:香港中文大學(xué)(深圳)GAP實驗室
該工作由香港中文大學(xué)(深圳)GAP實驗室主導(dǎo)完成。GAP實驗室取名于Generation and Analysis of Pixels, Points and Polygons;谏钲谑写髷(shù)據(jù)研究院與香港中文大學(xué)(深圳),該實驗室在韓曉光博士的帶領(lǐng)下,致力于探索和解決圖片、視頻及三維內(nèi)容的生成與分析方面的難題,其主要研究方向涵蓋計算機視覺、計算機圖形學(xué)和機器學(xué)習(xí)。
該工作主要由伯恩茅斯大學(xué)博士生聶隱愚在GAP實驗室交換期間完成。團隊成員還包括香港中文大學(xué)(深圳)研究助理教授韓曉光博士、廈門大學(xué)副教授郭詩輝博士、香港中文大學(xué)(深圳)博士生鄭玉健及伯恩茅斯大學(xué)常建教授與張建軍教授。
References:
[1] Gkioxari, G., Malik, J. and Johnson, J., 2019. Mesh r-cnn. In Proceedings of the IEEE International Conference on Computer Vision (pp. 9785-9795).
[2] Pan, J., Han, X., Chen, W., Tang, J. and Jia, K., 2019. Deep Mesh Reconstruction from Single RGB Images via Topology Modification Networks. In Proceedings of the IEEE International Conference on Computer Vision (pp. 9964-9973).
[3] Hu, H., Gu, J., Zhang, Z., Dai, J. and Wei, Y., 2018. Relation networks for object detection. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (pp. 3588-3597).
[4] Groueix, T., Fisher, M., Kim, V.G., Russell, B.C. and Aubry, M., 2018. A papier-m?ché approach to learning 3d surface generation. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 216-224).
[5] Huang, S., Qi, S., Xiao, Y., Zhu, Y., Wu, Y.N. and Zhu, S.C., 2018. Cooperative holistic scene understanding: Unifying 3d object, layout, and camera pose estimation. In Advances in Neural Information Processing Systems (pp. 207-218).

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語權(quán)
- 3 深度報告|中國AI產(chǎn)業(yè)正在崛起成全球力量,市場潛力和關(guān)鍵挑戰(zhàn)有哪些?
- 4 一文看懂視覺語言動作模型(VLA)及其應(yīng)用
- 5 上海跑出80億超級獨角獸:獲上市公司戰(zhàn)投,干人形機器人
- 6 國家數(shù)據(jù)局局長劉烈宏調(diào)研格創(chuàng)東智
- 7 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 8 百億AI芯片訂單,瘋狂傾銷中東?
- 9 Robotaxi新消息密集釋放,量產(chǎn)元年誰在領(lǐng)跑?
- 10 格斗大賽出圈!人形機器人致命短板曝光:頭腦過于簡單