CVPR2020|深蘭科技挑戰(zhàn)復(fù)雜場景,獲霧天條件目標(biāo)檢測挑戰(zhàn)賽冠軍
03賽題特點&主要工作
在這次挑戰(zhàn)賽中,主要的難點包含以下幾個方面:
1.可視條件差、圖像模糊
可視條件差是這個賽道核心問題,霧天收集的數(shù)據(jù)特點就是能見度低,圖像模糊,遠(yuǎn)處的物體不容易被檢測與識別,容易造成大量的目標(biāo)漏檢、誤檢,從而導(dǎo)致mAP效果下降。
2.圖片數(shù)量少,數(shù)據(jù)分布不平衡
總共只有4000多張帶標(biāo)注的圖片,增加了訓(xùn)練難度,再加上數(shù)據(jù)分布的不均衡,很難劃分一個具有代表性的驗證集,很可能導(dǎo)致模型不具有泛化能力,在新的測試集上表現(xiàn)會不如預(yù)期。
檢測器
我們先通過常規(guī)檢測所累積的經(jīng)驗構(gòu)造出一個baseline:
Baseline=Backbone+DCN[1]+FPN[2]+CascadeRCNN[3]
這套pipeline,也是去年冠軍團(tuán)隊所使用的方法,在這里我們沿用這套算法,以此為基礎(chǔ)進(jìn)行改進(jìn)。
通過觀察實驗結(jié)果發(fā)現(xiàn),模型誤檢情況遠(yuǎn)多于漏檢,經(jīng)常出現(xiàn)一個目標(biāo)有多個檢測結(jié)果,并且這些檢測結(jié)果之間無法使用nms去除。歸納為兩方面原因。
1.模型自身能力不足,回歸分類能力差,導(dǎo)致大量誤檢;
2.負(fù)樣本不足,由于樣本個數(shù)限制,模型會在一些模棱兩可的地方檢測出置信度較高的結(jié)果,無法通過閾值去處理這些誤檢結(jié)果。
根據(jù)目前結(jié)果做了一下幾個方面的改進(jìn):
1.DoubleHeads[6]
當(dāng)需要提升模型能力時,有2個比較簡單高效的方法,一是使用更強的backbone,二是提高RCNN中分類檢測head的能力,通過實驗比對,我們最終使用了doublehead的結(jié)構(gòu)(如下圖所示)。
▲DoubleHeads
Doublehead采用分而治之的思想,將原始head解耦為2個獨立的分支,針對不同的需求設(shè)計head結(jié)構(gòu),通過對比實驗可發(fā)現(xiàn):使用FC-h(huán)ead做分類,Conv-h(huán)ead做回歸,可以得到最好的效果。
因為分類更多地需要語義信息,所以使用全連接層。而坐標(biāo)框回歸需要更多的空間信息,因此使用卷積層。當(dāng)然這種方法會增加計算量。在平衡速度和準(zhǔn)確率的情況下,最終我們選擇了3個殘差2個Non-local共5個模塊。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語權(quán)
- 3 深度報告|中國AI產(chǎn)業(yè)正在崛起成全球力量,市場潛力和關(guān)鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級獨角獸:獲上市公司戰(zhàn)投,干人形機器人
- 5 一文看懂視覺語言動作模型(VLA)及其應(yīng)用
- 6 國家數(shù)據(jù)局局長劉烈宏調(diào)研格創(chuàng)東智
- 7 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 8 百億AI芯片訂單,瘋狂傾銷中東?
- 9 Robotaxi新消息密集釋放,量產(chǎn)元年誰在領(lǐng)跑?
- 10 格斗大賽出圈!人形機器人致命短板曝光:頭腦過于簡單