CVPR2020|深蘭科技挑戰(zhàn)復(fù)雜場景,獲霧天條件目標(biāo)檢測挑戰(zhàn)賽冠軍
03賽題特點(diǎn)&主要工作
在這次挑戰(zhàn)賽中,主要的難點(diǎn)包含以下幾個(gè)方面:
1.可視條件差、圖像模糊
可視條件差是這個(gè)賽道核心問題,霧天收集的數(shù)據(jù)特點(diǎn)就是能見度低,圖像模糊,遠(yuǎn)處的物體不容易被檢測與識(shí)別,容易造成大量的目標(biāo)漏檢、誤檢,從而導(dǎo)致mAP效果下降。
2.圖片數(shù)量少,數(shù)據(jù)分布不平衡
總共只有4000多張帶標(biāo)注的圖片,增加了訓(xùn)練難度,再加上數(shù)據(jù)分布的不均衡,很難劃分一個(gè)具有代表性的驗(yàn)證集,很可能導(dǎo)致模型不具有泛化能力,在新的測試集上表現(xiàn)會(huì)不如預(yù)期。
檢測器
我們先通過常規(guī)檢測所累積的經(jīng)驗(yàn)構(gòu)造出一個(gè)baseline:
Baseline=Backbone+DCN[1]+FPN[2]+CascadeRCNN[3]
這套pipeline,也是去年冠軍團(tuán)隊(duì)所使用的方法,在這里我們沿用這套算法,以此為基礎(chǔ)進(jìn)行改進(jìn)。
通過觀察實(shí)驗(yàn)結(jié)果發(fā)現(xiàn),模型誤檢情況遠(yuǎn)多于漏檢,經(jīng)常出現(xiàn)一個(gè)目標(biāo)有多個(gè)檢測結(jié)果,并且這些檢測結(jié)果之間無法使用nms去除。歸納為兩方面原因。
1.模型自身能力不足,回歸分類能力差,導(dǎo)致大量誤檢;
2.負(fù)樣本不足,由于樣本個(gè)數(shù)限制,模型會(huì)在一些模棱兩可的地方檢測出置信度較高的結(jié)果,無法通過閾值去處理這些誤檢結(jié)果。
根據(jù)目前結(jié)果做了一下幾個(gè)方面的改進(jìn):
1.DoubleHeads[6]
當(dāng)需要提升模型能力時(shí),有2個(gè)比較簡單高效的方法,一是使用更強(qiáng)的backbone,二是提高RCNN中分類檢測head的能力,通過實(shí)驗(yàn)比對(duì),我們最終使用了doublehead的結(jié)構(gòu)(如下圖所示)。
▲DoubleHeads
Doublehead采用分而治之的思想,將原始head解耦為2個(gè)獨(dú)立的分支,針對(duì)不同的需求設(shè)計(jì)head結(jié)構(gòu),通過對(duì)比實(shí)驗(yàn)可發(fā)現(xiàn):使用FC-h(huán)ead做分類,Conv-h(huán)ead做回歸,可以得到最好的效果。
因?yàn)榉诸惛嗟匦枰Z義信息,所以使用全連接層。而坐標(biāo)框回歸需要更多的空間信息,因此使用卷積層。當(dāng)然這種方法會(huì)增加計(jì)算量。在平衡速度和準(zhǔn)確率的情況下,最終我們選擇了3個(gè)殘差2個(gè)Non-local共5個(gè)模塊。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字
最新活動(dòng)更多
-
10月23日火熱報(bào)名中>> 2025是德科技創(chuàng)新技術(shù)峰會(huì)
-
10月23日立即報(bào)名>> Works With 開發(fā)者大會(huì)深圳站
-
10月24日立即參評(píng)>> 【評(píng)選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評(píng)選
-
11月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
12月18日立即報(bào)名>> 【線下會(huì)議】OFweek 2025(第十屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
精彩回顧立即查看>> 【限時(shí)福利】TE 2025國際物聯(lián)網(wǎng)展·深圳站
推薦專題