目標(biāo)檢測(cè)中焦點(diǎn)損失的原理
介紹對(duì)象檢測(cè)是計(jì)算機(jī)視覺社區(qū)中研究最廣泛的主題之一,它已經(jīng)進(jìn)入了各個(gè)行業(yè),涉及從圖像安全,監(jiān)視,自動(dòng)車輛系統(tǒng)到機(jī)器檢查等領(lǐng)域。
當(dāng)前,基于深度學(xué)習(xí)的對(duì)象檢測(cè)可以大致分為兩類:兩級(jí)檢測(cè)器,例如基于區(qū)域檢測(cè)的CNN(R-CNN)及其后續(xù)產(chǎn)品。
一級(jí)探測(cè)器,例如YOLO系列探測(cè)器和SSD基于錨框的常規(guī)一級(jí)檢測(cè)器可能會(huì)更快,更簡(jiǎn)單,但由于在訓(xùn)練過(guò)程中遇到極端的等級(jí)失衡,其精度已經(jīng)落后于兩級(jí)探測(cè)器。FAIR在2018年發(fā)表了一篇論文,其中他們引入了焦點(diǎn)損失的概念,使用他們稱之為RetinaNet的一級(jí)探測(cè)器來(lái)處理此類不平衡問(wèn)題。在我們深入探討焦點(diǎn)丟失的本質(zhì)之前,讓我們首先了解這個(gè)類不平衡問(wèn)題是什么以及它可能引起的問(wèn)題。
目錄為什么需要焦點(diǎn)損失什么是焦點(diǎn)損失交叉熵?fù)p失交叉熵問(wèn)題例子平衡交叉熵?fù)p失平衡交叉熵問(wèn)題例子焦點(diǎn)損失說(shuō)明例子交叉熵?fù)p失 vs 焦點(diǎn)損失容易正確分類的記錄分類錯(cuò)誤的記錄非常容易分類的記錄最后的想法為什么需要焦點(diǎn)損失兩種經(jīng)典的一級(jí)檢測(cè)方法,如增強(qiáng)型檢測(cè)器,DPM和最新的方法(如SSD)都可以評(píng)估每個(gè)圖像大約10^4 至 10^5個(gè)候選位置,但只有少數(shù)位置包含對(duì)象(即前景),而其余的只是背景對(duì)象,這就導(dǎo)致了類不平衡的問(wèn)題。這種不平衡會(huì)導(dǎo)致兩個(gè)問(wèn)題訓(xùn)練效率低下,因?yàn)榇蠖鄶?shù)位置都容易被判斷為負(fù)類(這意味著檢測(cè)器可以輕松地將其歸類為背景),這對(duì)檢測(cè)器的學(xué)習(xí)沒有幫助。容易產(chǎn)生的負(fù)類(概率較高的檢測(cè))占輸入的很大一部分。
雖然單獨(dú)計(jì)算的梯度和損失較小,但它們可能使損耗和計(jì)算出的梯度不堪重負(fù),并可能導(dǎo)致模型退化。什么是焦點(diǎn)損失簡(jiǎn)而言之,焦點(diǎn)損失(Focal Loss,FL)是交叉熵?fù)p失(Cross-Entropy Loss,CE)的改進(jìn)版本,它通過(guò)為難分類的或容易錯(cuò)誤分類的示例(即帶有噪聲紋理的背景或部分對(duì)象的或我們感興趣的對(duì)象)分配更多的權(quán)重并對(duì)簡(jiǎn)單示例(即背景對(duì)象)降低權(quán)重來(lái)處理類不平衡問(wèn)題。
因此,焦點(diǎn)損失減少了簡(jiǎn)單示例的損失貢獻(xiàn),并加強(qiáng)了對(duì)糾正錯(cuò)誤分類示例的重視。首先讓我們來(lái)了解一下二進(jìn)制分類的交叉熵?fù)p失。交叉熵?fù)p失交叉熵?fù)p失背后的思想是懲罰錯(cuò)誤的預(yù)測(cè),而不是獎(jiǎng)勵(lì)正確的預(yù)測(cè)。二進(jìn)制分類的交叉熵?fù)p失如下:
其中:Yact = Y的實(shí)際值Ypred = Y的預(yù)測(cè)值為了標(biāo)記方便,我們記 Yact = Y 且 Ypred = p 。Y∈{0,1},這是正確標(biāo)注p∈[0,1],是模型對(duì)Y = 1的類別的估計(jì)概率。為了符號(hào)上的方便,我們可以將上述方程式改寫為:pt = {-ln(p) ,當(dāng)Y=1 -ln(1-p) ,當(dāng) Y=}CE(p,y)= CE(pt)=-ln?(pt)交叉熵問(wèn)題如你所見,下圖中的藍(lán)線表示當(dāng)p非常接近0(當(dāng)Y = 0時(shí))或1時(shí),容易分類的pt > 0.5的示例可能會(huì)產(chǎn)生不小幅度的損失。
讓我們用下面的例子來(lái)理解它。例子假設(shè),前景(我們稱其為類1)正確分類為p = 0.95 ——CE(FG)= -ln(0.95)= 0.05并且背景(我們稱其為類0)正確分類為p = 0.05 ——CE(BG)=-ln(1- 0.05)= 0.05現(xiàn)在問(wèn)題是,對(duì)于類不平衡的數(shù)據(jù)集,當(dāng)這些小的損失在整個(gè)圖像上相加時(shí),可能會(huì)使整體損失(總損失)不堪重負(fù),將導(dǎo)致模型退化。
平衡交叉熵?fù)p失解決類別不平衡問(wèn)題的一種常見方法是為類別引入權(quán)重因子∝[0,1]為了標(biāo)記方便,我們可以在損失函數(shù)中定義 ∝t 如下:CE(pt)= -∝t ln ln(pt)
如你所見,這只是交叉熵的擴(kuò)展。平衡交叉熵的問(wèn)題我們的實(shí)驗(yàn)將表明,在密集檢測(cè)器訓(xùn)練過(guò)程中遇到的大類不平衡壓倒了交叉熵?fù)p失。容易分類的負(fù)類占損耗的大部分,并主導(dǎo)梯度。雖然平衡了正例/負(fù)例的重要性,但它并沒有區(qū)分簡(jiǎn)單/困難的示例。
讓我們通過(guò)一個(gè)例子來(lái)理解這一點(diǎn)例子假設(shè),前景(我們稱其為類1)正確分類為p = 0.95 ——CE(FG)= -0.25 * ln(0.95)= 0.0128正確分類為p = 0.05的背景(我們稱之為類0)——CE(BG)=-(1-0.25)* ln(1- 0.05)= 0.038雖然可以很好地正確區(qū)分正類和負(fù)類,但仍然不能區(qū)分簡(jiǎn)單/困難的樣本。這就是焦點(diǎn)損失(擴(kuò)展到交叉熵)所要解決的問(wèn)題。
焦點(diǎn)損失說(shuō)明焦點(diǎn)損失只是交叉熵?fù)p失函數(shù)的擴(kuò)展,它將降低簡(jiǎn)單示例的權(quán)重,并將訓(xùn)練重點(diǎn)放在困難的負(fù)樣本上。為此,研究人員提出:(1- pt)γ 為交叉熵?fù)p失,且可調(diào)聚焦參數(shù)γ≥0。RetinaNet物體檢測(cè)方法使用焦點(diǎn)損失的α平衡變體,其中α = 0.25,γ= 2效果最佳。
因此,焦點(diǎn)損失可以定義為——FL (pt) = -αt(1- pt)γ log log(pt).對(duì)于γ∈[0,5]的幾個(gè)值,可以看到焦點(diǎn)損失,請(qǐng)參見圖1。我們將注意到焦點(diǎn)損失的以下特性:當(dāng)示例分類錯(cuò)誤并且pt小時(shí),調(diào)制因數(shù)接近1,并且損失不受影響。當(dāng) pt →1 時(shí),該因子變?yōu)?,并且對(duì)分類良好的示例的損失進(jìn)行了權(quán)衡。聚焦參數(shù)γ平滑地調(diào)整了簡(jiǎn)單示例的權(quán)重。隨著增加,調(diào)制因數(shù)的作用同樣增加。(經(jīng)過(guò)大量實(shí)驗(yàn)和試驗(yàn),研究人員發(fā)現(xiàn)γ = 2效果最佳)注意:當(dāng)γ= 0時(shí),FL等效于CE,參考圖中藍(lán)色曲線。
直觀上,調(diào)制因數(shù)減少了簡(jiǎn)單示例的損耗貢獻(xiàn),并擴(kuò)展了示例接收低損耗的范圍。讓我們通過(guò)一個(gè)例子來(lái)了解上述焦點(diǎn)損失的特性。例子當(dāng)記錄(前景或背景)被正確分類時(shí),前景正確分類,預(yù)測(cè)概率p=0.99,背景正確分類,預(yù)測(cè)概率p=0.01。pt = {0.99,當(dāng)Yact = 1 時(shí); 1-0.01,當(dāng)Y act = 0時(shí)},調(diào)制因數(shù)(FG)=(1-0.99)2 = 0.0001,調(diào)制因數(shù)(BG)=(1-(1-0.01))2 = 0.0001,如你所見,調(diào)制因數(shù)接近于0,因此損耗將被權(quán)重降低。
前景被錯(cuò)誤分類,預(yù)測(cè)概率p = 0.01,背景對(duì)象被錯(cuò)誤分類,預(yù)測(cè)概率p = 0.99。pt = {0.01,當(dāng)Yact = 1 時(shí); 1-0.99,當(dāng)Y act = 0時(shí)},調(diào)制因數(shù)(FG)=(1-0.01)2 = 0.9801,調(diào)制因數(shù)(BG)=(1-(1-0.99))2 = 0.9801,如你所見,調(diào)制因數(shù)接近于1,因此損耗不受影響,F(xiàn)在,讓我們使用一些示例來(lái)比較交叉熵和焦點(diǎn)損失,并查看焦點(diǎn)損失在訓(xùn)練過(guò)程中的影響。交叉熵?fù)p失 vs 焦點(diǎn)損失讓我們通過(guò)考慮以下幾種情況來(lái)進(jìn)行比較。
容易正確分類的記錄假設(shè)前景正確分類的預(yù)測(cè)概率為p = 0.95,背景正確分類的背景為預(yù)測(cè)概率p = 0.05。pt = {0.95, 當(dāng) Yact=1時(shí);1-0.05 ,當(dāng) Yact = 0時(shí)}, CE(FG)= -ln (0.95) = 0.0512932943875505,讓我們考慮在∝ = 0.25和γ= 2時(shí)的焦點(diǎn)損失。FL(FG)= -0.25 * (1-0.95)2 * ln (0.95) = 3.2058308992219E-5FL(BG)= -0.75 * (1-(1-0.05))2 * ln (1-0.05) = 9.61E-5分類錯(cuò)誤的記錄假設(shè)預(yù)測(cè)概率p=0.05的前景被分類為預(yù)測(cè)概率p=0.05的背景對(duì)象。pt = {0.95,當(dāng)Y act = 1;1-0.05時(shí),當(dāng)Y act = 0時(shí)},CE(FG)= -ln(0.05)= 2.995732273553991CE(BG)= -ln(1-0.95)= 2.995732273553992讓我們考慮相同的場(chǎng)景,即∞=0.25和γ=2。FL(FG)= -0.25 * (1-0.05)2 * ln(0.05)= 0.675912094220619,FL(BG)= -0.75 * (1-(1-0.95))2 * ln(1-0.95)= 2.027736282661858非常容易分類的記錄假設(shè)對(duì)預(yù)測(cè)概率p=0.01的背景對(duì)象,用預(yù)測(cè)概率p=0.99對(duì)前景進(jìn)行分類。pt = {0.99, 當(dāng) Yact=1時(shí);1-0.01 ,當(dāng) Yact = 0時(shí)},CE(FG)= -ln (0.99)= 0.0100503358535014,CE(BG)= -ln(1-0.01)= 0.0100503358535014讓我們考慮相同的場(chǎng)景,即∞=0.25和γ=2。FL(FG)= -0.25 * (1-0.01)2 * ln(0.99)= 2.51 * 10 -7,FL(BG)= -0.75 * (1-(1-0.01))2 * ln(1-0.01) = 7.5377518901261E-7最后的想法方案1:0.05129 / 3.2058 * 10 -7 =小1600倍方案2:2.3 / 0.667 =小4.5倍方案3:0.01 / 0.00000025 =小40,000倍。
這三個(gè)案例清楚地說(shuō)明了焦點(diǎn)損失是如何減小分類良好記錄的權(quán)重的,另一方面又為錯(cuò)誤分類或較難分類的記錄賦予較大的權(quán)重。經(jīng)過(guò)大量的試驗(yàn)和實(shí)驗(yàn),研究人員發(fā)現(xiàn) ∝ = 0.25和 γ = 2 效果最佳。尾注在本文,我們經(jīng)歷了從交叉熵?fù)p失到焦點(diǎn)損失的整個(gè)進(jìn)化過(guò)程,詳細(xì)解釋了目標(biāo)檢測(cè)中的焦點(diǎn)損失。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車】汽車E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺(tái)
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來(lái)商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽(yáng)光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長(zhǎng)空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?