使用Python進(jìn)行SOTA:用于多目標(biāo)跟蹤的一鍵式跟蹤器
介紹
多目標(biāo)跟蹤是計(jì)算機(jī)視覺中的一個(gè)重要問題,近年來一直受到學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注。
MOT的目標(biāo)是在視頻序列中預(yù)測(cè)多個(gè)感興趣對(duì)象的單個(gè)軌跡。它有益于自動(dòng)駕駛、人機(jī)交互到智能視頻等重大應(yīng)用。
通過檢測(cè)范式進(jìn)行跟蹤
在大多數(shù)現(xiàn)代多目標(biāo)跟蹤系統(tǒng)中,主要的策略是通過檢測(cè)范式進(jìn)行跟蹤。通過檢測(cè)范式進(jìn)行跟蹤將MOT分解為以下步驟:
用于目標(biāo)定位的目標(biāo)檢測(cè)器
建立外觀模型為檢測(cè)到的目標(biāo)提取ReID特征。
深入研究 Person-ReID
運(yùn)動(dòng)模型和數(shù)據(jù)關(guān)聯(lián),在其中分配檢測(cè)到的目標(biāo)并將其連接到現(xiàn)有軌跡。
它旨在尋找與時(shí)空相匹配并形成軌跡的檢測(cè)。理想情況下,每個(gè)單獨(dú)的軌跡都應(yīng)具有唯一的跟蹤ID。
小提示:檢測(cè)總是不完美,我們將在“挑戰(zhàn)”部分中介紹。多年來,我們目睹了目標(biāo)檢測(cè)和再識(shí)別方面的驚人進(jìn)步,這是多目標(biāo)跟蹤的關(guān)鍵組成部分。但是,如何在單一網(wǎng)絡(luò)中同時(shí)完成這兩項(xiàng)任務(wù),目前還很少有人關(guān)注。在此博客中,我們將分解MOT系統(tǒng),并研究FairMOT,該系統(tǒng)在檢測(cè)和跟蹤方面具有很高的準(zhǔn)確性,在幾個(gè)公共數(shù)據(jù)集上,它的性能大大超過了之前的SOTAs。我們還將介紹以前的單次方法失敗的原因。
挑戰(zhàn)
當(dāng)我們分解MOT系統(tǒng)時(shí),我們可以把握每個(gè)步驟可能面臨的挑戰(zhàn)。由于遮擋,視角/姿勢(shì)/模糊/照明變化和背景混亂等因素,目標(biāo)檢測(cè)可能會(huì)失敗。序列中可能存在相同對(duì)象類型的多個(gè)實(shí)例,這使得外觀通常非常相似,并且很難進(jìn)行唯一匹配。因此,擁有正確的指標(biāo)來評(píng)估MOT框架并進(jìn)一步優(yōu)化它是非常重要的。方法多目標(biāo)跟蹤系統(tǒng)可以放在兩個(gè)括號(hào)中:在線跟蹤:在線跟蹤會(huì)逐幀處理跟蹤ID,而無法查看將來的幀。非常適合實(shí)時(shí)應(yīng)用程序和流數(shù)據(jù)。但是它很容易漂移,因?yàn)楹茈y從錯(cuò)誤或遮擋中恢復(fù)。脫機(jī)跟蹤:脫機(jī)跟蹤按順序處理一批幀。這有助于從遮擋中恢復(fù)以及對(duì)動(dòng)態(tài)世界的推理。它不適用于實(shí)時(shí)應(yīng)用,但不適用于視頻分析。例如,通過顧客在商店中的移動(dòng)和互動(dòng)來分析顧客的行為。MOT神經(jīng)求解器 (https://arxiv.org/abs/1912.07515) 是這種方法的一個(gè)很好的例子,它探索了圖神經(jīng)網(wǎng)絡(luò)。數(shù)據(jù)MOTChallenge(https://motchallenge.net/)社區(qū)創(chuàng)建了一個(gè)通用框架來測(cè)試多目標(biāo)跟蹤器。他們添加的公共數(shù)據(jù)集序列,具有挑戰(zhàn)性,具有多種特征,包括不同的幀頻,擁擠的場(chǎng)景,視角或光照,可以模仿現(xiàn)實(shí)生活的場(chǎng)景,并挑戰(zhàn)研究人員和從業(yè)者開發(fā)一個(gè)通用跟蹤器來處理這些序列。
MOT16 / 17數(shù)據(jù)集——來源
PapersWithCode:)MOT:)正如你所看到的FairMOT在多個(gè)公共數(shù)據(jù)集上處于領(lǐng)先地位。我們將很快在博客中討論他們的方法。指標(biāo)許多單獨(dú)的指標(biāo)用于評(píng)估MOT的不同方面。研究團(tuán)體主要在兩個(gè)復(fù)合指標(biāo)上進(jìn)行了優(yōu)化,即多目標(biāo)跟蹤精度(MOTA)和識(shí)別F1分?jǐn)?shù)(IDF1)。初始指標(biāo)側(cè)重于目標(biāo)覆蓋范圍,跟蹤識(shí)別性能由后者衡量。多目標(biāo)跟蹤精度(MOTA) 在單一性能指標(biāo)下考慮三種誤差:
MOTA :其中t是視頻序列中的幀索引,而GT是真實(shí)目標(biāo)的數(shù)量。其中FN為假陰性,即系統(tǒng)未檢測(cè)到的真實(shí)目標(biāo)的數(shù)量。FP是誤報(bào),即系統(tǒng)錯(cuò)誤檢測(cè)但在真實(shí)目標(biāo)中不存在的數(shù)量。IDSW是識(shí)別轉(zhuǎn)換的數(shù)量,即給定軌跡從一個(gè)真實(shí)目標(biāo)變?yōu)榱硪粋(gè)目標(biāo)的次數(shù)。**多目標(biāo)跟蹤精度(MOTP)**是所有真實(shí)正值與其對(duì)應(yīng)的真實(shí)目標(biāo)之間的平均差異。對(duì)于邊界框重疊,其計(jì)算公式如下:
其中ct表示幀t和dt中的匹配數(shù)目,i是目標(biāo)i與幀t中指定的真實(shí)目標(biāo)的邊界框重疊。然后,將IDF1表示為正確識(shí)別的檢測(cè)數(shù)與平均真實(shí)目標(biāo)和計(jì)算的檢測(cè)數(shù)之比,并通過其諧波均值來平衡識(shí)別精度和召回率:
IDF1-來源高階跟蹤準(zhǔn)確性(HOTA)是去年末(2020)發(fā)布的一項(xiàng)指標(biāo)。它可以將執(zhí)行準(zhǔn)確的檢測(cè),關(guān)聯(lián)和定位的效果平衡到用于跟蹤器比較的單個(gè)統(tǒng)一指標(biāo)中。測(cè)量多目標(biāo)跟蹤器的性能需要仔細(xì)設(shè)計(jì),因?yàn)榭赡軙?huì)出現(xiàn)多個(gè)對(duì)應(yīng)星座。
圖片由Bernardin,Keni和Rainer Stiefelhagen提供-來源py-motmetrics是一個(gè)很棒的庫(kù),它為多目標(biāo)跟蹤器(MOT)的基準(zhǔn)測(cè)試提供了一個(gè)度量的Python實(shí)現(xiàn)。通過提交日期、時(shí)間和模型類別來衡量跟蹤器性能的概述。
FairMOT:多目標(biāo)跟蹤中檢測(cè)和再識(shí)別的公平性作者的貢獻(xiàn)和他們?cè)噲D解決的挑戰(zhàn):他們演示并討論了以前的一次性跟蹤框架所面臨的挑戰(zhàn),這些框架已被忽視,但嚴(yán)重限制了它們的性能。他們?cè)谥T如點(diǎn)對(duì)象(CenterNet)之類的無錨OD方法之上,引入了一個(gè)框架來公平地平衡檢測(cè)和Re-ID任務(wù)。他們提出了一種自我監(jiān)督的學(xué)習(xí)方法,以在大規(guī)模檢測(cè)數(shù)據(jù)集上訓(xùn)練FairMOT,從而提高了泛化能力。FairMOT概述
FairMOT概述—來源 順帶一提錨造成的不公平
解決目標(biāo)檢測(cè)任務(wù)有多種方法。1)兩階段檢測(cè)器,例如RCNN系列,它具有區(qū)域提議網(wǎng)絡(luò)和一個(gè)用于檢測(cè)的網(wǎng)絡(luò)。2)單級(jí)探測(cè)器,如YOLO系列,CenterNet,它沒有單獨(dú)的區(qū)域提議網(wǎng)絡(luò),可以進(jìn)一步分類為帶有錨定盒和無錨定點(diǎn)的探測(cè)器。忽略的ReID任務(wù)一個(gè)錨可以對(duì)應(yīng)多個(gè)身份;阱^的目標(biāo)檢測(cè)方法通常使用 ROI-Pool 或 ROI-Align 從每個(gè)提議中提取特征。ROI-Align的大多數(shù)采樣位置中都可能存在令人不安的干擾實(shí)例或背景。多個(gè)錨對(duì)應(yīng)一個(gè)身份
2. 特征引起的不公平使用多層特征聚合通過允許兩個(gè)分支從多層聚合特征中提取它們所需的必需特征,可以有效地解決這一矛盾。如果沒有多層融合,該模型將偏向主要檢測(cè)分支并生成低質(zhì)量的ReID特征。
3.特征維度引起的不公平盡管學(xué)習(xí)高維ReID特征可能會(huì)略微提高其區(qū)分對(duì)象的能力,但由于兩項(xiàng)任務(wù)的競(jìng)爭(zhēng),這會(huì)特別損害對(duì)象檢測(cè)的準(zhǔn)確性,這反過來又對(duì)最終的跟蹤精度產(chǎn)生負(fù)面影響。他們建議學(xué)習(xí)低維ReID功能以平衡兩個(gè)任務(wù)。當(dāng)訓(xùn)練數(shù)據(jù)較少時(shí),學(xué)習(xí)低維ReID特征可降低過擬合的風(fēng)險(xiǎn)。MOT中的數(shù)據(jù)集通常比ReID區(qū)域中的數(shù)據(jù)集小得多。因此有利于減小特征尺寸。低維ReID功能可提高推理速度。
4.重要指標(biāo)FairMOT在步幅為4的高分辨率特征圖上運(yùn)行,而以前的基于錨的方法在步幅為32的特征圖上運(yùn)行。消除錨點(diǎn)以及使用高分辨率特征,可以更好地將ReID特征與對(duì)象中心對(duì)齊,這大大提高了跟蹤精度。ReID功能的尺寸設(shè)置為僅64,這不僅減少了計(jì)算時(shí)間,而且還通過在檢測(cè)任務(wù)和ReID任務(wù)之間取得良好的平衡來提高跟蹤的魯棒性。他們?yōu)楣歉删W(wǎng)配備了Deep Layer Aggregation 運(yùn)算符,以融合多層特征,以容納分支并處理不同比例的對(duì)象。Deep Layer Aggregation:5.?dāng)?shù)據(jù)關(guān)聯(lián)
FairMOT中的數(shù)據(jù)關(guān)聯(lián)涉及三個(gè)實(shí)體,即邊界框IoU,ReID功能和卡爾曼過濾器。這些屬性用于計(jì)算每對(duì)檢測(cè)到的邊界框之間的相似度,然后使用諸如匈牙利算法的唯一匹配算法來解決分配問題。僅使用邊界框IoU會(huì)導(dǎo)致很多ID switch,對(duì)于擁擠的場(chǎng)景和快速的攝像機(jī)運(yùn)動(dòng)尤其如此。單獨(dú)使用ReID似乎可以增加IDF1并減少ID switch的數(shù)量。添加卡爾曼濾波器有助于獲得平滑的小軌跡,從而進(jìn)一步減少ID switch的數(shù)量。重要的是要利用邊界框IoU,ReID特征和卡爾曼濾波器來獲得良好的跟蹤性能。結(jié)論作者嘗試了為什么以前的單一方法未能獲得與兩階段MOT方法可比的結(jié)果的原因,并發(fā)現(xiàn)使用基于錨點(diǎn)的目標(biāo)檢測(cè)模型和身份嵌入是導(dǎo)致結(jié)果降低的主要原因。本文還探討了以前的MOT框架中的檢測(cè)和ReID任務(wù)之間功能的不公平和沖突問題,并提出了FairMOT(一種無錨的單發(fā)MOT框架)。MOT方面的研究正在朝“一擊跟蹤”邁進(jìn),我對(duì)即將在該領(lǐng)域進(jìn)行的研究感到非常興奮。在 Fynd Trak,我們度過了一段美好的時(shí)光,為視頻分析探索和實(shí)施多種多目標(biāo)跟蹤方法,以分析客戶的互動(dòng)和在商店中的參與度。它有助于將分析引入離線環(huán)境,以了解客戶并優(yōu)化商店轉(zhuǎn)換和銷售。
參考文獻(xiàn)[1] Zhang, Yifu and Wang, Chunyu and Wang, Xinggang and Zeng, Wenjun and Liu, Wenyu, FairMOT: On the Fairness of Detection and Re-Identification in Multiple Object Tracking (2020). Arxiv, abs/2004.01888[2] Wang, Zhongdao and Zheng, Liang and Liu, Yixuan and Wang, Shengjin, Towards Real-Time Multi-Object Tracking (2019). ArXiv preprint ArXiv:1909.12605[3] Zhou, Xingyi and Wang, Dequan and Kr{”a}henb{”u}hl, Philipp, Objects as Points (2019). Arxiv, abs/1904.07850[4] Patrick Dendorfer, Aljo?a O?ep, Anton Milan, Konrad Schindler, Daniel Cremers, Ian Reid, Stefan Roth, Laura Leal-Taixé, MOTChallenge: A Benchmark for Single-Camera Multiple Target Tracking (2020), Arxiv, abs/2010.07548[5] Keni Bernardin & Rainer Stiefelhagen, Evaluating Multiple Object Tracking Performance: The CLEAR MOT Metrics (2008), EURASIP Journal on Image and Video Processing[6] Milan, Anton, et al. “Mot16: A benchmark for multi-object tracking.” arXiv preprint arXiv:1603.00831 (2016).

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車】汽車E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺(tái)
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽(yáng)光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長(zhǎng)空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?