遮擋反光下拍照無壓力—臺大提出新型遮擋去除模型還你清晰視界
模型實(shí)現(xiàn)
本文的任務(wù)是在給定包含T幀的圖像序列下,將每一幀分解為清晰的背景圖像和各種原因造成的遮擋層。將圖像分解為背景層和遮擋層是十分困難的任務(wù),因?yàn)閮蓪釉谳斎雸D像中是強(qiáng)耦合的,同時(shí)也需要解決兩個(gè)強(qiáng)耦合的問題:光流分解和每層的重建。
如果沒有好的光流分解,不精確的運(yùn)動(dòng)估計(jì)將會(huì)使得每層無法精確地重建。但另一方面,沒有良好重建的背景層和遮擋層,混合的圖像無法精確估計(jì)出代表運(yùn)動(dòng)的光流。我們所面臨的是一個(gè)雞生蛋蛋生雞的悖論問題,無法堅(jiān)實(shí)地選擇先重建光流還是兩層圖像。
為了解決這一問題,本文嘗試?yán)萌齻(gè)模塊構(gòu)建的深度學(xué)習(xí)模型來處理。模型主要包括初始光流分解、背景-遮擋層重建以及光流優(yōu)化三個(gè)部分。首先在在粗糙的層級上估計(jì)光流,來作為初始光流;而后漸進(jìn)的重建遮擋和背景層,并對前景和背景的光流運(yùn)動(dòng)場進(jìn)行優(yōu)化。在每一層級上,利用前一層的結(jié)果和重建模塊來重建背景和前景遮擋層,并利用PWC-Net來預(yù)測兩層優(yōu)化后的光流結(jié)果。
首先我們來分析初始光流分解模塊的構(gòu)成。首先需要在粗糙的層級上對前景和背景光流進(jìn)行預(yù)測,針對每一層提出了均勻運(yùn)動(dòng)矢量來代替稠密光流場的估計(jì)。初始光流模塊分為特征抽取和層流估計(jì)器兩個(gè)模塊。特征抽取器對輸入幀特征進(jìn)行特征抽取得到尺度大小的特征圖結(jié)果。隨后利用協(xié)方差重建出第k幀和第j幀間的損失,其中和代表抽取出的特征,x代表像素的位置。構(gòu)建的cost volum與特征合并在一起輸入層(光)流估計(jì)模塊。
層流估計(jì)器利用全局池化和全連接層生成兩個(gè)全局運(yùn)動(dòng)矢量。隨后將全局運(yùn)動(dòng)矢量轉(zhuǎn)換為兩個(gè)均勻運(yùn)動(dòng)場,其空間分辨率為輸入的,針對初始化層來說,得到背景層和遮擋/反射層的初始運(yùn)動(dòng)光流場為,。
下圖顯示了初始分解模塊的細(xì)節(jié):
在前景和反射層初始流估計(jì)后,就需要對每一層的圖像進(jìn)行重建了。雖然都是對圖像進(jìn)行重建,前景和背景具有不同的特點(diǎn)。背景圖像通常在圖像中占據(jù)主要位置,而反射層圖像則通常較暗也較為模糊。所以分別訓(xùn)練了兩個(gè)網(wǎng)絡(luò)來重建前景和背景圖像。下圖以背景重建網(wǎng)絡(luò)作為例子,前景重建網(wǎng)絡(luò)也具有相同的結(jié)構(gòu)。
首先將上一層級重建得到關(guān)鍵幀的背景與反射圖像,以及得到的背景流結(jié)果進(jìn)行二倍上采樣;一方面使用上一層級的背景流與當(dāng)前層級的輸入圖像基于關(guān)鍵幀進(jìn)行變換與對齊得到背景注冊的幀序列;隨后計(jì)算出被遮擋或者其他問題造成的失效掩膜序列,并利用關(guān)鍵幀計(jì)算出差異圖序列;隨后失效掩膜序列、差異圖序列、上采樣后的上一層級關(guān)鍵幀反射與背景圖一同疊加送入到背景重建網(wǎng)絡(luò)中;最后通過疊加背景重建網(wǎng)絡(luò)得到的殘差與當(dāng)前層級關(guān)鍵幀上采樣背景圖來得到重建后的背景圖結(jié)果。
在對每一層圖像進(jìn)行重建后,還需要對光流進(jìn)行優(yōu)化。這一部分主要利用預(yù)訓(xùn)練的PWC-Net來估計(jì)背景圖像間的光流場,值得一提的是此處PWC-Net的權(quán)重固定不參與訓(xùn)練:
為了改善訓(xùn)練的穩(wěn)定性,研究人員首先對初始光流分解模塊進(jìn)行訓(xùn)練;隨后將初始光流分解網(wǎng)絡(luò)固定,對圖像重建網(wǎng)絡(luò)進(jìn)行進(jìn)一步訓(xùn)練。在訓(xùn)練過程中,研究人員基于Vimeo-90k數(shù)據(jù)集進(jìn)行了訓(xùn)練數(shù)據(jù)合成,通過隨機(jī)變換與裁剪,結(jié)合反射圖像合成模型來構(gòu)建數(shù)據(jù)集。
在模型構(gòu)建后,為了提升在真實(shí)圖像序列上的性能,研究人員還采用了無監(jiān)督的方法來對最終結(jié)果進(jìn)行在線優(yōu)化:
上面的連續(xù)性損失主要基于這樣的考慮,預(yù)測出的背景和遮擋結(jié)果應(yīng)該可以重新變換回輸入結(jié)果。此外還加入了總變分損失來鼓勵(lì)網(wǎng)絡(luò)盡可能生成自然的圖像。
為了展示這種方法的廣泛適用性,研究人員針對反射、遮擋和雨滴等情況進(jìn)行了實(shí)驗(yàn)。特別需要指出的是,在針對圖像遮擋移除時(shí)模型只需要重建背景層,而無需再對遮擋層進(jìn)行光流和圖像重建。背景重建網(wǎng)絡(luò)只需要增加一個(gè)alpha通道來分割出障礙層。這樣細(xì)微地改造后使得網(wǎng)絡(luò)可以有效處理籬笆金屬網(wǎng)以及雨滴遮擋等問題。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個(gè)字
最新活動(dòng)更多
-
即日-6.16立即報(bào)名>> 【在線會(huì)議】Solution Talks |Computex 2025關(guān)鍵趨勢深讀
-
6月20日立即下載>> 【白皮書】精準(zhǔn)測量 安全高效——福祿克光伏行業(yè)解決方案
-
7月3日立即報(bào)名>> 【在線會(huì)議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會(huì)
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身機(jī)器人動(dòng)力電池技術(shù)應(yīng)用大會(huì)
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語權(quán)
- 3 深度報(bào)告|中國AI產(chǎn)業(yè)正在崛起成全球力量,市場潛力和關(guān)鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級獨(dú)角獸:獲上市公司戰(zhàn)投,干人形機(jī)器人
- 5 國家數(shù)據(jù)局局長劉烈宏調(diào)研格創(chuàng)東智
- 6 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 7 百億AI芯片訂單,瘋狂傾銷中東?
- 8 Robotaxi新消息密集釋放,量產(chǎn)元年誰在領(lǐng)跑?
- 9 格斗大賽出圈!人形機(jī)器人致命短板曝光:頭腦過于簡單
- 10 為何全球AI巨頭都在搶?MCP協(xié)議背后的暴富玄機(jī)大公開!