CVPR 2020 最佳論文提名 | 神經(jīng)網(wǎng)絡(luò)能否識別鏡像翻轉(zhuǎn)
經(jīng)過圖像處理后,每個循環(huán)群
將變化為
:
命題3里,我們假設(shè)T和J具備交換律,那么我們可以將上面的公式改寫,并得到
:
原分布D不具備視覺手性意味著:每個循環(huán)群
中的元素都有相同的概率出現(xiàn)。因此,由于經(jīng)過J圖像處理后循環(huán)群變?yōu)榱?/p>
,我們只需要證明以下運算為同態(tài)(homomorphism):
因為對于同態(tài)來說,根據(jù)第一同構(gòu)基本定理(First Isomorphism Theorm)可以推理出每個輸出對應(yīng)著相同數(shù)量的輸入。而因為每個循環(huán)群中單個輸入
在原分布D上有著相同的概率,意味著每個輸出
也具備相同的概率,也意味著
不具備視覺手性。證明同態(tài)的步驟如下:
以上為命題3的證明。通過命題3,我們知道了J和T的交換律與處理后圖像分布的視覺手性的關(guān)系。那么,只需要通過檢查交換律,我們便可以判斷圖像處理是否可能產(chǎn)生新的視覺手性。檢查的方式也很簡單,對于任意圖片x,我們只需要計算其交換殘差(commutative residual)是否為0:
下圖形象的解釋了交換殘差的計算過程:
文中使用去馬賽克、JPEG壓縮、以及兩者結(jié)合這三種圖像處理方法,對于鏡像翻轉(zhuǎn)這一圖片變換方式分別計算了交換殘差。
當去馬賽克處理的圖像寬度為奇數(shù)時,處理后的圖像分布可能具備視覺手性;反之如果為偶數(shù),則不具備視覺手性。當JPEG壓縮的圖片不為16整除時,處理后的圖像分布可能具備視覺手性,反之則不具備。當兩者結(jié)合后,處理后的圖片一定具備視覺手性:
作者為了驗證這些結(jié)論,在原本不具備視覺手性的人工數(shù)據(jù)集(高斯分布生成的隨機圖片)上,對不同寬度的圖片分別進行了這三種處理,并使用神經(jīng)網(wǎng)絡(luò)進行了自監(jiān)督學(xué)習。實驗結(jié)果符合這一測試的預(yù)期。因為大量互聯(lián)網(wǎng)圖片都經(jīng)過了去馬賽克和JPEG壓縮,這一結(jié)論意味著數(shù)字圖像處理所帶來的視覺手性現(xiàn)象在互聯(lián)網(wǎng)圖片中廣泛存在。
當加入隨機剪裁(random cropping)后,我們還能得到這一結(jié)論么?作者的答復(fù)是肯定的。
為了理解隨機剪裁對于視覺手性的影響,作者提到了兩個關(guān)鍵點。
第一點:命題三中只討論了單種J的情況。而隨機剪裁可以被視為許多種J(例如
是向右平移一格并剪裁,
是向右平移兩個并剪裁)的結(jié)合,每一種有相同概率出現(xiàn)。
第二點:命題三中并沒有討論T和J不具備交換律的情況。例如當J是向?qū)D片右平移十個像素并進行一次中心剪裁時,T和J無法具備交換律。在這種情況下,新的圖像分布并不一定具備視覺手性。
對于第一點來說,假設(shè)我們有多種不同的J(例如
,
,
),而他們分別與T具備交換律時,我們可以用以下公式表達新的圖像分布:

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 “AI寒武紀”爆發(fā)至今,五類新物種登上歷史舞臺
- 4 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機器人東風翻身?