一文了解Siamese network
前言:
本文介紹了Siamese (連體)網(wǎng)絡(luò)的主要特點(diǎn)、訓(xùn)練和測(cè)試Siamese網(wǎng)絡(luò)的步驟、Siamese網(wǎng)絡(luò)的應(yīng)用場(chǎng)合、Siamese網(wǎng)絡(luò)的優(yōu)缺點(diǎn)、為什么Siamese被稱(chēng)為One-shot分類(lèi),以及Siamese的損失函數(shù)。
更多內(nèi)容請(qǐng)關(guān)注公眾號(hào)CV技術(shù)指南,專(zhuān)注于計(jì)算機(jī)視覺(jué)的技術(shù)總結(jié),最新技術(shù)跟蹤。
Siamese Network的主要特點(diǎn)
1. Siamese 網(wǎng)絡(luò)采用兩個(gè)不同的輸入,通過(guò)兩個(gè)具有相同架構(gòu)、參數(shù)和權(quán)重的相似子網(wǎng)絡(luò)。
2. 這兩個(gè)子網(wǎng)互為鏡像,就像連體雙胞胎一樣。 因此,對(duì)任何子網(wǎng)架構(gòu)、參數(shù)或權(quán)重的任何更改也適用于其他子網(wǎng)。
3. 兩個(gè)子網(wǎng)絡(luò)輸出一個(gè)編碼來(lái)計(jì)算兩個(gè)輸入之間的差異。
4. Siamese 網(wǎng)絡(luò)的目標(biāo)是使用相似度分?jǐn)?shù)對(duì)兩個(gè)輸入是相同還是不同進(jìn)行分類(lèi)?梢允褂枚徊骒亍(duì)比函數(shù)或三元組損失來(lái)計(jì)算相似度分?jǐn)?shù),這些都是用于一般距離度量學(xué)習(xí)方法的技術(shù)。
5. Siamese 網(wǎng)絡(luò)是一種one-shot分類(lèi)器,它使用判別特征從未知分布中概括不熟悉的類(lèi)別。
訓(xùn)練 Siamese 神經(jīng)網(wǎng)絡(luò)
1. 加載包含不同類(lèi)的數(shù)據(jù)集
2. 創(chuàng)建正負(fù)數(shù)據(jù)對(duì)。 當(dāng)兩個(gè)輸入相同時(shí)為正數(shù)據(jù)對(duì),當(dāng)兩個(gè)輸入不同時(shí)為負(fù)數(shù)據(jù)對(duì)。
3. 構(gòu)建卷積神經(jīng)網(wǎng)絡(luò),它使用全連接層輸出特征編碼。我們將通過(guò)姊妹 CNN傳遞兩個(gè)輸入。姐妹 CNN 應(yīng)該具有相同的架構(gòu)、超參數(shù)和權(quán)重。
4. 構(gòu)建差分層以計(jì)算兩個(gè)姐妹 CNN 網(wǎng)絡(luò)編碼輸出之間的歐幾里得距離。
5. 最后一層是具有單個(gè)節(jié)點(diǎn)的全連接層,使用 sigmoid 激活函數(shù)輸出相似度分?jǐn)?shù)。
6. 使用二元交叉熵作為損失函數(shù)。
測(cè)試 Siamese 神經(jīng)網(wǎng)絡(luò)
1. 向訓(xùn)練模型發(fā)送兩個(gè)輸入以輸出相似度分?jǐn)?shù)。
2. 由于最后一層使用 sigmoid 激活函數(shù),它輸出一個(gè)范圍在 0 到 1 之間的值。接近 1 的相似度得分意味著兩個(gè)輸入是相似的。接近 0 的相似度得分意味著兩個(gè)輸入不相似。一個(gè)好的經(jīng)驗(yàn)法則是使用 0.5 的相似性截止閾值。
Siamese 神經(jīng)網(wǎng)絡(luò)的應(yīng)用
1. 簽名驗(yàn)證
2. 面部識(shí)別
3. 比較指紋
4. 根據(jù)臨床分級(jí)評(píng)估疾病嚴(yán)重程度
5. 工作資料的文本相似度以恢復(fù)匹配
6. 用于配對(duì)相似問(wèn)題的文本相似度
為什么Siamese神經(jīng)網(wǎng)絡(luò)被稱(chēng)為one-shot分類(lèi)?
1. one-shot分類(lèi)模型僅使用每個(gè)新類(lèi)別的單個(gè)訓(xùn)練樣本即可正確進(jìn)行預(yù)測(cè)。
2. Siamese 網(wǎng)絡(luò)使用有監(jiān)督的訓(xùn)練方法來(lái)學(xué)習(xí)通用輸入特征,然后根據(jù)訓(xùn)練數(shù)據(jù)對(duì)未知的類(lèi)分布進(jìn)行預(yù)測(cè)。
3. 受過(guò)訓(xùn)練的 Siamese 網(wǎng)絡(luò)使用一次性學(xué)習(xí)來(lái)預(yù)測(cè)兩個(gè)輸入之間的相似性或不相似性,即使這些新分布中的樣本很少。
Siamese 網(wǎng)絡(luò)的優(yōu)點(diǎn)
1. Siamese 網(wǎng)絡(luò)是一種one-shot分類(lèi)模型,只需一個(gè)訓(xùn)練樣本即可進(jìn)行預(yù)測(cè)。
2. 對(duì)類(lèi)別不平衡更魯棒,因?yàn)樗枰苌俚男畔ⅰ?它可以用于某些類(lèi)的樣本很少的數(shù)據(jù)集。
3. Siamese 網(wǎng)絡(luò)的one-shot學(xué)習(xí)特性不依賴(lài)于特定領(lǐng)域的知識(shí),而是利用了深度學(xué)習(xí)技術(shù)。
Siamese 網(wǎng)絡(luò)的缺點(diǎn)
僅輸出相似性分?jǐn)?shù)而不輸出概率。:互斥事件的概率總和為 1。而距離不限于小于或等于 1。
為什么姐妹網(wǎng)絡(luò)一定要一樣?
兩個(gè)姐妹卷積網(wǎng)絡(luò)((sister convolutional network))的模型架構(gòu)、超參數(shù)和權(quán)重必須相同。 它確保它們各自的網(wǎng)絡(luò)不會(huì)將兩個(gè)極其相似的圖像映射到非常不同的特征空間,因?yàn)槊總(gè)網(wǎng)絡(luò)計(jì)算相同的函數(shù)。
Siamese 網(wǎng)絡(luò)使用的損失函數(shù)
1. Siamese 網(wǎng)絡(luò)使用相似度分?jǐn)?shù)來(lái)預(yù)測(cè)兩個(gè)輸入是相似還是不同,使用度量學(xué)習(xí)方法,該方法找到其輸入之間的相對(duì)距離。
2. 可以使用二元交叉熵、對(duì)比函數(shù)或三重?fù)p失計(jì)算相似度分?jǐn)?shù)。
3. Siamese 網(wǎng)絡(luò)執(zhí)行二元分類(lèi),將輸入分類(lèi)為相似或不相似;因此,默認(rèn)使用二元交叉熵?fù)p失函數(shù)。
對(duì)比損失函數(shù)
1. 對(duì)比損失函數(shù)通過(guò)對(duì)比兩個(gè)輸入來(lái)區(qū)分相似和不同的圖像。當(dāng)你在訓(xùn)練時(shí)不了解所有類(lèi)別并且訓(xùn)練數(shù)據(jù)有限時(shí),它會(huì)有所幫助。它創(chuàng)建了一種數(shù)據(jù)編碼,可以在將來(lái)有新類(lèi)時(shí)使用。
2. 對(duì)比損失需要一對(duì)正負(fù)訓(xùn)練數(shù)據(jù)。 正對(duì)包含一個(gè)anchor樣本和一個(gè)正樣本,負(fù)對(duì)包含一個(gè)anchor樣本和一個(gè)負(fù)樣本。
3. 對(duì)比損失函數(shù)的目標(biāo)是使正對(duì)具有較小的距離,對(duì)負(fù)對(duì)具有較大的距離。
在上面的等式中,當(dāng)輸入來(lái)自同一類(lèi)時(shí),Y 為 0;否則,Y 的值為 1。
m 是定義半徑的余量,以指示超出此余量的不同對(duì)不會(huì)造成損失,并且始終大于 0。
Dw 是姐妹 siamese 網(wǎng)絡(luò)輸出之間的歐幾里得距離。
Triplet Loss
在 Triplet loss 中,我們使用數(shù)據(jù)的三元組而不是二元對(duì)。 三元組由anchor、正樣本和負(fù)樣本組成,主要用于面部識(shí)別。
在 Triplet loss 中,anchor和正樣本編碼之間的距離被最小化,而anchor和負(fù)樣本編碼之間的距離被最大化。
Triplet loss 將 d(a,p) 推到 0 ,并且 d(a,n) 大于 d(a,p)+margin
結(jié)論
Siamese 網(wǎng)絡(luò)受到 Siamese twins 的啟發(fā),是一種one-shot分類(lèi),用于區(qū)分相似和不同的圖像。 即使不知道所有訓(xùn)練時(shí)的類(lèi)別并且訓(xùn)練數(shù)據(jù)有限,它也可以應(yīng)用。 Siamese 網(wǎng)絡(luò)基于度量學(xué)習(xí)方法,該方法使用二元交叉熵或?qū)Ρ葥p失或三重?fù)p失找到其輸入之間的相對(duì)距離。
在公眾號(hào)中回復(fù)關(guān)鍵字 “技術(shù)總結(jié)” 可獲取以下文章的匯總pdf。
更多內(nèi)容請(qǐng)關(guān)注公眾號(hào)CV技術(shù)指南,專(zhuān)注于計(jì)算機(jī)視覺(jué)的技術(shù)總結(jié),最新技術(shù)跟蹤。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車(chē)電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車(chē)】汽車(chē)E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書(shū)】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專(zhuān)題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開(kāi)始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類(lèi)新物種登上歷史舞臺(tái)
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來(lái)商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽(yáng)光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開(kāi)成長(zhǎng)空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?