亚洲国产成人久久综合一,久久久中文字幕日本99,99re热在线视频

人臉識別：使用Scikit-Learn構(gòu)建人臉識別系統(tǒng)

2021-12-07 14:40

磐創(chuàng)AI

關(guān)注

什么是人臉識別

人臉識別是將未知個體的人臉與存儲記錄數(shù)據(jù)庫中的圖像進行比較的任務(wù)。映射可以是一對一或一對多，這取決于我們是在運行人臉驗證還是人臉識別。

在本教程中，我們感興趣的是構(gòu)建一個面部識別系統(tǒng)，該系統(tǒng)將驗證圖像（通常稱為探測圖像）是否存在于預(yù)先存在的面部數(shù)據(jù)庫（通常稱為評估集）中。

直覺

建立這樣一個系統(tǒng)涉及四個主要步驟：

1．檢測圖像中的人臉可用的人臉檢測模型包括MTCNN、FaceNet、Dlib等。

2．裁剪和對齊人面OpenCV庫提供了此步驟所需的所有工具。

3．查找每個面的向量表示由于程序不能直接處理jpg或png文件，我們需要某種方法將圖像轉(zhuǎn)換為數(shù)字。在本教程中，我們將使用Insightface模型為人臉創(chuàng)建多維（512－d）嵌入，從而封裝與人臉相關(guān)的有用語義信息。要使用單個庫處理所有三個步驟，我們將使用insightface。特別是，我們將使用Insightface的ArcFace模型。InsightFace是一個開源的深度人臉分析模型，用于人臉識別、人臉檢測和人臉對齊任務(wù)。

4．比較嵌入一旦我們將每個唯一的人臉轉(zhuǎn)換成一個向量，比較特征就歸結(jié)為比較相應(yīng)的嵌入。我們將利用這些嵌入來訓(xùn)練scikit－learn模型。

另外，如果你想繼續(xù)，代碼可以在Github上找到：https：／／github．com／V－Sher／Face－Search。

安裝程序

創(chuàng)建虛擬環(huán)境（可選）：python3 －m venv face＿search＿env

激活此環(huán)境：source face＿search＿env／bin／activate

此環(huán)境中的必要安裝：pip install mxnet＝＝1．8．0．post0

pip install －U insightface＝＝0．2．1

pip install onnx＝＝1．10．1

pip install onnxruntime＝＝1．8．1

更重要的是，完成pip安裝insightface后：從onedrive下載antelope模型版本。（它包含兩個預(yù)訓(xùn)練的檢測和識別模型）。把它放在＊～／．insightface／models／下，所以在～／．insightface／models／antelope．onnx＊上有onnx模型。這是正確完成設(shè)置后的外觀：

如果你查看antelope目錄，你會發(fā)現(xiàn)用于人臉檢測和識別的兩個onnx模型：

注意：自從上周insightface 0．4．1的最新版本發(fā)布以來，安裝并不像我希望的那樣簡單（至少對我來說）。因此，我將在本教程中使用0．2．1。

將來，我將相應(yīng)地更新Github上的代碼。

如果你被卡住了，請看這里的說明。數(shù)據(jù)集我們將使用Kaggle上提供的Yale人臉數(shù)據(jù)集，該數(shù)據(jù)集包含15個人的大約165張灰度圖像（即每個人大概11張唯一圖像）。

這些圖像由各種表情、姿勢和照明組成。獲得數(shù)據(jù)集后，繼續(xù)將其解壓縮到項目中新創(chuàng)建的數(shù)據(jù)目錄中（請參閱Github上的項目目錄結(jié)構(gòu)）

開始如果你想繼續(xù)，可以在Github上找到Jupyter筆記本：https：／／github．com／V－Sher／Face－Search／blob／main／notebooks／face－search－yale．ipynb。導(dǎo)入import os

import pickle

import numpy as np

from PIL import Image

from typing import List

from tqdm import tqdm

from insightface．a(chǎn)pp import FaceAnalysis

from sklearn．neighbors import NearestNeighbors

加載Insightface模型安裝insightface后，我們必須調(diào)用app＝FaceAnalysis（name＝＂model＿name＂）來加載模型。由于我們將onnx模型存儲在antelope目錄中：app ＝ FaceAnalysis（name＝＂antelope＂）

app．prepare（ctx＿id＝0， det＿size＝（640， 640））

生成Insightface嵌入使用insightface模型為圖像生成嵌入非常簡單。例如：＃為圖像生成嵌入

img＿emb＿results ＝ app．get（np．a(chǎn)sarray（img））

img＿emb ＝ img＿emb＿results［0］．embedding

img＿emb．shape
－－－－－－－－－－－－OUTPUT－－－－－－－－－－－－－－－

（512，）

數(shù)據(jù)集在使用此數(shù)據(jù)集之前，我們必須修復(fù)目錄中文件的擴展名，使文件名以．gif結(jié)尾。（或．jpg、．png等）。例如，以下代碼段將文件名subject01．glasses更改為subject01＿glasses．gif。＃修復(fù)擴展名

YALE＿DIR ＝＂．．／data／yalefaces＂

files ＝ os．listdir（YALE＿DIR）［1：］

for i， img in enumerate（files）：

＃ print（＂original name：＂， img）

new＿ext＿name ＝＂＿＂．join（img．split（＂．＂））＋＂．gif＂

＃ print（＂new name：＂， new＿ext＿name）

os．rename（os．path．join（YALE＿DIR， img）， os．path．join（YALE＿DIR， new＿ext＿name））

接下來，我們將數(shù)據(jù)分為評估集和探測集：每個受試者90％或10張圖像將成為評估集的一部分，每個受試者剩余的10％或1張圖像將用于探測集中。為了避免采樣偏差，將使用名為create＿probe＿eval＿set的輔助函數(shù)隨機選擇每個對象的探測圖像。它將包含屬于特定主題的11個圖像（文件名）的列表作為輸入，并返回長度為1和10的兩個列表。前者包含用于探測集的文件名，而后者包含用于評估集的文件名。def create＿probe＿eval＿set（files： List）：

＃選擇0和len（files）－1之間的隨機索引

random＿idx ＝ np．random．randint（0，len（files））

probe＿img＿fpaths ＝［files［random＿idx］］

eval＿img＿fpaths ＝［files［idx］ for idx in range（len（files）） if idx �。� random＿idx］

return probe＿img＿fpaths， eval＿img＿fpaths

生成嵌入create＿probe＿eval＿set返回的兩個列表都按順序送到名為generate＿embs的助手函數(shù)。對于列表中的每個文件名，它讀取灰度圖像，將其轉(zhuǎn)換為RGB，計算相應(yīng)的嵌入，最后返回嵌入以及圖像標簽。def generate＿embs（img＿fpaths： List［str］）

embs＿set ＝ list（）

embs＿label ＝ list（）

for img＿fpath in img＿fpaths：

＃讀取灰度圖
img ＝ Image．open（os．path．join（YALE＿DIR， img＿fpath））
img＿arr ＝ np．a(chǎn)sarray（img）
＃將灰度轉(zhuǎn)換為RGB
im ＝ Image．fromarray（（img＿arr ＊ 255）．a(chǎn)stype（np．uint8））
rgb＿arr ＝ np．a(chǎn)sarray（im．convert（＇RGB＇））
＃生成Insightface嵌入
res ＝ app．get（rgb＿arr）
＃將emb添加到eval set
embs＿set．a(chǎn)ppend（res）
＃添加標簽到eval＿label set
embs＿label．a(chǎn)ppend（img＿fpath．split（＂＿＂）［0］）

return embs＿set， embs＿label

現(xiàn)在我們有了一個生成嵌入的框架，讓我們繼續(xù)使用generate＿embs（）為探測和評估集創(chuàng)建嵌入。＃排序文件

files ＝ os．listdir（YALE＿DIR）

files．sort（）

eval＿set ＝ list（）

eval＿labels ＝ list（）

probe＿set ＝ list（）

probe＿labels ＝ list（）

IMAGES＿PER＿IDENTITY ＝ 11

for i in tqdm（range（1， len（files）， IMAGES＿PER＿IDENTITY）， unit＿divisor＝True）：＃忽略在files［0］的README．txt文件

＃ print（i）

probe， eval ＝ create＿probe＿eval＿set（files［i：i＋IMAGES＿PER＿IDENTITY］）

＃存儲eval embs和標簽

eval＿set＿t， eval＿labels＿t ＝ generate＿embs（eval）

eval＿set．extend（eval＿set＿t）

eval＿labels．extend（eval＿labels＿t）

＃存儲探測embs和標簽

probe＿set＿t， probe＿labels＿t ＝ generate＿embs（probe）

probe＿set．extend（probe＿set＿t）

probe＿labels．extend（probe＿labels＿t）

需要考慮的幾件事：os．listdir返回的文件是完全隨機的，因此第3行的排序很重要。不帶排序和帶排序的os．listdir輸出：

［可選］如果我們使用sklearn提供的分層訓(xùn)練測試功能，我們本可以替換create＿probe＿eval＿set函數(shù)，去掉forloop，并簡化上述代碼段中的幾行。然而，在本教程中，我將清晰性置于代碼簡單性之上。通常情況下，insightface無法檢測到人臉，并隨后為其生成空嵌入。這解釋了為什么probe＿setor eval＿set列表中的某些條目可能為空。重要的是我們要過濾掉它們，只保留非空值。為此，我們創(chuàng)建了另一個名為filter＿empty＿embs的助手函數(shù)：def filter＿empty＿embs（img＿set： List， img＿labels： List［str］）：

＃在insightface無法生成嵌入的地方過濾filtering where insightface could not generate an embedding

good＿idx ＝［i for i，x in enumerate（img＿set） if x］

if len（good＿idx）＝＝ len（img＿set）：
clean＿embs ＝［e［0］．embedding for e in img＿set］
clean＿labels ＝ img＿labels
else：
＃保留good＿idx
clean＿labels ＝ np．a(chǎn)rray（img＿labels）［good＿idx］
clean＿set ＝ np．a(chǎn)rray（img＿set， dtype＝object）［good＿idx］
＃生成embs
clean＿embs ＝［e［0］．embedding for e in clean＿set］

return clean＿embs， clean＿labels

它將圖像集（probe＿set或eval＿set）作為輸入，并刪除insightface無法生成嵌入的元素（參見第6行）。隨后，它還會更新標簽（probe＿labels或eval＿labels）（請參見第7行），以使集合和標簽具有相同的長度。最后，對于評估集和探測集中，我們可以獲得512維嵌入：evaluation＿embs， evaluation＿labels ＝ filter＿empty＿embs（eval＿set， eval＿labels）

probe＿embs， probe＿labels ＝ filter＿empty＿embs（probe＿set， probe＿labels）

assert len（evaluation＿embs）＝＝ len（evaluation＿labels）

assert len（probe＿embs）＝＝ len（probe＿labels）

有了這兩套設(shè)備，我們現(xiàn)在可以使用Sklearn庫中實現(xiàn)的一種流行的無監(jiān)督學(xué)習(xí)方法來構(gòu)建人臉識別系統(tǒng)。創(chuàng)建人臉識別系統(tǒng)我們使用．fit訓(xùn)練最近鄰模型，評估嵌入為X。這是一種用于無監(jiān)督最近鄰學(xué)習(xí)的簡潔技術(shù)。注：一般來說，距離可以是任何度量單位，如歐幾里德、曼哈頓、余弦、閔可夫斯基等。＃最近鄰學(xué)習(xí)方法

nn ＝ NearestNeighbors（n＿neighbors＝3， metric＝＂cosine＂）

nn．fit（X＝evaluation＿embs）

＃保存模型到磁盤

filename ＝＇faceID＿model．pkl＇

with open（filename，＇wb＇） as file：

pickle．dump（nn， file）

＃過了一段時間…

＃從磁盤加載模型

＃ with open（filename，＇rb＇） as file：

＃ pickle＿model ＝ pickle．load（file）

因為我們正在實施一種無監(jiān)督的學(xué)習(xí)方法，請注意，我們沒有將任何標簽傳遞給fit方法，即評估標簽。我們在這里所做的就是將評估集中的人臉嵌入映射到一個潛在空間中。為什么？？簡單回答：通過提前將訓(xùn)練集存儲在內(nèi)存中，我們可以在推理過程中加快搜索最近鄰的速度。它是如何做到這一點的？簡單回答：在內(nèi)存中以優(yōu)化的方式存儲樹是非常有用的，尤其是當(dāng)訓(xùn)練集很大并且搜索新點的鄰居時，計算成本會很高�；卩徲虻姆椒ū环Q為非泛化機器學(xué)習(xí)方法，因為它們只是“記住”其所有訓(xùn)練數(shù)據(jù)推理對于每個新的探測圖像，我們可以通過使用nn．neights方法搜索其前k個鄰域來確定它是否存在于評估集中。例如，＃測試圖像的實例推理

dists， inds ＝ nn．kneighbors（X ＝ probe＿img＿emb．reshape（1，－1），
n＿neighbors ＝ 3，
return＿distances ＝ True
）

如果評估集中返回索引（IND）處的標簽與圖像的原始／真實標簽完全匹配，則我們知道我們在驗證系統(tǒng)中找到了自己的臉。我們已經(jīng)將上述邏輯包裝到print＿ID＿results方法中。它將探測圖像路徑、評估集標簽和詳細標志作為輸入，以指定是否應(yīng)顯示詳細結(jié)果。def print＿ID＿results（img＿fpath： str， evaluation＿labels： np．ndarray， verbose： bool ＝ False）：

img ＝ Image．open（img＿fpath）

img＿emb ＝ app．get（np．a(chǎn)sarray（img））［0］．embedding

＃從KNN獲取預(yù)測

dists， inds ＝ nn．kneighbors（X＝img＿emb．reshape（1，－1）， n＿neighbors＝3， return＿distance＝True）

＃獲取鄰居的標簽

pred＿labels ＝［evaluation＿labels［i］ for i in inds［0］］

＃檢查dist是否大于0．5，如果是，打印結(jié)果

no＿of＿matching＿faces ＝ np．sum（［1 if d ＜＝0．6 else 0 for d in dists［0］］）

if no＿of＿matching＿faces ＞ 0：
print（＂Matching face（s） found in database！＂）
verbose ＝ True

else：
print（＂No matching face（s） not found in database！＂）
＃打印標簽和相應(yīng)的距離

if verbose：
for label， dist in zip（pred＿labels， dists［0］）：

print（f＂Nearest neighbours found in the database have labels ｛label｝ and is at a distance of ｛dist｝＂）
這里需要注意的幾個重要事項：IND包含評估標簽集中最近鄰的索引（第6行）。例如，inds＝［［2，0，11］］意味著評估中索引＝2處的標簽被發(fā)現(xiàn)最靠近探測圖像，然后是索引＝0處的標簽。因為對于任何圖像，nn．neighbors都會返回非空響應(yīng)。我們要過濾一些，如果返回的距離小于或等于0．6（行12），我們只考慮這些結(jié)果。（請注意，0．6的選擇完全是任意的）。例如，繼續(xù)上面的例子，其中Inds＝［［2，0，11 ］］和例子＝［［ 0．4，0．6，0．9 ］］，我們將只考慮在索引＝2和索引＝0，因為最后一個鄰居的距離太大。作為一個快速的健康檢查，讓我們看看當(dāng)我們輸入嬰兒的臉作為探測圖像時系統(tǒng)的響應(yīng)。正如所料，它顯示沒有找到匹配的臉！但是，我們將verbose設(shè)置為True，因此我們可以在數(shù)據(jù)庫中看到其偽近鄰的標簽和距離，所有這些都非常大（＞0．8）。

人臉識別系統(tǒng)的評價測試此系統(tǒng)是否良好的方法之一是查看前k個鄰居中存在多少相關(guān)結(jié)果。相關(guān)結(jié)果是真實標簽與預(yù)測標簽匹配的結(jié)果。該度量通常稱為k處的精確度，其中k是預(yù)先確定的。例如，從探測集中選擇一個圖像（或者更確切地說是一個嵌入），其真實標簽為“subject01”。如果nn．Neighers為該圖像返回的前兩個pred＿labels為［＇subject01＇，＇subject01＇］，則表示k處的精度（p＠k）k＝2時為100％。類似地，如果pred＿labels中只有一個值等于“subject05”，p＠k將是50％，依此類推…dists， inds ＝ nn．kneighbors（X＝probe＿embs＿example．reshape（1，－1），

n＿neighbors＝2，

return＿distance＝True）

pred＿labels ＝［evaluation＿labels［i］ for i in inds［0］］

pred＿labels

－－－－－ OUTPUT －－－－－－

［＇002＇，＇002＇］

讓我們繼續(xù)計算整個探測集上p＠k的平均值：＃探測集上的推理

dists， inds ＝ nn．kneighbors（X＝probe＿embs， n＿neighbors＝2， return＿distance＝True）

＃計算平均p＠k

p＿at＿k ＝ np．zeros（len（probe＿embs））

for i in range（len（probe＿embs））：

true＿label ＝ probe＿labels［i］