mmuu55首页日本系列,精品一区中文字幕

PCA和SVM是什么？該如何建立人臉識別模型？

2020-12-31 10:23

讓我們打印出變量：print（＂Total dataset size：＂）
print（＂n＿samples：％d＂， n＿samples）
print（＂n＿features：％d＂， n＿features）
print（＂n＿classes：％d＂， n＿classes）

所以，我們有1288個樣本（圖片），每個樣本總共有1850個特征（50px37px）和7個類（人）。劃分訓練集和測試集接下來，我們使用sklearn．model＿selection將數(shù)據(jù)（X－特征和y－標簽）分為訓練數(shù)據(jù)和測試數(shù)據(jù)，其中25％用于測試，其余75％用于訓練模型。X＿train， X＿test， y＿train， y＿test ＝ train＿test＿split（X， y， test＿size＝0．25， random＿state＝42）
以下是變量X－train、X＿test、y＿train和y＿test：

基于PCA的降維方法現(xiàn)在，我們從 sklearn．decomposition中選擇PCA 以訓練模型。我們已經在第一段代碼中導入了PCA在我們的例子中，我們在訓練集X＿train中總共有966個特征，我們使用PCA（維數(shù)縮減）將它們減少到50個：n＿components ＝ 50
pca ＝ RandomizedPCA（n＿components＝n＿components， whiten＝True）．fit（X＿train）

這個過程需要不到一秒鐘的時間，這可以通過使用時間函數(shù)進行驗證（讓我們暫時跳過它）�，F(xiàn)在我們將重塑PCA組件并定義特征臉，這是在人臉識別的計算機視覺問題中使用的一組特征向量的名稱：eigenfaces ＝ pca．components＿．reshape（（n＿components， h， w））

如截圖所示，特征臉是一個50×50×37的Numpy數(shù)組，50對應于特征的數(shù)量。接下來，我們使用PCA在X＿train 和X＿test 上的transform 函數(shù)來降低維數(shù)。X＿train＿pca ＝ pca．transform（X＿train）
X＿test＿pca ＝ pca．transform（X＿test）

從上面的截圖可以看出，通過PCA算法，X＿train和X＿test的維數(shù)都被降低了，每一個都將特征從1850個減少到50個（正如我們在算法中定義的那樣）。訓練SVM分類器一旦我們完成了降維，就開始分類了。首先，我們將訓練SVM分類模型。我們使用GridSearchCV，這是一個庫函數(shù)，它是一種調整超參數(shù)的方法，它將系統(tǒng)地為網格中指定的算法參數(shù)的每個組合建立和評估模型，并在最佳估計量，參數(shù)在參數(shù)網格中給出：print（＂Fitting the classifier to the training set＂）
param＿grid ＝｛
＇C＇：［1e3， 5e3， 1e4， 5e4， 1e5］，
＇gamma＇：［0．0001， 0．0005， 0．001， 0．005， 0．01， 0．1］，
｝
clf ＝ GridSearchCV（SVC（kernel＝＇rbf＇， class＿weight＝＇balanced＇）， param＿grid）
clf ＝ clf．fit（X＿train＿pca， y＿train）
print（＂Best estimator found by grid search：＂）
print（clf．best＿estimator＿）

我們數(shù)據(jù)的最佳分類器是SVC，參數(shù)如下：SVC（C＝1000， class＿weight ＝ ‘balanced’， gamma＝0．01）預測現(xiàn)在讓我們在測試數(shù)據(jù)上預測這些人的名字，我們使用從GridSearchCV中找到的分類器，它已經在訓練數(shù)據(jù)擬合。print（＂Predicting the people names on the testing set＂）
y＿pred ＝ clf．predict（X＿test＿pca）

分類報告和混淆矩陣一旦預測完成，讓我們打印分類報告，它顯示了模型的精度、召回率、F1分數(shù)和支持分數(shù)，這使我們對分類器的行為有了更深入的直覺。print（classification＿report（y＿test， y＿pred， target＿names＝target＿names））

讓我們打印混淆矩陣：print（confusion＿matrix（y＿test， y＿pred， labels＝range（n＿classes）））

混淆矩陣打印真正例、假正例和假反例的值，并提供分類器的概述。繪圖最后，我們將繪制人物肖像和特征臉！我們將定義兩個函數(shù)：title在測試集的一部分繪制預測結果，plot＿gallery通過繪制它們來評估預測：def title（y＿pred， y＿test， target＿names， i）：
pred＿name ＝ target＿names［y＿pred［i］］．rsplit（＇＇， 1）［－1］
true＿name ＝ target＿names［y＿test［i］］．rsplit（＇＇， 1）［－1］
return ＇predicted：％strue：％s＇％（pred＿name， true＿name）

def plot＿gallery（images， titles， h， w， n＿row＝3， n＿col＝4）：
＂＂＂繪制肖像庫的幫助函數(shù)＂＂＂
plt．figure（figsize＝（1．8 ＊ n＿col， 2．4 ＊ n＿row））
plt．subplots＿adjust（bottom＝0， left＝．01， right＝．99， top＝．90， hspace＝．35）
for i in range（n＿row ＊ n＿col）：
plt．subplot（n＿row， n＿col， i ＋ 1）
plt．imshow（images［i］．reshape（（h， w））， cmap＝plt．cm．gray）
plt．title（titles［i］， size＝12）
plt．xticks（（））
plt．yticks（（））

現(xiàn)在讓我們在測試集的一部分繪制預測結果：prediction＿titles ＝［title（y＿pred， y＿test， target＿names， i）
for i in range（y＿pred．shape［0］）］

plot＿gallery（X＿test， prediction＿titles， h， w）

現(xiàn)在讓我們繪制特征面。我們使用在上面代碼塊中定義的eigenfaces變量。eigenface＿titles ＝［＂eigenface ％d＂％ i for i in range（eigenfaces．shape［0］）］
plot＿gallery（eigenfaces， eigenface＿titles， h， w）
plt．show（）

最后，我們來繪制PCA＋SVM模型用于人臉識別的精度：from sklearn．metrics import accuracy＿score
score ＝ accuracy＿score（y＿test， y＿pred）
print（score）

我們的準確分數(shù)是0．81！雖然這并不是一個完美的分數(shù)，還有很大的改進空間，但PCA和SVM的人臉識別為我們提供了進一步強大算法的起點！結論本文利用PCA和SVM建立了一個人臉識別模型。主成分分析算法被用來減少數(shù)據(jù)的維數(shù)，然后利用支持向量機進行分類，通過超參數(shù)調整尋找最佳估計量。我們對這些肖像進行了分類，準確度得分為0．81。

<上一頁 1 2 3