學(xué)習(xí)使用計(jì)算機(jī)視覺(jué)進(jìn)行人臉檢測(cè)
概述
在本文中,我們將制作一個(gè)人臉檢測(cè)應(yīng)用程序,它將檢測(cè)圖像中的單個(gè)人臉并同時(shí)檢測(cè)多個(gè)人臉,因此,整篇文章將重點(diǎn)介紹使用計(jì)算機(jī)視覺(jué)進(jìn)行人臉檢測(cè)。在這里,我們將使用 HAAR 級(jí)聯(lián)分類(lèi)器進(jìn)行檢測(cè);出于檢測(cè)目的,我們將學(xué)習(xí)檢測(cè)圖像中人臉?biāo)婕暗乃屑夹g(shù)和過(guò)程。
人臉檢測(cè)的應(yīng)用
1. 人臉識(shí)別:人臉識(shí)別是進(jìn)一步做的事情,即在人臉檢測(cè)之后,進(jìn)行人臉識(shí)別。
2. 濾鏡:如今,我們生活在社交媒體的世界里,我們可以看到全球市場(chǎng)上有各種各樣的濾鏡和有趣的應(yīng)用程序;要進(jìn)行此類(lèi)應(yīng)用,我們還需要先檢測(cè)人臉,然后應(yīng)用濾鏡。
3. 人臉解鎖應(yīng)用程序:我們經(jīng)常在手機(jī)中使用此功能,但我們知道,這也需要檢測(cè)人臉。
所以讓我們開(kāi)始吧!
加載必要的庫(kù)
# Import the necessary libraries
import numpy as np
import cv2
import matplotlib.pyplot as plt
%matplotlib inline
加載圖像
# Loading the image to be tested
test_image = cv2.imread('data/baby1.png')
# Here we are converting the colored image into gray image
if(test_image is not None):
test_image_gray = cv2.cvtColor(test_image, cv2.COLOR_BGR2GRAY)
test_image_gray
# Displaying grayscale image
plt.imshow(test_image_gray, cmap='gray')
輸出:
我們很清楚 OpenCV 的檢測(cè)器功能默認(rèn)讀取 BGR 格式的現(xiàn)有圖像,但最終用戶(hù)通常不會(huì)考慮 BGR 格式;因此我們需要將 BGR 格式的圖像轉(zhuǎn)換為 RGB 格式,即彩色圖像,它具有負(fù)責(zé)創(chuàng)建彩色圖像的所有 3 個(gè)通道(R-Red、G-Green、B-Blue)。
因此,我們將創(chuàng)建一個(gè)函數(shù)來(lái)將 BGR 圖像轉(zhuǎn)換為 RGB 圖像。
def convertToRGB(image):
return cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
HAAR 級(jí)聯(lián)文件
HAAR 級(jí)聯(lián)是計(jì)算機(jī)視覺(jué)領(lǐng)域的一個(gè)很好的術(shù)語(yǔ)。當(dāng)我們談?wù)?HAAR 級(jí)聯(lián)分類(lèi)器時(shí),不僅僅是人臉預(yù)訓(xùn)練分類(lèi)器,我們可以得到經(jīng)過(guò)訓(xùn)練來(lái)檢測(cè)微笑、汽車(chē)、公共汽車(chē)的分類(lèi)器,這些級(jí)聯(lián)文件總是采用 XML 文件格式,通常我們使用現(xiàn)有的級(jí)聯(lián)文件,但事實(shí)上我們也可以在這里創(chuàng)建它們,為了簡(jiǎn)單起見(jiàn),我們將使用 HAAR 級(jí)聯(lián)正面人臉?lè)诸?lèi)器來(lái)檢測(cè)圖像中人臉的位置。
加載正面分類(lèi)器
haar_cascade_face = cv2.CascadeClassifier('data/haarcascades/haarcascade_frontalface_alt2.xml')
人臉檢測(cè)
對(duì)于人臉檢測(cè),我們需要從坐標(biāo)中獲取人臉的坐標(biāo),我的意思是 X、Y 坐標(biāo)以及人臉的高度和寬度,然后我們可以在給定的坐標(biāo)下在圖像上繪制一個(gè)矩形,我們有detectMultiScale函數(shù),它將為我們提供所有需要的坐標(biāo)來(lái)規(guī)劃矩形。
face_coordinate = haar_cascade_face.detectMultiScale(test_image_gray, scaleFactor = 1.2, minNeighbors = 5);
# Let us print the no. of faces found
print('Faces found: ', len(face_coordinate))
輸出:
Faces found: 1
所以之前,在使用 detectMultiScale 函數(shù)時(shí),我們獲取了圖像的 x 坐標(biāo)和 y 坐標(biāo)以及高度和寬度,現(xiàn)在我們將使用這些點(diǎn)循環(huán)遍歷圖像的每個(gè)點(diǎn)并在臉部上繪制厚度為 2 個(gè)像素的矩形。
for (x_face,y_face,w_face,h_face) in face_coordinate:
cv2.rectangle(test_image, (x_face, y_face), (x_face+w_face, y_face+h_face), (0, 255, 0), 2)
由于現(xiàn)在已經(jīng)完成了完整的過(guò)程,是時(shí)候檢查我們到目前為止執(zhí)行的所有步驟是否正確,在Matplotlib 的 show 函數(shù)的幫助下,我們將看到處理后的圖像,看看它是否可以檢測(cè)到圖像中的人臉。
#convert image to RGB and show image
plt.imshow(convertToRGB(test_image))
輸出:
自動(dòng)人臉檢測(cè)過(guò)程的函數(shù)
def detect_faces(cascade, test_image, scaleFactor = 1.1):
# Here with the help of copy() function we will hold the copy of the original image
image_copy = test_image.copy()
# Here with the help of cvtColor function we are converting the image from BGR format to gray image
gray_image = cv2.cvtColor(image_copy, cv2.COLOR_BGR2GRAY)
# Finally we are using the haar cascade function with detectMultiscale to get the coordiates of the faces in the given image
faces_rect = cascade.detectMultiScale(gray_image, scaleFactor=scaleFactor, minNeighbors=1)
for (x_face, y_face, w_face, h_face) in faces_rect:
cv2.rectangle(image_copy, (x_face, y_face), (x_face+w_face, y_face+h_face), (0, 255, 0), 2)
return image_copy
代碼分解:在這里,我們構(gòu)建了檢測(cè)人臉的函數(shù);讓我們看看這里發(fā)生了什么:
1. 首先,我們使用copy函數(shù)來(lái)存儲(chǔ)原始圖像,這樣任何不需要的更改都不應(yīng)該存在于原始圖像中
2. 然后我們將BGR 格式的圖像轉(zhuǎn)換為灰度圖像,因?yàn)?cv2 以灰度格式讀取圖像只是為了更好的可讀性。
3. 然后,在 detectMultiScale 函數(shù)的幫助下, 評(píng)論中已經(jīng)提到了這一點(diǎn)。
4. 最后,利用 detectMultiScale 函數(shù)得到的坐標(biāo),繪制出 2 像素厚的綠色矩形
在新圖像上測(cè)試
#loading image
test_image2 = cv2.imread('data/baby2.png')
#call the function to detect faces
faces = detect_faces(haar_cascade_face, test_image2)
#convert to RGB and display image
plt.imshow(convertToRGB(faces))
輸出:
檢測(cè)多個(gè)人臉的測(cè)試
#loading image
test_image2 = cv2.imread('data/group.png')
#call the function to detect faces
faces = detect_faces(haar_cascade_face, test_image2)
#convert to RGB and display image
plt.imshow(convertToRGB(faces))
輸出:
保存圖像
cv2.imwrite('image1.png',faces)
輸出:
True
結(jié)論
1. 因此,在使用計(jì)算機(jī)視覺(jué)進(jìn)行人臉檢測(cè)時(shí),我們首先導(dǎo)入必要的庫(kù)并加載我們需要執(zhí)行人臉檢測(cè)的圖像。
2. 然后我們了解了 HAAR 級(jí)聯(lián)文件和正面分類(lèi)器。除此之外,還學(xué)習(xí)了 detectMultiScale 函數(shù)的使用。
3. 當(dāng)我們意識(shí)到整個(gè)檢測(cè)過(guò)程非常耗時(shí)的時(shí)候,我們嘗試構(gòu)建一個(gè)函數(shù)來(lái)自動(dòng)化這個(gè)過(guò)程。
4. 然后使用函數(shù),我們可以檢測(cè)到圖像的多張人臉。
5. 最后,我們保存了檢測(cè)到的人臉圖像。
因此,以上是使用計(jì)算機(jī)視覺(jué)準(zhǔn)備人臉檢測(cè)應(yīng)用程序時(shí)必須遵循的步驟
原文標(biāo)題 : 學(xué)習(xí)使用計(jì)算機(jī)視覺(jué)進(jìn)行人臉檢測(cè)

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
6月20日立即下載>> 【白皮書(shū)】精準(zhǔn)測(cè)量 安全高效——福祿克光伏行業(yè)解決方案
-
7月3日立即報(bào)名>> 【在線會(huì)議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車(chē)生態(tài)圈峰會(huì)
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身機(jī)器人動(dòng)力電池技術(shù)應(yīng)用大會(huì)
-
免費(fèi)參會(huì)立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
推薦專(zhuān)題
- 1 AI 眼鏡讓百萬(wàn) APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話(huà)語(yǔ)權(quán)
- 3 深度報(bào)告|中國(guó)AI產(chǎn)業(yè)正在崛起成全球力量,市場(chǎng)潛力和關(guān)鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級(jí)獨(dú)角獸:獲上市公司戰(zhàn)投,干人形機(jī)器人
- 5 國(guó)家數(shù)據(jù)局局長(zhǎng)劉烈宏調(diào)研格創(chuàng)東智
- 6 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 7 百億AI芯片訂單,瘋狂傾銷(xiāo)中東?
- 8 Robotaxi新消息密集釋放,量產(chǎn)元年誰(shuí)在領(lǐng)跑?
- 9 格斗大賽出圈!人形機(jī)器人致命短板曝光:頭腦過(guò)于簡(jiǎn)單
- 10 一文看懂視覺(jué)語(yǔ)言動(dòng)作模型(VLA)及其應(yīng)用