如何構(gòu)建一個 CNN 模型,以從圖像中對幼苗的種類進行分類?
介紹本文將學習和構(gòu)建一個 CNN 模型,以從圖像中對幼苗的種類進行分類。該數(shù)據(jù)集有12組圖像,我們的最終目的是從圖像中對植物物種進行分類。
我們將執(zhí)行多個步驟,例如導入庫和模塊、讀取圖像并調(diào)整它們的大小、圖像清理、圖像預(yù)處理、模型構(gòu)建、模型訓練、減少過度擬合,最后對測試數(shù)據(jù)集進行預(yù)測。
目錄
問題陳述
導入庫
獲取數(shù)據(jù)并調(diào)整圖像大小
清理圖像并去除背景
將標簽轉(zhuǎn)換為數(shù)字
定義我們的模型并拆分數(shù)據(jù)集
防止過擬合
定義卷積神經(jīng)網(wǎng)絡(luò)
將 CNN 擬合到數(shù)據(jù)上
混淆矩陣
獲得預(yù)測
問題陳述
該數(shù)據(jù)集由奧爾胡斯大學信號處理小組提供。這是一個典型的圖像識別問題陳述。我們提供了一個圖像數(shù)據(jù)集,其中包含處于不同生長階段的植物照片。每張照片都有其唯一的 ID 和文件名。
該數(shù)據(jù)集包含來自 12 個植物物種的 960 種獨特植物。最終目標是構(gòu)建一個能夠從照片中確定植物種類的分類器。
物種列表
Black-grass
Charlock
Cleavers
Common Chickweed
Common wheat
Fat Hen
Loose Silky-bent
Maize
Scentless Mayweed
Shepherds Purse
Small-flowered Cranesbill
Sugar beet
導入庫
首先導入所有必要的庫以供我們進一步分析。我們將使用 NumPy、Pandas、matplotlib、OpenCV、Keras 和 sci-kit-learn。
檢查以下命令以導入所有必需的庫
import numpy as np # MATRIX OPERATIONS
import pandas as pd # EFFICIENT DATA STRUCTURES
import matplotlib.pyplot as plt # GRAPHING AND VISUALIZATIONS
import math # MATHEMATICAL OPERATIONS
import cv2 # IMAGE PROCESSING - OPENCV
from glob import glob # FILE OPERATIONS
import itertools
# KERAS AND SKLEARN MODULES
from keras.utils import np_utils
from keras.preprocessing.image import ImageDataGenerator
from keras.models import Sequential
from keras.layers import Dense
from keras.layers import Dropout
from keras.layers import Flatten
from keras.layers.convolutional import Conv2D
from keras.layers.convolutional import MaxPooling2D
from keras.layers import BatchNormalization
from keras.callbacks import ModelCheckpoint,ReduceLROnPlateau,CSVLogger
from sklearn import preprocessing
from sklearn.model_selection import train_test_split
from sklearn.metrics import confusion_matrix
# GLOBAL VARIABLES
scale = 70
seed = 7
獲取數(shù)據(jù)并調(diào)整圖像大小
為了訓練我們的模型,我們需要先讀取數(shù)據(jù)。我們的數(shù)據(jù)集有不同大小的圖像,因此我們將調(diào)整圖像的大小。讀取數(shù)據(jù)并調(diào)整其大小只需一步即可完成。查看以下代碼以獲取有關(guān)如何執(zhí)行不同操作的完整信息。path_to_images = 'plant-seedlings-classification/train/png'
images = glob(path_to_images)
trainingset = []
traininglabels = []
num = len(images)
count = 1
#READING IMAGES AND RESIZING THEM
for i in images:
print(str(count)+'/'+str(num),end='r')
trainingset.a(chǎn)ppend(cv2.resize(cv2.imread(i),(scale,scale)))
traininglabels.a(chǎn)ppend(i.split('/')[-2])
count=count+1
trainingset = np.a(chǎn)sarray(trainingset)
traininglabels = pd.DataFrame(traininglabels)
清理圖像并去除背景
這是執(zhí)行清理的一個非常重要的步驟。清理圖像是一項艱巨的任務(wù)。我們將執(zhí)行以下步驟以清理圖像
將 RGB 圖像轉(zhuǎn)換為 HSV
為了去除噪聲,我們將不得不模糊圖像
為了刪除背景,我們將不得不創(chuàng)建一個遮罩。new_train = []
sets = []; getEx = True
for i in trainingset:
blurr = cv2.GaussianBlur(i,(5,5),0)
hsv = cv2.cvtColor(blurr,cv2.COLOR_BGR2HSV)
#GREEN PARAMETERS
lower = (25,40,50)
upper = (75,255,255)
mask = cv2.inRange(hsv,lower,upper)
struc = cv2.getStructuringElement(cv2.MORPH_ELLIPSE,(11,11))
mask = cv2.morphologyEx(mask,cv2.MORPH_CLOSE,struc)
boolean = mask>0
new = np.zeros_like(i,np.uint8)
new[boolean] = i[boolean]
new_train.a(chǎn)ppend(new)
if getEx:
plt.subplot(2,3,1);plt.imshow(i) # ORIGINAL
plt.subplot(2,3,2);plt.imshow(blurr) # BLURRED
plt.subplot(2,3,3);plt.imshow(hsv) # HSV CONVERTED
plt.subplot(2,3,4);plt.imshow(mask) # MASKED
plt.subplot(2,3,5);plt.imshow(boolean) # BOOLEAN MASKED
plt.subplot(2,3,6);plt.imshow(new) # NEW PROCESSED IMAGE
plt.show()
getEx = False

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語權(quán)
- 3 深度報告|中國AI產(chǎn)業(yè)正在崛起成全球力量,市場潛力和關(guān)鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級獨角獸:獲上市公司戰(zhàn)投,干人形機器人
- 5 國家數(shù)據(jù)局局長劉烈宏調(diào)研格創(chuàng)東智
- 6 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 7 百億AI芯片訂單,瘋狂傾銷中東?
- 8 Robotaxi新消息密集釋放,量產(chǎn)元年誰在領(lǐng)跑?
- 9 格斗大賽出圈!人形機器人致命短板曝光:頭腦過于簡單
- 10 “搶灘”家用機器人領(lǐng)域,聯(lián)通、海爾、美的等紛紛入局