如何用Tensorflow框架構(gòu)建用于食品分類的機(jī)器學(xué)習(xí)模型?
摘要
在今天的報(bào)告中,我們將分析食品以預(yù)測(cè)它們是否可以食用。我們應(yīng)用最先進(jìn)的 遷移學(xué)習(xí)方法和 Tensorflow 框架來(lái)構(gòu)建用于食品分類的機(jī)器學(xué)習(xí)模型。
介紹
圖像分類是機(jī)器預(yù)測(cè)圖片屬于哪個(gè)類別的工作。在深度學(xué)習(xí)開(kāi)始蓬勃發(fā)展之前,圖像分類等任務(wù)無(wú)法達(dá)到人類水平。這是因?yàn)闄C(jī)器學(xué)習(xí)模型無(wú)法確定圖像的鄰域知識(shí)。模型只接收像素級(jí)命令。由于深度學(xué)習(xí)的潛力,圖像分類任務(wù)可以利用被描述為卷積神經(jīng)網(wǎng)絡(luò) (CNN) 的模型來(lái)傳遞人類水平的性能。CNN 是一種研究圖像表征的深度學(xué)習(xí)模型。該模型無(wú)需個(gè)人參與即可確定從平面到高級(jí)的特征。該模型不僅接收像素級(jí)別的數(shù)據(jù)。該模型還通過(guò)稱為卷積的機(jī)制從圖像中獲取相鄰數(shù)據(jù)。卷積將通過(guò)將范圍內(nèi)的像素的編譯相乘并將它們相加為一個(gè)值來(lái)聚合鄰域數(shù)據(jù)。ML 模型將接受這些特征以將圖片分類為一組。深度學(xué)習(xí)雖然可以完成人類級(jí)別的生產(chǎn),但需要大量的數(shù)據(jù)。
如果我們沒(méi)有它們?cè)趺崔k?我們可以應(yīng)用一種稱為遷移學(xué)習(xí)的理論。
遷移學(xué)習(xí)是一種在海量數(shù)據(jù)上為我們的查詢訓(xùn)練模型的技術(shù)。因此,我們僅通過(guò)微調(diào)模型來(lái)準(zhǔn)備它們。我們將注意到的優(yōu)勢(shì)是模型將在一段時(shí)間內(nèi)學(xué)會(huì)。本文將幫助你練習(xí)使用 TensorFlow (Python) 進(jìn)行食品圖像分類的遷移學(xué)習(xí)。因?yàn)轭A(yù)處理步驟是基本過(guò)程,我還將解釋如何將數(shù)據(jù)提供給我們的深度學(xué)習(xí)模型。
執(zhí)行
步驟1:導(dǎo)入庫(kù)
我們要求做的第一步是導(dǎo)入庫(kù)。我們想要 TensorFlow、NumPy、os 和 pandas。如果你還沒(méi)有修復(fù)包,你可以應(yīng)用 pip 命令來(lái)安裝所需的庫(kù)。請(qǐng)注意,我命令使用的 TensorFlow 是 2.4.1 版本,因此請(qǐng)安裝該版本。另外,如果你希望采用 GPU 來(lái)訓(xùn)練深度學(xué)習(xí)模型,請(qǐng)安裝 11.0 版的 CUDA,因?yàn)樵摪姹景?2.4.1 版的 TensorFlow。
下面是安裝和加載所需庫(kù)的代碼。# ! pip install tensorflow==2.4.1
# ! pip install pandas
# ! pip install numpy
import os
import numpy as np
import pandas as pd
import tensorflow as tf
步驟2:準(zhǔn)備數(shù)據(jù)
安排好庫(kù)后,下一步是修復(fù)我們的數(shù)據(jù)集。在此示例中,我們將應(yīng)用名為Food-5K的數(shù)據(jù)集。https://www.kaggle.com/binhminhs10/food5k該數(shù)據(jù)集由 5000 張圖片組成,分為兩類,即食物和非食物。FOOD-5K 分為訓(xùn)練、驗(yàn)證和測(cè)試數(shù)據(jù)集。數(shù)據(jù)集文件夾的格式如下:
正如你在上面看到的,每個(gè)文件夾都由圖片組成。每個(gè)圖片文件名包括類別和由下劃線分隔的標(biāo)識(shí)符。我們需要產(chǎn)生帶有圖像文件名的列和帶有該文件夾排列的標(biāo)簽的數(shù)據(jù)框。修復(fù)數(shù)據(jù)集的代碼如下所示,def dframe(dtype):
X = []
y = []
path = 'Food-5K/' + dtype + '/'
for i in os.listdir(path):
# Image
X.a(chǎn)ppend(i)
# Label
y.a(chǎn)ppend(i.split('_')[0])
X = np.a(chǎn)rray(X)
y = np.a(chǎn)rray(y)
df = pd.DataFrame()
df['filename'] = X
df['label'] = y
return df
df_train = dframe('training')
df_val = dframe('validation')
df_test = dframe('evaluation')
df_train.head()

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
-
機(jī)器人奧運(yùn)會(huì)戰(zhàn)報(bào):宇樹機(jī)器人摘下首金,天工Ultra搶走首位“百米飛人”
-
存儲(chǔ)圈掐架!江波龍起訴佰維,索賠121萬(wàn)
-
長(zhǎng)安汽車母公司突然更名:從“中國(guó)長(zhǎng)安”到“辰致科技”
-
豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
-
字節(jié)AI Lab負(fù)責(zé)人李航卸任后返聘,Seed進(jìn)入調(diào)整期
-
員工持股爆雷?廣汽埃安緊急回應(yīng)
-
中國(guó)“智造”背后的「關(guān)鍵力量」
-
小米汽車研發(fā)中心重磅落地,寶馬家門口“搶人”
最新活動(dòng)更多
-
即日-9.16點(diǎn)擊進(jìn)入 >> 【限時(shí)福利】TE 2025國(guó)際物聯(lián)網(wǎng)展·深圳站
-
10月23日火熱報(bào)名中>> 2025是德科技創(chuàng)新技術(shù)峰會(huì)
-
10月23日立即報(bào)名>> Works With 開(kāi)發(fā)者大會(huì)深圳站
-
10月24日立即參評(píng)>> 【評(píng)選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評(píng)選
-
11月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
12月18日立即報(bào)名>> 【線下會(huì)議】OFweek 2025(第十屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
推薦專題
- 1 先進(jìn)算力新選擇 | 2025華為算力場(chǎng)景發(fā)布會(huì)暨北京xPN伙伴大會(huì)成功舉辦
- 2 人形機(jī)器人,正狂奔在批量交付的曠野
- 3 宇樹機(jī)器人撞人事件的深度剖析:六維力傳感器如何成為人機(jī)安全的關(guān)鍵屏障
- 4 解碼特斯拉新AI芯片戰(zhàn)略 :從Dojo到AI5和AI6推理引擎
- 5 AI版“四萬(wàn)億刺激”計(jì)劃來(lái)了
- 6 2025年8月人工智能投融資觀察
- 7 8 a16z最新AI百?gòu)?qiáng)榜:硅谷頂級(jí)VC帶你讀懂全球生成式AI賽道最新趨勢(shì)
- 9 Manus跑路,大廠掉線,只能靠DeepSeek了
- 10 地平線的野心:1000萬(wàn)套HSD上車