數(shù)據(jù)格式轉(zhuǎn)化,PyTorch就是救星!
5. RandomRotation
此變換將圖像隨機(jī)旋轉(zhuǎn)一個角度。以度為單位的角度可以作為參數(shù)“degrees”的輸入。
transform = transforms.Compose([transforms.RandomRotation(degrees=180)])
tensor_img = transform(image)
tensor_img
查看上述代碼的轉(zhuǎn)換!
旋轉(zhuǎn)圖像
6. Grayscale
此轉(zhuǎn)換將把原始RGB圖像更改為灰度(即黑白)。你可以提供你想要多少個通道作為參數(shù)“num_output_channels”的輸入。
transform = transforms.Compose([transforms.Grayscale(num_output_channels=1)])
tensor_img = transform(image)
tensor_img
輸出如下所示。
7. GaussianBlur
在這里,圖像將被隨機(jī)選擇的高斯模糊所模糊。必須提供參數(shù)kernel_size。
transform = transforms.Compose([transforms.GaussianBlur(kernel_size=501)])
tensor_img = transform(image)
tensor_img
8. RandomApply
此轉(zhuǎn)換將隨機(jī)應(yīng)用給定的轉(zhuǎn)換列表。
transform = transforms.RandomApply([transforms.RandomSizedCrop(200),transforms.RandomHorizontalFlip()],p=0.6)
tensor_img = transform(image)
9. Compose
在本文中,我們一直在使用Compose() 。為了清楚地定義它,它將幾個變換組合在一起。
transforms.Compose([transforms.Grayscale(1),transforms.CenterCrop(10), transforms.ToTensor()])
一些轉(zhuǎn)換將以所需格式處理數(shù)據(jù)。然而,對于圖像數(shù)據(jù)增強(qiáng),則需要灰度、隨機(jī)水平翻轉(zhuǎn)和隨機(jī)旋轉(zhuǎn)等變換。
10. 函數(shù)變換
在我們學(xué)習(xí)到的所有變換中,你可以注意到參數(shù)是隨機(jī)生成的。這通常足以進(jìn)行數(shù)據(jù)擴(kuò)充。但是,有時(shí)你可能需要對轉(zhuǎn)換管道進(jìn)行更細(xì)粒度的控制。在這種情況下,可以使用函數(shù)變換。在這里,你可以指定或生成所有參數(shù)。一個附加的優(yōu)點(diǎn)是,一個特定定義的函數(shù)變換可以應(yīng)用于多個圖像。
可以從torchvision.transforms.functional訪問所有函數(shù)轉(zhuǎn)換。
現(xiàn)在讓我們深入了解PyTorch提供的不同功能轉(zhuǎn)換。
A) 調(diào)整亮度:adjust_brightness
這主要是調(diào)整圖像的亮度。它以PyTorch張量的形式將圖像作為輸入。它還有一個重要參數(shù)“亮度系數(shù)”。這將表示如何實(shí)際更改亮度。
例如,如果值為1,則會得到與輸入相同的圖像。如果該值大于1,將獲得更亮的圖像。如果它小于1,你會得到一個更暗的圖像?梢韵鄳(yīng)地傳遞浮點(diǎn)值。返回的圖像將是張量或PIL圖像。
new_img = transforms.functional.a(chǎn)djust_brightness(image,brightness_factor=2)
new_img
B) 調(diào)整對比度:adjust_contrast
上面我們看到了如何調(diào)整亮度,這里我們有另一個用于調(diào)整圖像對比度的變換。它需要兩個輸入?yún)?shù):張量形式的圖像和“對比度因子”。第二個參數(shù)將輸入一個浮點(diǎn)值,它將告訴你如何調(diào)整對比度。但不能是負(fù)的。
new_img = transforms.functional.a(chǎn)djust_contrast(image,contrast_factor=3.8)
new_img
C) 調(diào)整色調(diào):adjust_h(yuǎn)ue
色調(diào)是圖像的一個重要屬性。Pytorch允許你通過transforms.functional.a(chǎn)djust_h(yuǎn)ue進(jìn)行調(diào)整。
想知道它是怎么工作的嗎?
首先,圖像將被轉(zhuǎn)換成HSV(色調(diào),飽和度,值)形式。將根據(jù)我們的參數(shù)在H通道中進(jìn)行更改。更改后,圖像將轉(zhuǎn)換為其原始形式。重要的參數(shù)是“色調(diào)因子”。它可以是[-0.5.0.5]范圍內(nèi)的浮點(diǎn)值。嘗試實(shí)現(xiàn)下面的示例。
new_img = transforms.functional.a(chǎn)djust_h(yuǎn)ue(image,hue_factor=0.3)
new_img
D) 調(diào)整飽和度:adjust_saturation
這是為了調(diào)整輸入圖像的顏色飽和度。與上述情況類似,我們有一個“飽和度系數(shù)”參數(shù),它決定了飽和度的變化方式。這將輸入一個浮點(diǎn)值。如果將其設(shè)置為0,則會得到黑白圖像。
new_img = transforms.functional.a(chǎn)djust_saturation(image,saturation_factor=6)
輸出如下圖所示!
E) 調(diào)整銳度:adjust_sharpness
你可以通過此變換調(diào)整圖像的清晰度。它采用浮點(diǎn)值作為“銳度系數(shù)”參數(shù)的輸入。此值可以是除負(fù)值以外的任何值。
在下面的代碼中,我使用了10的銳度因子,這意味著變換后的圖像將是原始圖像的10倍銳度。
new_img = transforms.functional.a(chǎn)djust_sharpness(image,sharpness_factor=10)
檢查輸出!
F) 均衡:equalize
這種變換將均衡圖像的直方圖。
怎么會這樣?
它將對輸入應(yīng)用非線性映射,從而在輸出中創(chuàng)建灰度值的均勻分布。
new_img = transforms.functional.equalize(image)
這些是一些重要的函數(shù)轉(zhuǎn)換,將有助于在圖像預(yù)處理階段。它們也可以組合使用。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
6月20日立即下載>> 【白皮書】精準(zhǔn)測量 安全高效——福祿克光伏行業(yè)解決方案
-
7月3日立即報(bào)名>> 【在線會議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身機(jī)器人動力電池技術(shù)應(yīng)用大會
-
免費(fèi)參會立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會工業(yè)芯片與傳感儀表展
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語權(quán)
- 3 深度報(bào)告|中國AI產(chǎn)業(yè)正在崛起成全球力量,市場潛力和關(guān)鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級獨(dú)角獸:獲上市公司戰(zhàn)投,干人形機(jī)器人
- 5 一文看懂視覺語言動作模型(VLA)及其應(yīng)用
- 6 國家數(shù)據(jù)局局長劉烈宏調(diào)研格創(chuàng)東智
- 7 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 8 百億AI芯片訂單,瘋狂傾銷中東?
- 9 Robotaxi新消息密集釋放,量產(chǎn)元年誰在領(lǐng)跑?
- 10 格斗大賽出圈!人形機(jī)器人致命短板曝光:頭腦過于簡單