訂閱
糾錯
加入自媒體

了解使用AugLy的數(shù)據(jù)增強

介紹

機器學(xué)習和深度學(xué)習模型的一個常見問題是“過度擬合”。這意味著模型在訓(xùn)練數(shù)據(jù)集上的準確性非常高,但在測試數(shù)據(jù)上卻沒有較高的準確性。

為了解決過擬合問題,我們可以增加數(shù)據(jù)集的大小,即將模型暴露于新數(shù)據(jù)以獲得更好的泛化。額外的數(shù)據(jù)并不總是可用的,收集起來可能具有挑戰(zhàn)性,而且耗時且昂貴。在這種情況下,數(shù)據(jù)科學(xué)家使用稱為“數(shù)據(jù)增強 (DA)”的過程。

使用數(shù)據(jù)增強,我們可以通過幾種增強技術(shù)來擴展真實數(shù)據(jù)的大小。此過程在具有較小數(shù)據(jù)集和過擬合的模型的項目中是有益的。數(shù)據(jù)增強有助于提高模型的準確性。

機器學(xué)習和深度學(xué)習模型可以使用數(shù)據(jù)增強?梢栽鰪妶D像、文本、音頻和視頻類型的數(shù)據(jù)。一些深度學(xué)習框架——Keras、Tensorflow、Pytorch 等具有內(nèi)置的增強功能,而許多開源 Python 庫是專門為增強而開發(fā)的。

針對不同數(shù)據(jù)類型的增強技術(shù):

圖像:圖像的增強技術(shù)允許縮放、翻轉(zhuǎn)、旋轉(zhuǎn)、裁剪、改變亮度/對比度/清晰度/模糊、顏色過濾等等。

文本:文本的增強技術(shù)通過單詞/句子改組、同義詞替換、釋義等來支持 NLP 任務(wù)。

音頻和視頻技術(shù)可以通過引入噪聲、改變速度等來增強數(shù)據(jù)。

圖像和文本數(shù)據(jù)增強

醫(yī)療保健、農(nóng)業(yè)、制造、汽車等領(lǐng)域的計算機視覺項目處理圖像處理,似乎受益于圖像數(shù)據(jù)增強。同樣,具有深度學(xué)習技術(shù)的自然語言處理 (NLP) 應(yīng)用程序也受益于文本數(shù)據(jù)增強。本文重點介紹圖像和文本增強。

所有生成的增強圖像和文本都是獨一無二的,我們可以使用增強技術(shù)的組合來構(gòu)建用于模型訓(xùn)練的多樣化數(shù)據(jù)集。

重要的是要了解,使用工具擴充數(shù)據(jù)集是高效且容易的,但選擇適當?shù)臄U充選項或技術(shù)組合需要對手頭的真實數(shù)據(jù)集有很好的了解和一定程度的經(jīng)驗。

有多個用于圖像和文本的 Python 數(shù)據(jù)增強庫,但我們將在本文中探索“Augly”庫和一些增強技術(shù)。

什么是AugLy ?

AugLy 是 Facebook 最近推出的用于數(shù)據(jù)增強的 Python 開源項目。AugLy 旨在提高 AI 模型在訓(xùn)練和評估期間的穩(wěn)健性。該庫包括四種模式(音頻、視頻、圖像和文本),并提供 100 多種數(shù)據(jù)增強方法。

在處理涉及音頻、視頻、圖像或文本數(shù)據(jù)集的機器學(xué)習或深度學(xué)習項目時,該庫可以增加數(shù)據(jù)并提高模型的性能。

AugLy 是如何工作的?

四種模式的 AugLy 庫使用相同的接口;诤瘮(shù)的技術(shù)以及基于類的方法可用于數(shù)據(jù)增強。強度函數(shù)定義圖像變化的強度。當調(diào)用 AugLy 函數(shù)時,這些是使用參數(shù)定義的。為了更深入地了解數(shù)據(jù)是如何轉(zhuǎn)換的,該函數(shù)為用戶提供了轉(zhuǎn)換后的信息。

現(xiàn)在讓我們看看 AugLy 可用的一些數(shù)據(jù)增強技術(shù)。

使用 AugLy 進行圖像數(shù)據(jù)增強

使用 pip 命令安裝 AugLy

pip install augly

上面的命令是下載使用圖像和文本模式所需的先決條件。

要安裝音頻和視頻格式的附加依賴項,請使用以下命令

pip install augly[av]

pip 不安裝 python-magic。要安裝它,請運行以下命令。某些環(huán)境需要運行 AugLy

pip install python-magic-bin

如果你在 Google Colab 上運行本教程并遇到“No matching distribution found for python-magic-bin”錯誤,請改用此命令。

!sudo apt-get install python3-magic

對于 AugLy 的圖像子庫,我們將從'augly.'中導(dǎo)入'imaugs'子模型。utils 用于導(dǎo)入示例圖像。

import os

import augly.image as imaugs

import augly.utils as utils

from IPython.display import display

在這里,我們定義了增強的圖像路徑。我們將使用鳥的示例圖像。

# Image path setting 

input = '/content/bird.jpg'

圖像縮放

imaugs 的 AugLy 的'scale()' 函數(shù)可以用來縮放圖像。該方法需要一個重要的參數(shù)來定義表示小圖像或大圖像的圖像。如果將其設(shè)置為較低的值,則圖像會很小。否則,圖像被放大。

# Image Scaling with small factor

image = imaugs.scale(input, factor=0.1)

display(image)

# Image Scaling with large factor

image = imaugs.scale(input, factor=0.7)

display(image)

圖像模糊

使用此選項,我們可以降低圖像清晰度,創(chuàng)建模糊圖像。

# Image Blurring

image = imaugs.blur(input, radius = 4.0)

display(image)

圖像亮度

使用此選項,可以修改輸入圖像的亮度。

# Increasing Image Brightness

image = imaugs.brightness(input, factor=1.2)

display(image)

圖像暗度

我們可以降低亮度以使具有相同亮度特征的圖像更暗。

# Making Image Darker

image = imaugs.brightness(input, factor=0.3)

display(image)

圖像對比度

我們可以使用以下命令更改圖像的對比度。

# Changing Image Contrast

image = imaugs.contrast(input, factor=2.7)

display(image)

圖像翻轉(zhuǎn) - 水平和垂直

使用這些命令,我們可以水平和垂直翻轉(zhuǎn)圖像。

#horizontal flip

image_h = imaugs.hflip(input)

display(image_h)

#vertical flip

image_v= imaugs.vflip(input)

display(image_v)

圖像灰度要將圖像更改為灰度,我們可以使用以下命令

#Grayscale image

image = imaugs.grayscale(input)

display(image)

圖像退化(椒鹽噪聲)

要向輸入圖像添加噪聲,請使用

# Degrading Image Pixels

image = imaugs.shuffle_pixels(input, factor=0.3)

display(image)

圖像傾斜

此功能以隨機角度傾斜圖像。

# Image skew

image = imaugs.skew(input)

display(image)

圖像透視變換

我們可以通過定義 sigma 值(即標準偏差)來執(zhí)行圖像轉(zhuǎn)換。較高的 sigma 值將意味著更強烈的圖像轉(zhuǎn)換。

# Image Perspective Transform

aug = imaugs.PerspectiveTransform(sigma=20.0)

image=aug(input)

display(image)

圖像縱橫比

使用這種技術(shù),我們可以控制縱橫比,即圖像的高度和寬度。

#Changing Aspect Ratio

aug = imaugs.RandomAspectRatio()

image=aug(input)

display(image)

圖像裁剪

可以使用以下命令將圖像裁剪為必要的像素大小 -

# Cropping Image

image = imaugs.crop(input,x1=0.2,x2=0.8,y1=0.2,y2=0.8)

display(image)

使用 AugLy 創(chuàng)建模因

使用“meme format()”技術(shù),AugLy 可用于創(chuàng)建模因。這種方法通過提供文本和圖像來生成代表模因的圖像。

例如,使用的圖像包含文本“LOL”。下面的代碼片段運行“meme_format()”函數(shù)并轉(zhuǎn)換圖像。

# Creating a meme

display(

   imaugs.meme_format(

       input,

       caption_height=75,

       meme_bg_color=(0, 0, 0),

       text_color=(255, 255, 255),

   )

'caption_height'、'meme_bg_color' 和 'text_color' 等參數(shù)用于自定義 meme 的顯示方式。黑色的 RGB 是 (0, 0, 0),而白色的 RGB 是 (256, 256, 256)。

將圖像轉(zhuǎn)換為屏幕截圖

'Compose()' 方法用于改變圖像的外觀。此函數(shù)需要更多參數(shù)來進行新轉(zhuǎn)換,例如飽和度和應(yīng)用于圖像的疊加類型。

# Applying several transformations together to create a new image

aug = imaugs.Compose(

   [

       imaugs.Saturation(factor=0.7),

       imaugs.OverlayOntoScreenshot(

           template_filepath=os.path.join(

               utils.SCREENSHOT_TEMPLATES_DIR, "web.png"

           ),

       ),

       imaugs.Scale(factor=0.9),

   ]

display(aug(input))

AugLy 提供了更多的增強技術(shù)。你可以通過使用下面的命令來探索這些,了解它們,并將它們與你的圖像一起使用。

help(imaugs)

使用 AugLy 進行文本數(shù)據(jù)增強

第一步是導(dǎo)入包含文本數(shù)據(jù)增強方法的文本模態(tài)。

import augly.text as textaugs

然后,進行示例文本輸入。

# Sample text

txt = "Hello, Good Morning! How are you?"

在每個文本中,“simulates_typos”函數(shù)可用于通過拼寫錯誤、鍵盤距離和交換方法來增加文本數(shù)據(jù)。

aug_tx = textaugs.simulate_typos(txt)

print(aug_tx)

我們可以在每個輸入文本中添加標點符號。

print(textaugs.insert_punctuation_chars(txt))

AugLy 的“replace_bidirectional”方法反轉(zhuǎn)每個輸入文本中的每個單詞或單詞的一部分,并使用雙向標記以原始序列生成它。它單獨反轉(zhuǎn)每個單詞,即使換行也能保持單詞順序。print(textaugs.replace_bidirectional(txt))

AugLy 的“replace_upside_down”函數(shù)根據(jù)粒度將文本中的單詞倒置。print(textaugs.replace_upside_down(txt))

結(jié)論

在本文中,我們介紹了數(shù)據(jù)增強在改進機器學(xué)習和深度學(xué)習模型中的作用。此外,我們看到了不同的圖像和文本增強技術(shù)。AugLy庫支持多種增強技術(shù)。我們從 AugLy 庫中探索了其中的一些。

本文的主要內(nèi)容:

· 數(shù)據(jù)增強可以克服數(shù)據(jù)短缺,因為它允許從可用的真實數(shù)據(jù)中擴展數(shù)據(jù)集。

· 數(shù)據(jù)增強可以提高模型性能并使其更加可靠。

· 可以使用數(shù)據(jù)增強庫來增強圖像、文本、音頻和視頻格式的數(shù)據(jù)。有幾個專門為數(shù)據(jù)增強而開發(fā)的開源 Python 庫。

· AugLy 是 Facebook 開發(fā)的開源數(shù)據(jù)增強庫,支持 100 多種增強技術(shù),并且易于初學(xué)者使用,是不同類型數(shù)據(jù)的不錯選擇。

上面討論的增強的代碼可在我的 GitHub 存儲庫中找到。你可以嘗試本文中分享的增強功能或探索 AugLy 庫中的其他增強功能。

       原文標題 : 了解使用AugLy的數(shù)據(jù)增強

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號