使用Python+OpenCV實現(xiàn)在視頻中某對象后添加圖像
為我們的計算機視覺項目制定實現(xiàn)計劃
在實施這個項目之前,我們先了解一下一個計算機視覺技術:圖像掩碼。讓我給你看一些插圖來了解這項技術。
假設我們要在圖像(圖2)中放置一個矩形(圖1),使第二個圖像中的圓出現(xiàn)在矩形的頂部:
所以,期望的結果應該是這樣的:
然而,這并不是那么簡單的。當我們從圖1中選取矩形并將其插入圖2中時,它將出現(xiàn)在粉色圓圈的頂部:
這不是我們想要的,圓圈應該在矩形的前面。所以讓我們了解如何解決這個問題。
這些圖像本質(zhì)上是數(shù)組,這些數(shù)組的值是像素值,每種顏色都有自己的像素值。
因此,我們可以將矩形的像素值設置為1,在這里它應該與圓重疊(在圖5中),同時保持矩形的其余像素值不變。
在圖6中,藍色虛線包圍的區(qū)域是我們放置矩形的區(qū)域,讓我們用R來表示這個區(qū)域。我們也將R的所有像素值設置為1,但是我們將保持整個粉色圓圈的像素值不變:
我們的下一步是將矩形的像素值與R的像素值相乘,因為任何數(shù)字乘以1都會得到該數(shù)字本身,所以所有R的像素值都將被矩形的像素替換。
類似地,矩形的像素值1將被圖6的像素替換,最終的結果是這樣的:
這是我們將要使用的技術,將OpenCV標志嵌入到視頻中的背后原理。
在Python中實現(xiàn)這項技術
你可以使用Jupyter筆記本或任何你選擇的IDE,然后我們首先導入必要的庫。
導入庫
import cv2import reimport osimport randomimport numpy as npimport matplotlib.pyplot as pltfrom os.path import isfile, join
注意:本教程使用的OpenCV庫版本是4.0.0。
加載圖像
接下來,我們將指定保存logo和視頻的工作目錄路徑。請注意,你應該在下面的代碼片段中指定“path”:
# 指定工作目錄的路徑path = ".../"
# 讀取logo圖像logo = cv2.imread(path+"opencv_logo.png")
# 讀取視頻的第一幀cap = cv2.VideoCapture(path+"Pexels Videos 2675513.mp4")ret, frame = cap.read()
至此我們已經(jīng)加載了logo圖像和視頻的第一幀,F(xiàn)在讓我們看看這些圖像或數(shù)組的形狀:
logo.shape, frame.shape
輸出:((240, 195, 3), (1080, 1920, 3))
兩個輸出都是三維的。第一個維度是圖像的高度,第二個維度是圖像的寬度,第三個維度是圖像中的通道數(shù),即藍色、綠色和紅色。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關稅,能否乘機器人東風翻身?