視頻創(chuàng)作者飯碗不保!Meta和谷歌推出的AI黑科技來搶活兒了
9月末,Meta發(fā)布了新款AI系統(tǒng)Make-A-Video,開啟了“用嘴做視頻”的時代。谷歌不甘落后,在Make-A-Video推出后一周帶著Imagen Video和Phenaki兩款類似的人工智能產(chǎn)品登場。
這幾款產(chǎn)品吸引了技術圈、流媒體行業(yè)和吃瓜者的一波又一波的關注,不少大V紛紛感慨原來AI在不知不覺間已經(jīng)發(fā)展得如此智能,自己似乎有些適應不了AI的進化速度了......
那么,Meta和谷歌推出的這幾款AI產(chǎn)品究竟有哪些逆天功能?AI的發(fā)展又會給Web3時代的內(nèi)容創(chuàng)作帶來怎樣的改變?
“用嘴做視頻”的時代到來了嗎?
首先,Meta推出的Make-A-Video是一款可以直接基于文字生成短視頻的人工智能系統(tǒng)。
根據(jù)Meta AI官網(wǎng)生成的部分短視頻內(nèi)容顯示,Make-A-Video允許用戶輸入一些單詞或句子,比如“一只披著紅色斗篷、穿著超人服裝的狗在天空中飛翔”,然后系統(tǒng)會生成一個時長5秒的視頻片段。
除此之外,官網(wǎng)示例還有UFO在火星著陸、畫家在畫布上畫畫、馬喝水等短視頻片段。
除了文本輸入外,Make-A-Video還可以根據(jù)其他視頻或圖片制作新視頻,或是生成連接圖像的關鍵幀,讓靜態(tài)圖片動起來。
不過,Make-A-Video目前只能生成5秒的16幀/秒無聲片段,畫面只能描述一個動作或場景,像素也只有768×768。
并且從官網(wǎng)示例來看,雖然Make-A-Video生成視頻的畫面準確率很高,但動態(tài)效果生硬、部分畫面要素過于獵奇,甚至還有些不符合常理,總體上來說視頻效果還是不盡如人意。
不過,對于AI產(chǎn)品的視頻清晰度和畫面時長問題,谷歌AI又一次帶給大家驚喜。
此次谷歌推出的兩款產(chǎn)品中,其中一個叫Imagen Video。Imagen Video是一款和Make-A-Video類似的產(chǎn)品,可以根據(jù)文本生成視頻。
與Meta的產(chǎn)品相比,Imagen Video可以生成1280×768的24幀/秒高清視頻片段,至少對于目前人工智能發(fā)展來看,技術已經(jīng)相當可以了。不少網(wǎng)友看了產(chǎn)品網(wǎng)站之后紛紛感慨“誤以為進了視頻素材網(wǎng)站”。
在官方發(fā)表的論文中寫到,Imagen Video除了能夠生成高清視頻外,還會在公開可用的LAION-400M圖像文本數(shù)據(jù)集、1400萬個視頻文本對和6000萬個圖像文本對上進行訓練,因此還具備一些純從數(shù)據(jù)中學習的非結構化生成模型所沒有的獨特功能。
例如,它能理解并生成不同藝術風格的作品,如“水彩”或者“像素畫”,或者直接“梵高風格繪畫”等。
它還能理解物體的3D結構,并基于理解生成旋轉(zhuǎn)對象的視頻,同時物體的大致結構也能保留,至少不會變形。
最后,它還繼承了此前Imagen文本生成圖像系統(tǒng)的準確描繪文字的能力,在此基礎上僅靠簡單描述產(chǎn)生各種創(chuàng)意動畫,為眾多自媒體行業(yè)的朋友們提供了一條素材選擇、制作的捷徑。
而谷歌此次推出的另一款產(chǎn)品Phenaki,則是能根據(jù)200個詞左右的提示語生成2分鐘以上的長視頻,講述一個完整的故事。
雖然圖片畫質(zhì)不如Imagen Video,但Phenaki所呈現(xiàn)的視頻非常貼近文本描述,而且谷歌認為它不僅可用來產(chǎn)生描述單個概念的視頻,還能可根據(jù)一系列的文本,產(chǎn)生有連貫性的多個視頻。
基于移動互聯(lián)網(wǎng)的普及,產(chǎn)生的圖像資料集、視頻資料庫數(shù)據(jù)非常龐大。
不管是Meta的Make-A-Video還是谷歌的Imagen Video或Phenaki,都可以利用現(xiàn)有的視頻與圖像數(shù)據(jù)資源進行AI訓練,讓生成的AI作品更加真實,也為之后的內(nèi)容生產(chǎn)提供了新的思路。
對AI還有哪些期待?
如今,互聯(lián)網(wǎng)內(nèi)容形態(tài)正在變得豐富多樣,從文字、圖片到音樂、視頻,再到直播、游戲,內(nèi)容需求無處不在,用戶每天消費的內(nèi)容不斷增加,但是靠人力創(chuàng)作已經(jīng)很難滿足需求的增長。
隨著科技技術的提升,AI讓內(nèi)容生產(chǎn)變得更容易、更個性。
盡管從畫面效果和情節(jié)串聯(lián)上,現(xiàn)有的AI產(chǎn)品還遠遠比不上人力創(chuàng)作,但Meta和谷歌此次的新產(chǎn)品著實讓人眼前一亮,并且讓人們開始期待AI將會如何引領內(nèi)容生產(chǎn)的發(fā)展。
可以說,從UGC、PGC到如今的AIGC(人工智能生產(chǎn)內(nèi)容),內(nèi)容生產(chǎn)正在進入一段新的革命,不僅會將內(nèi)容產(chǎn)業(yè)的繁榮推向新的高度,也將對社會的演進產(chǎn)生更深遠的影響。
最后,我們不妨看得更長遠些,無論是元宇宙還是Web3,下一代互聯(lián)網(wǎng)的繁榮需要海量的數(shù)字內(nèi)容,同時對內(nèi)容的數(shù)量、形式和交互性都提出了更高的要求。從這個角度來看,AIGC便顯得尤為必要。
在可預見的未來里,AIGC會改變很多行業(yè)。那我們不妨多些期待,去擁抱AIGC時代的到來。
【聲明】:本文為元宇宙之心運營團隊原創(chuàng),未經(jīng)允許嚴禁轉(zhuǎn)載,如需轉(zhuǎn)載請聯(lián)系我們,文章版權和最終解釋權歸元宇宙之心所有。
原文標題 : 視頻創(chuàng)作者飯碗不保!Meta和谷歌推出的AI黑科技來搶活兒了

最新活動更多
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語權
- 3 深度報告|中國AI產(chǎn)業(yè)正在崛起成全球力量,市場潛力和關鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級獨角獸:獲上市公司戰(zhàn)投,干人形機器人
- 5 國家數(shù)據(jù)局局長劉烈宏調(diào)研格創(chuàng)東智
- 6 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 7 百億AI芯片訂單,瘋狂傾銷中東?
- 8 Robotaxi新消息密集釋放,量產(chǎn)元年誰在領跑?
- 9 格斗大賽出圈!人形機器人致命短板曝光:頭腦過于簡單
- 10 “搶灘”家用機器人領域,聯(lián)通、海爾、美的等紛紛入局