国产在线不卡AV精片观看,欧美国产视频

國(guó)產(chǎn)視頻大模型大橫評(píng)：可靈、即夢(mèng)不分仲伯，表現(xiàn)最差的竟是它？

2025-07-04 09:12

視頻大模型能圓我們的導(dǎo)演夢(mèng)？

視頻生成大模型，能幫助我們成為視頻創(chuàng)作者嗎？

前段時(shí)間，AI歌手Yuri火爆全網(wǎng)，不少網(wǎng)友驚嘆AI大模型生成的視頻居然真假難辨，口型和聲音近乎完美同步。完全由AI創(chuàng)作的MV視頻《SURREAL》似乎向我們證明，每個(gè)人都可以使用AI創(chuàng)作出高質(zhì)量的視頻，但事實(shí)真的如此嗎？

《SURREAL》的背后是汗青工作室，擁有專業(yè)的后期團(tuán)隊(duì)，該MV的背后更有上萬(wàn)張圖片，無(wú)法代表大眾水平。

為了驗(yàn)證視頻生成大模型的真實(shí)能力，雷科技挑選了國(guó)內(nèi)人氣和能力較強(qiáng)的可靈、即夢(mèng)、清影、拍我四款視頻生成模型，將通過(guò)一場(chǎng)評(píng)測(cè)，展現(xiàn)當(dāng)前國(guó)產(chǎn)視頻生成模型的能力，以及探討哪款視頻生成模型最強(qiáng)。

iPhone X on charging dock.jpg

（圖源：mockup網(wǎng)站套殼）

這四款模型中，可靈出自快手，曾有「國(guó)產(chǎn)Sora」的稱號(hào)，但上線時(shí)間比Sora更早；即夢(mèng)出自字節(jié)跳動(dòng)，可用抖音掃碼登錄；清影出自智譜AI團(tuán)隊(duì)，而智譜核心成員來(lái)自國(guó)內(nèi)頂級(jí)學(xué)府清華大學(xué)的KEG（知識(shí)工程）實(shí)驗(yàn)室；拍我原名PixVerse，出自愛詩(shī)科技，此前主要面向海外市場(chǎng)，今年6月才推出國(guó)內(nèi)版App。

介紹完畢，四款A(yù)pp實(shí)力如何，咱們看表現(xiàn)說(shuō)話。

四款模型橫評(píng)：均有瑕疵，能力差距明顯

先說(shuō)一下測(cè)試環(huán)境，可靈選擇了2.1大師版本，即夢(mèng)為視頻3.0版本，清影暫不支持更改版本，因而使用默認(rèn)版本，拍我為V4.5版本，生成的視頻均為16:9比例、5秒時(shí)長(zhǎng)、720P分辨率，但由于圖片大小限制，雷科技將視頻制作成GIF時(shí)會(huì)進(jìn)行壓縮。

為了保證公平性，鏡頭運(yùn)動(dòng)、風(fēng)格等參數(shù)均不調(diào)整，保持默認(rèn)設(shè)置。所有視頻均生成一次，拒絕“人工篩選”優(yōu)秀作品或后期修改，測(cè)試共分為三輪。

第一輪《天凈沙·秋思》：靜態(tài)畫面完美，動(dòng)態(tài)可靈完勝。

若想實(shí)現(xiàn)讓每個(gè)人都能利用視頻生成模型揮灑創(chuàng)意，最重要的就是提高AI對(duì)自然語(yǔ)言的理解能力，而非依靠特定的提示詞，所有視頻生成大模型也都在朝著這個(gè)方向發(fā)展。

因此，第一題雷科技選擇了馬致遠(yuǎn)的《天凈沙·秋思》，這首初中課本上的散曲，相信大家還能背誦下來(lái)，作者僅用三言兩語(yǔ)，就勾勒出了一幅凄涼哀愁的晚景，能否解構(gòu)作者想要表達(dá)的意境，對(duì)于生成視頻的準(zhǔn)確性尤為重要。

有著「國(guó)產(chǎn)Sora」之稱的可靈，生成的視頻大體與散曲相符，水中的波紋、孤獨(dú)的老者，以及橋上欄桿和路邊草木的光影擬真程度較高，鏡頭的拉升凸顯出了孤寂感。美中不足的是，橋?qū)Π额愃扑淼赖亩纯�，以及上方如同被泥土掩埋的房子不夠協(xié)調(diào)。在我看來(lái)，前方一片平原，寥寥幾戶人家，再加上幾縷炊煙，更能凸顯寂寥的美感。

可靈第一個(gè).gif

（圖源：可靈生成）

即夢(mèng)生成的視頻若不看馬兒，可能會(huì)有點(diǎn)分不出來(lái)究竟是AI生成的，還是有人在黃昏時(shí)拍攝的，水面的波紋、天空云彩的變化，以及遠(yuǎn)處的夕陽(yáng)，接近完美。然而兩匹馬走路的姿態(tài)卻有一點(diǎn)虛浮，導(dǎo)致我們認(rèn)真觀察時(shí)，能夠辨別出畫面由AI生成。最重要的是，這段視頻缺少了這首散曲的核心「斷腸人」。

即夢(mèng)第一個(gè).gif

（圖源：即夢(mèng)生成）

清影生成的視頻就有些離譜了，先不說(shuō)同樣缺少「斷腸人」這一核心元素，馬匹走著走著竟在空中飄起來(lái)就很不合理。清影生成的整個(gè)畫面真實(shí)度很高，特別是河流的細(xì)節(jié)，水流沖擊到河岸時(shí)會(huì)形成回流。只是馬兒騰空而起的畫面，問(wèn)題實(shí)在太嚴(yán)重。

清影第一個(gè).gif

（圖源：清影生成）

拍我生成的畫面，能夠體現(xiàn)出孤獨(dú)的意境，后面的轉(zhuǎn)場(chǎng)令我想到了留守兒童送父母外出打工的畫面。不過(guò)這段視頻人物的整體裝束過(guò)于現(xiàn)代化，而且轉(zhuǎn)場(chǎng)有些突兀，馬兒和轉(zhuǎn)場(chǎng)后的英文略顯多余。

拍我第一個(gè).gif

（圖源：拍我生成）

靜態(tài)景物和動(dòng)作幅度較小的動(dòng)態(tài)景物，四款A(yù)I大模型的差距不明顯，但到運(yùn)動(dòng)度較大的景物時(shí)差距立見分曉，即夢(mèng)、清影的馬兒行動(dòng)都有些不自然。總體來(lái)說(shuō)，本輪測(cè)試中，可靈表現(xiàn)最好，其次為即夢(mèng)和拍我，清影生成的視頻中馬兒騰空而行，導(dǎo)致扣分嚴(yán)重。

第二輪《舞女謝幕》：面部、肢體均有瑕疵，協(xié)調(diào)性有待改進(jìn)，可靈、即夢(mèng)不分仲伯。

與文生視頻不同，采用圖生視頻時(shí)，用戶可以限定環(huán)境和事物主體，便于創(chuàng)作連續(xù)性較高的長(zhǎng)視頻。視頻生成大模型能否完美復(fù)刻圖片的環(huán)境和事物特點(diǎn)，則是考驗(yàn)它們能力的關(guān)鍵。本輪的測(cè)試題為：舞女結(jié)束了表演，向臺(tái)下觀眾鞠躬致敬。所用的圖片為豆包AI大模型生成，如下：

圖片風(fēng)格設(shè)定拷貝.jpg

（圖源：豆包AI生成）

可靈在評(píng)測(cè)中發(fā)揮穩(wěn)定，人物的動(dòng)作幅度是幾款大模型生成的視頻中最大的，且地板的倒影和人物裙擺的實(shí)際擺動(dòng)一致，人物整體動(dòng)作還算自然。然而右手在最后的鞠躬?jiǎng)幼鲝纳贤聰[動(dòng)時(shí)，還是出現(xiàn)了虛影。

可靈第二個(gè).gif

（圖源：可靈生成）

即夢(mèng)生成的視頻動(dòng)作幅度較小，鞠躬的動(dòng)作也較為標(biāo)準(zhǔn)，但手指處依然有一些不協(xié)調(diào)，在從上向下移動(dòng)時(shí)，手指數(shù)量似乎不對(duì)。不過(guò)即夢(mèng)的表現(xiàn)已經(jīng)極為出色，沒有出現(xiàn)明顯的瑕疵。

即夢(mèng)第二個(gè).gif

（圖源：即夢(mèng)生成）

上一輪測(cè)試中表現(xiàn)不太出色的清影，這一輪又出現(xiàn)了問(wèn)題，人物鞠躬?jiǎng)幼黠@得極為緩慢，而且在移動(dòng)過(guò)程中，手臂、手指、面部都出現(xiàn)了扭曲變形的情況，顯然是根據(jù)人物的圖片生成立體動(dòng)作時(shí)處理不夠完善，以至于存在明顯的不協(xié)調(diào)畫面。

清影第二個(gè).gif

（圖源：清影生成）

拍我生成的視頻除了提示詞描述的舞女鞠躬，還主動(dòng)將鏡頭向后拉，展示出了下方觀眾鼓掌的畫面。問(wèn)題是，人物的鼓掌動(dòng)作極度不協(xié)調(diào)，以至于畫蛇添足。

拍我第二個(gè).gif

（圖源：拍我生成）

與上一輪評(píng)測(cè)的結(jié)果相似，靜態(tài)事物各家模型生成的視頻質(zhì)量相似，動(dòng)態(tài)事物的處理存在明顯差距。至于手指處不協(xié)調(diào)的問(wèn)題，自從AI能夠創(chuàng)作圖片和視頻開始就一直存在，時(shí)至今日仍未被徹底解決。

可靈雖然有手臂虛影這一明顯問(wèn)題，但主動(dòng)給自己增加難度的轉(zhuǎn)圈動(dòng)作屬于加分項(xiàng)，與即夢(mèng)仍可并列第一，拍我雖然也存在觀眾鼓掌時(shí)動(dòng)作扭曲的問(wèn)題，但類似電影鏡頭的處理，也能為其加分。清影在沒有主動(dòng)給自己增加難度的情況下，仍出現(xiàn)了手臂、手指、面部扭曲且動(dòng)作較為緩慢的問(wèn)題，表現(xiàn)最差。

值得一提的是，四款A(yù)I大模型并未消除圖片的水印，比較尊重原創(chuàng)，但清影用自己的水印擋住了圖片的水印，處理不是太好。

第三輪《荷塘月色》：閱讀理解比拼，即夢(mèng)堪稱「高考狀元」。

在課本、試卷上，我們經(jīng)常讀到名家散文，有時(shí)還需要結(jié)合自己的閱讀理解，回答相應(yīng)的問(wèn)題。這一次，雷科技也給視頻模型準(zhǔn)備了一道閱讀理解，要求它們按照朱自清的散文《荷塘月色》段落生成一段視頻。具體內(nèi)容如下：

曲曲折折的荷塘上面，彌望的是田田的葉子。葉子出水很高，像亭亭的舞女的裙。層層的葉子中間，零星地點(diǎn)綴著些白花，有裊娜地開著的，有羞澀地打著朵兒的；正如一粒粒的明珠，又如碧天里的星星，又如剛出浴的美人。微風(fēng)過(guò)處，送來(lái)縷縷清香，仿佛遠(yuǎn)處高樓上渺茫的歌聲似的。這時(shí)候葉子與花也有一絲的顫動(dòng)，像閃電般，霎時(shí)傳過(guò)荷塘的那邊去了。葉子本是肩并肩密密地挨著，這便宛然有了一道凝碧的波痕。葉子底下是脈脈的流水，遮住了，不能見一些顏色；而葉子卻更見風(fēng)致了。

可靈生成的視頻一如既往高質(zhì)量，說(shuō)是用手機(jī)或相機(jī)拍攝的，可能都有人信，荷葉、荷花真實(shí)度極高，水面的倒影、波紋也宛如真實(shí)畫面，鏡頭的移動(dòng)更為這段視頻增添了一絲靈動(dòng)感。美中不足的是，可靈可能誤解了「像閃電般」這句話，導(dǎo)致畫面開頭部分真的有閃電劃過(guò)。

可靈第三個(gè).gif

（圖源：可靈生成）

即夢(mèng)創(chuàng)作視頻的質(zhì)量同樣穩(wěn)定，荷花、荷葉隨風(fēng)搖擺，水中的倒影也在晃動(dòng)。盡管植物莖葉在水中晃動(dòng)時(shí)激起波紋的特性，該視頻沒能太好地展示出來(lái)，但不能掩蓋這段視頻的優(yōu)秀。

即夢(mèng)第三個(gè).gif

至于清影生成的視頻，荷葉與荷花鋪滿了水面，卻與段落中的「葉子出水很高」不相符，也沒有體現(xiàn)出來(lái)波痕、流水等特點(diǎn)，整個(gè)視頻宛如靜態(tài)，只有小幅度的變化。

清影第三個(gè).gif

（圖源：清影生成）

如果說(shuō)可靈生成的視頻中掠過(guò)的閃電可以用晴空霹靂強(qiáng)行解釋，拍我生成的畫面中，從水中鉆出的詭異人頭，只能用「荷花修煉成精」這樣的玩笑來(lái)解釋了。出現(xiàn)這種畫面，可能是拍我理解錯(cuò)了「又如剛出浴的美人」這句話。清影生成的畫面清新唯美，如果沒有人頭從水面鉆出的畫面，可以給高分，但很遺憾。

拍我第三個(gè)_compressed.gif

（圖源：拍我生成）

在這一輪測(cè)試中，表現(xiàn)最好的是即夢(mèng)，畫面很好地展示出了荷花池隨風(fēng)而動(dòng)的景象，不存在多余的元素。其次則是可靈，鏡頭推進(jìn)絲滑順暢，開頭的閃電也容易修改。清影和拍我各有各的問(wèn)題，表現(xiàn)相對(duì)較差。

相較于口語(yǔ)化的文字，散文通常更加晦澀難懂，出現(xiàn)些許偏差也可以理解，能夠?qū)⒑商�、荷花、荷葉展示出來(lái)，可見幾款A(yù)I大模型在人類語(yǔ)言識(shí)別方面已經(jīng)相當(dāng)出色。

小結(jié)：可靈、即夢(mèng)并列冠軍，清影、拍我略顯遜色。

從三輪測(cè)試的結(jié)果不難看出，固定鏡頭下動(dòng)作幅度較小的場(chǎng)景，對(duì)于視頻生成大模型來(lái)說(shuō)已不是難題，生成的視頻足以以假亂真。而到了動(dòng)作幅度較大的場(chǎng)景，可靈和即夢(mèng)表現(xiàn)稍強(qiáng)一些。

其中可靈喜歡給自己增加難度，比如舞女轉(zhuǎn)個(gè)圈、荷塘鏡頭推進(jìn)等等，對(duì)于文字描述的理解能力也相對(duì)準(zhǔn)確。

即夢(mèng)以求穩(wěn)為主，三輪測(cè)試均未出現(xiàn)大錯(cuò)。清影則在三輪測(cè)試中，均出現(xiàn)了較為嚴(yán)重的問(wèn)題，生成的第一個(gè)視頻馬兒在空中行走，第二個(gè)視頻肢體和面部扭曲且動(dòng)作緩慢，第三個(gè)視頻未能正確刻畫出場(chǎng)景。

至于拍我，三輪測(cè)試中整體表現(xiàn)還算不錯(cuò)，除了最后一輪的詭異人頭。拍我全球用戶已突破6000萬(wàn)，在國(guó)內(nèi)市場(chǎng)實(shí)力與名氣存在落差。

數(shù)月前，雷科技曾針對(duì)多款A(yù)I大模型做過(guò)一期評(píng)測(cè)，它們的表現(xiàn)卻令我大失所望，生成的畫面僵硬、虛假。短短幾個(gè)月過(guò)去，AI大模型對(duì)于真實(shí)世界物理變化的理解上升了一個(gè)臺(tái)階，光影效果、衣服的擺動(dòng)等等，都幾乎難以分辨真?zhèn)巍?/strong>

可靈和即夢(mèng)的背后分別是國(guó)內(nèi)頭部短視頻平臺(tái)快手和抖音，擁有龐大的視頻資源可供訓(xùn)練，它們升級(jí)幅度也是最大的。視頻模型領(lǐng)域大戰(zhàn)將起，可靈與即夢(mèng)似乎已經(jīng)擁有了競(jìng)爭(zhēng)王座的資格。

百度強(qiáng)勢(shì)入場(chǎng)，視頻生成模型戰(zhàn)火日益焦灼

據(jù)界面新聞報(bào)道，在2024年第三季度百度總監(jiān)會(huì)上，百度董事長(zhǎng)兼CEO李彥宏表示，Sora這種視頻生成模型投入周期長(zhǎng)，可能拿不到收益，無(wú)論多么火爆，百度都不會(huì)去做。然而日前百度卻在AI Day科技開放日上推出了自研視頻生成模型MuseSteamer和繪想平臺(tái)，并宣稱MuseSteamer在權(quán)威榜單VBench I2V中以總分89.38%位列全球第一。

雷科技進(jìn)入繪想進(jìn)行了一番體驗(yàn)，該平臺(tái)較為簡(jiǎn)潔，僅提供視頻生成和數(shù)字人生成兩個(gè)功能，其中數(shù)字人生成功能暫未開放，視頻生成目前只支持圖生視頻。

于是雷科技也用第二輪題目對(duì)其進(jìn)行了測(cè)試，除了人物面部表情不夠自然，且動(dòng)作也略顯遲緩?fù)�，其他方面表現(xiàn)不比可靈、即夢(mèng)等大模型差，光影效果刻畫到位，尤其是腳部的動(dòng)作。不過(guò)這段視頻也有一個(gè)問(wèn)題，繪想似乎想要消除插入圖片的水印，但又沒能去除干凈。

（圖源：繪想生成）

百度進(jìn)入視頻生成模型領(lǐng)域，只有一個(gè)解釋，那就是看到了視頻生成模型的前景，以及其能夠帶給百度的利益。

視頻生成模型在專業(yè)領(lǐng)域已有不少成績(jī)，除了開頭提到的《SURREAL》，還有《三星堆：未來(lái)啟示錄》《中國(guó)神話》《新世界加載中》《冰霜》等內(nèi)容。

繪想平臺(tái)提供的數(shù)字人生成功能，大概率將用于微短劇創(chuàng)作，數(shù)字人的形象可以在多個(gè)視頻中使用，更便于用戶創(chuàng)作內(nèi)容。而且微短劇一集一般在1分鐘到3分鐘，創(chuàng)作的難度較低，AI大模型甚至可以提高視頻的質(zhì)量，讓微短劇不是停留在大篇幅對(duì)話和狹小場(chǎng)景，能夠展示更多場(chǎng)景。

作為國(guó)產(chǎn)視頻生成模型的佼佼者，截至今年第一季度可靈全球用戶規(guī)模已突破2200萬(wàn)，相較上線初期增長(zhǎng)了25倍，累計(jì)生成了1.68億個(gè)視頻和3.44億張圖片，并且可靈2.0模型曾登頂AI基準(zhǔn)測(cè)試機(jī)構(gòu)Artificial Analysis圖生視頻榜單。

無(wú)論是可靈、拍我用戶數(shù)量的爆發(fā)式增長(zhǎng)，還是百度入局視頻生成模型領(lǐng)域，都預(yù)示著視頻生成模型即將迎來(lái)爆發(fā)期。不過(guò)以目前視頻生成模型的能力而言，普通人用其創(chuàng)作長(zhǎng)視頻難度較高，視頻模型在處理大幅度動(dòng)作方面的能力仍有待提升。專業(yè)團(tuán)隊(duì)則有足夠的技術(shù)實(shí)力和資源對(duì)視頻進(jìn)行優(yōu)化，消除AI生成視頻的瑕疵。

視頻模型短短數(shù)月從生成的視頻質(zhì)量堪憂，發(fā)展到瑕不掩瑜，進(jìn)步堪稱神速�；蛟S幾個(gè)月后之后，視頻模型生成的內(nèi)容將再無(wú)違和感，可生成視頻的時(shí)長(zhǎng)也有望進(jìn)一步增加。

來(lái)源：雷科技
原文標(biāo)題 : 國(guó)產(chǎn)視頻大模型大橫評(píng)：可靈、即夢(mèng)不分仲伯，表現(xiàn)最差的竟是它？

可靈抖音百度快手即夢(mèng)

相關(guān)閱讀
可靈抖音百度快手即夢(mèng)

AI變現(xiàn)的果實(shí)，淘寶微信抖音快手先摘第一輪 2025-10-17

可靈AI領(lǐng)先，但快手還無(wú)法“躺贏” 2025-09-24

百度被抖音和小紅書逼出「AI搜」 2025-01-09

算法亂象整治之下，抖音美團(tuán)拼多多小紅書微博主動(dòng)出擊，百度滴滴未明確舉措 2025-01-09

即夢(mèng)對(duì)陣可靈，重演抖音反超快手 2024-12-27

分享
新浪微博騰訊QQ QQ空間微信

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號(hào)的作者撰寫，觀點(diǎn)僅代表作者本人，不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題，請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

共0條評(píng)論，0人參與

登錄

手機(jī)快捷登錄

賬號(hào)密碼登錄

手機(jī)

驗(yàn)證碼

發(fā)送驗(yàn)證碼

59s

登錄

手機(jī)/郵箱/用戶名

密碼

大小寫鎖定已打開

登錄

請(qǐng)選擇郵箱類型

@qq.com

@163.com

@126.com

@sina.com

@sina.cn

@sohu.com

@yahoo.cn

@yahoo.com.cn

@gmail.com

@outlook.com

@vip.qq.com

@vip.sina.com

@139.com

立即登錄即可訪問(wèn)所有OFweek服務(wù)

還不是會(huì)員？免費(fèi)注冊(cè)
忘記密碼

其他方式

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁，請(qǐng)輸入驗(yàn)證碼繼續(xù)

驗(yàn)證碼：刷新

最新評(píng)論

熱門評(píng)論

暫無(wú)評(píng)論

暫無(wú)評(píng)論

圖片新聞

OpenAI發(fā)布的AI瀏覽器，市場(chǎng)為何反應(yīng)強(qiáng)烈？

馬云重返一線督戰(zhàn)，阿里重啟創(chuàng)始人模式

機(jī)器人奧運(yùn)會(huì)戰(zhàn)報(bào)：宇樹機(jī)器人摘下首金，天工Ultra搶走首位“百米飛人”

存儲(chǔ)圈掐架！江波龍起訴佰維，索賠121萬(wàn)

長(zhǎng)安汽車母公司突然更名：從“中國(guó)長(zhǎng)安”到“辰致科技”

豆包前負(fù)責(zé)人喬木出軌BP后續(xù)：均被辭退

字節(jié)AI Lab負(fù)責(zé)人李航卸任后返聘，Seed進(jìn)入調(diào)整期

員工持股爆雷？廣汽埃安緊急回應(yīng)