快手、字節(jié)“AI軍備競(jìng)賽”:一場(chǎng)沒(méi)有贏家的技術(shù)泡沫秀?
2024年初,OpenAI公布的Sora AI視頻生成模型,震撼了國(guó)產(chǎn)大模型行業(yè)。隨后國(guó)產(chǎn)廠商集體發(fā)力視頻大模型,快手發(fā)布視頻生成大模型可靈,字節(jié)跳動(dòng)發(fā)布豆包視頻生成模型,正式打響了國(guó)內(nèi)AI視頻生成領(lǐng)域第一槍。
眾多企業(yè)匆忙入局,只為在這片新興市場(chǎng)中搶占先機(jī),卻往往忽視了技術(shù)成熟度與應(yīng)用規(guī)范的打磨。
以社交平臺(tái)上泛濫的 AI 偽造視頻為例,全紅嬋家人被惡意仿冒博流量賣貨,明星們也紛紛中招,劉曉慶、張馨予等均曾反饋有人在視頻號(hào)上通過(guò)AI生成視頻假冒她。這些偽造視頻不僅嚴(yán)重侵犯他人權(quán)益,更在商業(yè)利益的驅(qū)使下,充斥著虛假營(yíng)銷,讓不明真相的消費(fèi)者屢屢受騙。
AI視頻生成領(lǐng)域正處于應(yīng)用爆發(fā)前夜,快手、字節(jié)等業(yè)內(nèi)玩家試圖通過(guò)技術(shù)迭代推動(dòng)產(chǎn)品破圈,卻也陷入了無(wú)序競(jìng)爭(zhēng)困境。
AI視頻賽道尚未成熟
當(dāng)前,AI視頻生成賽道看似熱鬧非凡,實(shí)則整體仍處于不成熟的初級(jí)階段。
盡管各大廠商拼命投入資源,力求在模型性能指標(biāo)上不斷突破,從生成時(shí)長(zhǎng)的延長(zhǎng)到畫面質(zhì)量的優(yōu)化,看似讓AI視頻生成賽道加速邁進(jìn)“技術(shù)突破期”,但AI視頻技術(shù)應(yīng)用仍有不完善之處。
以快手和字節(jié)跳動(dòng)為例,快手于近期發(fā)布了可靈2.0視頻生成模型及可圖2.0圖像生成模型,自2024年6月6日首次上線開放測(cè)試以來(lái),可靈AI已快速迭代二十余次,其模型在動(dòng)態(tài)質(zhì)量、語(yǔ)義響應(yīng)、畫面美學(xué)等維度表現(xiàn)出色。
字節(jié)跳動(dòng)的Seed團(tuán)隊(duì)也推出了Seedream 3.0,據(jù)第三方榜單Artificial Analysis顯示,Seedream 3.0綜合性能追平文生圖SOTA模型GPT-4o,進(jìn)入全球第一梯隊(duì)。
然而,這背后也暴露出AI視頻生成領(lǐng)域存在的諸多問(wèn)題。
一方面,部分企業(yè)為了在競(jìng)爭(zhēng)中脫穎而出,過(guò)度追求技術(shù)迭代速度,而忽視了產(chǎn)品應(yīng)用的實(shí)際情況,使得AI視頻生成技術(shù)在實(shí)際應(yīng)用中漏洞百出。
例如,當(dāng)用戶輸入“敦煌飛天”時(shí),AI可能生成面部扭曲的虛擬形象;要求制作科普視頻時(shí),常出現(xiàn)違背物理規(guī)律的懸浮物體。據(jù)MIT媒體實(shí)驗(yàn)室測(cè)試,當(dāng)前主流AI視頻模型在復(fù)雜敘事連貫性上的準(zhǔn)確率不足63%,這嚴(yán)重制約了AI視頻生成技術(shù)在商業(yè)應(yīng)用中的邊界。
另一方面,隨著技術(shù)的快速發(fā)展,版權(quán)問(wèn)題逐漸凸顯,成為AI視頻生成領(lǐng)域的一大“雷區(qū)”。
當(dāng)AI融合多個(gè)版權(quán)素材生成新內(nèi)容時(shí),現(xiàn)有的“合理使用”原則已難以適用,這讓企業(yè)在版權(quán)問(wèn)題上面臨著巨大的法律風(fēng)險(xiǎn)。從Getty Images起訴Stability AI使用其版權(quán)圖片訓(xùn)練模型,到日本漫畫家協(xié)會(huì)禁止使用AI生成分鏡,再到全球首個(gè)AI視頻版權(quán)案判決金額高達(dá)2.3億美元,版權(quán)問(wèn)題仍未得到合理解決。
更值得關(guān)注的是,當(dāng)前的AI視頻生成技術(shù)雖然在畫面質(zhì)量、生成速度等方面取得了顯著進(jìn)步,但在視頻內(nèi)容的邏輯連貫性、情感表達(dá)深度以及對(duì)復(fù)雜場(chǎng)景的理解等方面仍存在較大不足,無(wú)法完全滿足市場(chǎng)對(duì)高質(zhì)量、多樣化視頻內(nèi)容的需求。
由此可見(jiàn),快手想要讓可靈AI成為營(yíng)收規(guī)模全球第一的視頻生成AI應(yīng)用,這條路任重道遠(yuǎn)。
字節(jié)與快手“搶灘”
當(dāng)前 AI 視頻生成領(lǐng)域風(fēng)起云涌,字節(jié)跳動(dòng)與快手作為行業(yè)內(nèi)的兩大巨頭,正在 AI 視頻賽道上奮力搶灘,二者策略各有側(cè)重,呈現(xiàn)出別樣的競(jìng)爭(zhēng)態(tài)勢(shì)。
快手主張商業(yè)化先行,打造多元變現(xiàn)模式,已在 AI 視頻生成領(lǐng)域取得了令人矚目的成績(jī)。
在技術(shù)方面,快手可靈 AI 展現(xiàn)出了強(qiáng)大的實(shí)力,為其商業(yè)化拓展提供了堅(jiān)實(shí)的技術(shù)支撐。據(jù)全球知名 AI 基準(zhǔn)測(cè)試機(jī)構(gòu) Artificial Analysis 發(fā)布的榜單顯示,快手可靈 1.6pro(高品質(zhì)模式)以 1000 分的 Arena ELO 基準(zhǔn)測(cè)試評(píng)分登陸圖生視頻賽道榜首,超越了 Google Veo 2、Pika Art 等強(qiáng)勁對(duì)手。
在商業(yè)化方面,快手無(wú)疑走在了前列。可靈 AI 采取了“C 端訂閱 + B 端 API 服務(wù) + 定制化場(chǎng)景解決方案”的多元變現(xiàn)模式,既滿足了個(gè)人用戶的創(chuàng)意需求,又為企業(yè)客戶提供了強(qiáng)大的視頻生成工具。
據(jù)了解,可靈視頻大模型全球用戶規(guī)模突破 2200 萬(wàn),吸引了來(lái)自世界各地的超 1.5 萬(wàn)開發(fā)者和企業(yè)客戶,將可靈的 API 應(yīng)用于不同的行業(yè)場(chǎng)景中。截至 2025 年 2 月底,可靈 AI 的累計(jì)營(yíng)業(yè)收入超 1 億元。
字節(jié)跳動(dòng)則展現(xiàn)了不同的野心和策略,其對(duì) AI 視頻生成的布局更側(cè)重于對(duì) AGI(通用人工智能)的探索。
年初字節(jié)跳動(dòng)豆包大模型團(tuán)隊(duì)在內(nèi)部組建了代號(hào)為“Seed Edge”的 AGI 長(zhǎng)期研究團(tuán)隊(duì),鼓勵(lì)項(xiàng)目成員探索更長(zhǎng)周期、不確定的和大膽的 AGI 研究課題,目標(biāo)是探索 AGI 的新方法,并鼓勵(lì)跨模態(tài)、跨團(tuán)隊(duì)合作。
字節(jié)跳動(dòng)近期發(fā)布的 Seaweed-7B 模型,以其音畫一體生成、長(zhǎng)鏡頭生成、實(shí)時(shí)生成等多項(xiàng)前沿技術(shù)。該模型能夠在短短 25 秒內(nèi)生成高質(zhì)量的視頻內(nèi)容,且推理速度比同類模型提升 62 倍,其性能與 Wan 2.1-14B 相當(dāng),在文本轉(zhuǎn)視頻的任務(wù)中,Elo 評(píng)分僅次于排名第一的模型 Veo 2。
相比于快手的商業(yè)化先行,字節(jié)跳動(dòng)更注重在技術(shù)層面的深耕和突破,試圖通過(guò)解決 AGI 這一終極難題,來(lái)實(shí)現(xiàn)其在 AI 視頻生成領(lǐng)域的長(zhǎng)遠(yuǎn)發(fā)展和全面領(lǐng)先?焓中枰诒3稚虡I(yè)化優(yōu)勢(shì)的基礎(chǔ)上,進(jìn)一步加大技術(shù)研發(fā)投入,提升 AI 視頻生成的質(zhì)量和效率,以免被字節(jié)跳動(dòng)搶了“風(fēng)頭”。
更大的目標(biāo)和挑戰(zhàn)
AI浪潮洶涌,快手正試圖借助 AI 之力重塑自身商業(yè)版圖,AI視頻生成賽道只是其宏偉藍(lán)圖中的一部分。
從快手的營(yíng)收數(shù)據(jù)來(lái)看,2024 年總營(yíng)收同比增長(zhǎng) 11.8% 至 1269 億元,經(jīng)調(diào)整凈利潤(rùn)大幅增長(zhǎng) 72.5% 達(dá) 177 億元,線上營(yíng)銷服務(wù)和其他服務(wù)收入同比增長(zhǎng)率均超 20%,亮眼的成績(jī)背后,AI 成為了關(guān)鍵的增長(zhǎng)引擎。
快手設(shè)定的AI目標(biāo)很宏大,其面臨的挑戰(zhàn)也全方位且極為嚴(yán)峻。
一方面,快手計(jì)劃持續(xù)強(qiáng)化 AI 技術(shù)對(duì)原有商業(yè)生態(tài)的改造,為線上營(yíng)銷服務(wù)和電商業(yè)務(wù)開拓新的增長(zhǎng)空間。
理論上 AI 可以精準(zhǔn)分析用戶需求,為商家提供更有效的營(yíng)銷方案,但實(shí)際操作中卻困難重重。在內(nèi)容生產(chǎn)環(huán)節(jié),AI 更多只能起到輔助作用,無(wú)法從根本上解決內(nèi)容質(zhì)量參差不齊的問(wèn)題;在經(jīng)營(yíng)成本方面,AI 技術(shù)的引入可能會(huì)在一定程度上降低某些環(huán)節(jié)的成本,但同時(shí)也帶來(lái)了新的成本,如技術(shù)使用成本、數(shù)據(jù)安全維護(hù)成本等。
另一方面,快手全力升級(jí)以可靈為代表的 AI 商業(yè)化變現(xiàn)模式,試圖將可靈 AI 打造成為全球 1200 億美元視頻創(chuàng)作市場(chǎng)的 AI 基礎(chǔ)設(shè)施,進(jìn)而實(shí)現(xiàn)從“中國(guó)第二大短視頻平臺(tái)”到“AI 視頻生態(tài)領(lǐng)軍者”的華麗轉(zhuǎn)身。
這無(wú)疑是一場(chǎng)豪賭。構(gòu)建基礎(chǔ)設(shè)施意味著要具備強(qiáng)大的技術(shù)通用性、穩(wěn)定性以及廣泛的市場(chǎng)認(rèn)可度,快手需要投入海量的資源用于技術(shù)研發(fā)、生態(tài)建設(shè)與市場(chǎng)推廣。而當(dāng)前行業(yè)內(nèi),技術(shù)標(biāo)準(zhǔn)尚未統(tǒng)一,市場(chǎng)格局分散,快手在推動(dòng)自身技術(shù)成為行業(yè)標(biāo)準(zhǔn)的過(guò)程中,必然會(huì)遭遇來(lái)自各方的阻力。
機(jī)遇與挑戰(zhàn)并存,如果快手不能在技術(shù)研發(fā)、商業(yè)策略以及行業(yè)責(zé)任擔(dān)當(dāng)?shù)确矫孀龀錾羁陶{(diào)整與優(yōu)化,那么其所謂的“AI 視頻生態(tài)領(lǐng)軍者”的愿景,很可能只是鏡花水月,最終在激烈的市場(chǎng)競(jìng)爭(zhēng)與行業(yè)變革中被無(wú)情淘汰。
原文標(biāo)題 : 快手、字節(jié)“AI軍備競(jìng)賽”:一場(chǎng)沒(méi)有贏家的技術(shù)泡沫秀?

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車】汽車E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺(tái)
- 4 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來(lái)商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽(yáng)光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長(zhǎng)空間
- 8 封殺AI“照騙”,“淘寶們”終于不忍了?
- 9 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?
- 10 地平線自動(dòng)駕駛方案解讀