訂閱
糾錯(cuò)
加入自媒體

大模型的耐力游戲

撰文 | 吳坤諺

編輯 | 吳先之

2010年,世界上首款量產(chǎn)純電車型日產(chǎn)汽車(Nissan)聆風(fēng)上市的時(shí)候,沒人能想到日產(chǎn)汽車公司乃至整個(gè)日本汽車行業(yè)都將在十余年后的今天淪為陪跑。

類似這樣由領(lǐng)跑者淪為追隨者的案例并不鮮見,正如在大模型領(lǐng)域,意欲竊取百度、科大訊飛等一眾大模型先行者勝利果實(shí)的字節(jié)跳動(dòng)。

眾所周知,百度、科大訊飛是國(guó)內(nèi)大模型賽道中先聲奪人的代表玩家,早在去年上半年便上線網(wǎng)頁測(cè)試版搶占用戶心智,以期在正式面向公眾服務(wù)的時(shí)候能快速積累用戶。然而據(jù)QuestMobile近日發(fā)布的數(shù)據(jù),2023年11月,文心一言、豆包與訊飛星火的日活分別是155.4萬、124.6萬、71.9萬。

不難看出,相比于早在2023上半年便上線網(wǎng)頁測(cè)試的百度與科大訊飛,8月才開啟邀測(cè)的豆包跑出了更快的增長(zhǎng)速度。

甚至到了2024年2月19日,豆包在iOS免費(fèi)榜上排名49,而文心一言排名為157,訊飛星火則排名400開外,類GPT應(yīng)用的前三把交椅之間已然存在不小的差距。

在今年1月的2024年年度全員會(huì)上,字節(jié)跳動(dòng)CEO梁汝波提到內(nèi)部對(duì)GPT的討論始于2023。短短一年內(nèi),基于云雀大模型的AI應(yīng)用矩陣已經(jīng)形成,似有復(fù)現(xiàn)曾經(jīng)其作為爆款應(yīng)用工廠之勢(shì)。

豆包的勝利屬于抖音

字節(jié)一度在業(yè)內(nèi)享有“App工廠”之稱,這源于其算法推薦機(jī)制下,集中資源與頭條系流量大水漫灌的打法,可以“熱啟動(dòng)”新的獨(dú)立應(yīng)用,快速積累用戶。

時(shí)過境遷,互聯(lián)網(wǎng)紅利見頂催生的聚合超級(jí)App不斷擠壓獨(dú)立App的生存空間,讓字節(jié)逐漸難以持續(xù)打造爆款A(yù)pp,但“算法+流量”的傳統(tǒng)打法仍不失其效果。如字節(jié)于2023年上線的新游《晶核》與《星球:重啟》均基于抖音的流量,通過這個(gè)打法快速撐起用戶與營(yíng)收規(guī)模。

同樣的啟動(dòng)路徑自然可以復(fù)現(xiàn)到大模型應(yīng)用上。更重要的是,國(guó)內(nèi)大模型賽道無論是模型層還是應(yīng)用層,都未能出現(xiàn)如ChatGPT、Character.AI一般站穩(wěn)生態(tài)位的玩家,“大力出奇跡”的打法似乎與時(shí)下亂局正合適。

據(jù)Tech星球報(bào)道,有消息人士透露豆包的月活已于去年12月增長(zhǎng)至200萬,2024年1月份則在此基礎(chǔ)上翻了一番。我們亦自相關(guān)人士處了解到,豆包的月內(nèi)平均日活已經(jīng)完成了對(duì)文心一言的反超。

誠(chéng)然,互聯(lián)網(wǎng)做的一直是注意力的生意,這是為何字節(jié)這套“老打法”能再獲戰(zhàn)果的原因。但在注意力極為稀缺的當(dāng)下,流量還不足以讓字節(jié)做到后發(fā)突圍。

要知道,業(yè)內(nèi)對(duì)AI應(yīng)用落地難的共識(shí)是其難以挖掘新的使用場(chǎng)景與功能,這同樣是豆包延續(xù)其“爆款”生命力的關(guān)鍵所在。就創(chuàng)新性來看,我們能輕易在豆包目前的產(chǎn)品形態(tài)中找到Character.AI這位前輩的影子。

豆包與Character.AI一般主打多樣化的智能體,除應(yīng)用內(nèi)置的“豆包”、“AI圖片生成”、“編程助理”等覆蓋高頻需求的智能體外,用戶亦可自行無代碼創(chuàng)建。

智能體的玩法可以較好地覆蓋用戶低頻需求,產(chǎn)品設(shè)計(jì)上偏向拓展C端規(guī)模。其他功能如語音交互以及AI聲音創(chuàng)建是不錯(cuò)的亮點(diǎn),但總體并未跳脫出Character.AI已被驗(yàn)證的產(chǎn)品框架。相比之下,隔壁文心一言顯得更為成熟,不僅同樣引入了智能體玩法,同時(shí)還在發(fā)力建設(shè)AI交流社區(qū)以及商業(yè)化。

我們體驗(yàn)發(fā)現(xiàn),文心一言App已將“社區(qū)”設(shè)置為一級(jí)入口,社區(qū)中的UGC內(nèi)容以文心一言生成的AIGC圖文為主,并加入了移動(dòng)互聯(lián)網(wǎng)常見的贊評(píng)交流系統(tǒng)。此外,百度還在文心一言4.0訂閱制付費(fèi)的基礎(chǔ)上推出了“靈感幣”作為補(bǔ)充,用戶可通過分享、拉新與充值的方式獲取更強(qiáng)的模型能力。這一系列變化,都指向了商業(yè)化。

反觀豆包目前尚不見商業(yè)化動(dòng)作,社區(qū)建設(shè)同樣未曾上馬。至于文心一言目前在數(shù)據(jù)上(如iOS下載量)不如豆包好看,或是二者的流量分發(fā)效率不可同日而語的緣故。但不可否認(rèn)的是,這恰好印證了此前外界對(duì)字節(jié)AI大模型進(jìn)展較慢的固有印象。

早在2023年末,今年便被業(yè)內(nèi)公認(rèn)為是AI應(yīng)用爆發(fā)的元年,多方向出擊的大廠與創(chuàng)業(yè)公司的草臺(tái)班子同臺(tái)角力,看似領(lǐng)先的豆包無疑面臨著更為激烈的競(jìng)爭(zhēng)壓力。

還得靠?jī)?nèi)容支棱起來

上文提到,豆包于模型能力產(chǎn)品化上的創(chuàng)新不多。除流量分發(fā)外,其規(guī)模化的速度還需自其他方面嘗試歸因。我們體驗(yàn)后發(fā)現(xiàn),豆包在頂層設(shè)計(jì)上與其他廠商有明顯區(qū)別。

首先,持續(xù)占據(jù)抖音站內(nèi)“廣告位”的豆包已在生態(tài)上與抖音完全打通,用戶不僅可以通過抖音號(hào)快捷注冊(cè)登錄,更是可以在向豆包提問時(shí),通過AI搜索抓取字節(jié)生態(tài)內(nèi)部分標(biāo)題中帶有關(guān)鍵詞的內(nèi)容。智能體的回答會(huì)較多參考抓取圖文、視頻的內(nèi)容,這也導(dǎo)致豆包在這類問題的回復(fù)上往往需要較多時(shí)間。

搜索的引入一定程度上緩解了對(duì)話模型“說胡話”的問題,另一方面,一般字節(jié)系內(nèi)容唯有在自家生態(tài)內(nèi)才能搜索,內(nèi)容的呈現(xiàn)本就是其互聯(lián)網(wǎng)服務(wù)的一部分。

這么看,字節(jié)的產(chǎn)品設(shè)計(jì)其實(shí)是一種對(duì)用戶的心智教育——文案、繪畫等高頻需求塑造了用戶對(duì)大模型應(yīng)用的工具型感知,而字節(jié)通過提供趣味內(nèi)容玩法,推動(dòng)用戶感知向其擅長(zhǎng)的內(nèi)容服務(wù)靠攏。換句話說,字節(jié)希望將豆包打造成一款偏向娛樂的產(chǎn)品,而非純粹的工具產(chǎn)品。

上文提到的AI聲音創(chuàng)建同樣是為增加應(yīng)用趣味性而設(shè)的功能,用戶可以通過錄制音頻來創(chuàng)建AI聲音,由此催生了多樣的交互玩法,例如模仿明星聲音并創(chuàng)建明星的智能體,以及春節(jié)期間足以擊穿所有年輕人的財(cái)神。

 

談及內(nèi)容,字節(jié)可就支棱起來了。字節(jié)的內(nèi)容體系經(jīng)歷了移動(dòng)互聯(lián)網(wǎng)由圖文轉(zhuǎn)向視頻的歷史進(jìn)程,無論是昨日的頭條系還是今日的抖音系都積攢了海量的信息,這不僅可以作為模型訓(xùn)練的“養(yǎng)料”,如今更是融入了模型應(yīng)用的產(chǎn)品服務(wù)中。

進(jìn)一步說,不少喪失時(shí)效的長(zhǎng)尾內(nèi)容的價(jià)值存在被再次激活的可能,這是內(nèi)容平臺(tái)進(jìn)軍大模型的優(yōu)勢(shì)之一。

將大模型接入自家生態(tài)的條件也不是只有字節(jié)獨(dú)有,百度便早已將文心一言接入了多個(gè)產(chǎn)品線,如一度為業(yè)內(nèi)所遺忘的百度文庫。

只是上述兩者在具體玩法上可以說是背道而馳,字節(jié)選擇讓由豆包抓取生態(tài)內(nèi)內(nèi)容,讓生態(tài)服務(wù)模型應(yīng)用,而百度選擇讓應(yīng)用接入模型能力,讓模型反哺生態(tài)。

字節(jié)更在意的是如何將豆包打造成模型時(shí)代的爆款,而百度更在意的是如何通過模型來挖掘既有業(yè)務(wù)的潛力。不同的做法各有側(cè)重,這也一定程度上解釋了豆包如今在消費(fèi)端的強(qiáng)勢(shì)表現(xiàn)。

字節(jié)的AI版圖

豆包僅是字節(jié)AI版圖中的一隅。

除了豆包這個(gè)面向國(guó)內(nèi)C端的AI對(duì)話應(yīng)用外,字節(jié)旗下還推出了AI工具集小悟空(原悟空搜索)、AI bot平臺(tái)扣子與抖音情緒機(jī)器人等,且以上應(yīng)用大多都已推出海外版?梢钥闯,發(fā)力AI的不僅有為創(chuàng)新AI應(yīng)用而創(chuàng)建的新部門Flow,還包括多條既有業(yè)務(wù)線的AI重構(gòu)。

字節(jié)最初涉足大模型領(lǐng)域的嘗試是火山引擎于去年6月推出的大模型服務(wù)平臺(tái)“火山方舟”,隨著豆包與其他一系列AI應(yīng)用逐漸打出市場(chǎng)聲量,意味著字節(jié)邁出了B端MaaS之外的第二只腳。

如果說以豆包為代表的智能體對(duì)話類應(yīng)用聲量漸起,對(duì)應(yīng)了字節(jié)AI戰(zhàn)略版圖的一面,那么更具技術(shù)深度與商業(yè)前景的文生視頻則是其圖景的另一面。

近日,OpenAI推出的文生視頻大模型Sora點(diǎn)燃了AI創(chuàng)投圈,能夠根據(jù)文本提示創(chuàng)建詳細(xì)的視頻,擴(kuò)展現(xiàn)有視頻中的敘述以及從靜態(tài)圖像生成場(chǎng)景,最長(zhǎng)能生成60秒視頻的Sora將AI軍備競(jìng)賽的戰(zhàn)火帶至文生視頻領(lǐng)域。

就在Sora推出前后,字節(jié)的兩個(gè)動(dòng)作耐人尋味:近日,原抖音集團(tuán)CEO張楠宣布辭去集團(tuán)CEO一職,未來把精力聚焦在剪映的發(fā)展上;另一方面,界面新聞報(bào)道稱在Sora發(fā)布前,字節(jié)便已推出可通過文本控制生成視頻中人物或物體的動(dòng)作的模型產(chǎn)品Boximator,一度為市場(chǎng)解讀為Sora的“競(jìng)品”。

將曾帶領(lǐng)字節(jié)系短視頻業(yè)務(wù)完成從0到1的張楠接手剪映,意味著其很可能就這款輔助視頻創(chuàng)作工具進(jìn)行“二次創(chuàng)業(yè)”。實(shí)際上,早在本次人事調(diào)動(dòng)前,剪映便推出了AI寫真、漫畫等新功能。降低普通人視頻創(chuàng)作門檻的產(chǎn)品設(shè)計(jì)與文生圖的應(yīng)用開發(fā)堆砌下,剪映本次文生視頻的轉(zhuǎn)向并不出人意料。

另一方面,盡管字節(jié)方面回應(yīng)稱Boximator目前還無法作為完善的產(chǎn)品落地,但這并不妨礙其可以被視作字節(jié)文生視頻業(yè)務(wù)的一塊拼圖。

由于Sora生成視頻的60秒時(shí)長(zhǎng)恰好切中字節(jié)內(nèi)容護(hù)城河中的短視頻,其上述兩個(gè)動(dòng)作也多為市場(chǎng)解讀成一種針對(duì)性的預(yù)判防御動(dòng)作,防止Sora搶奪平臺(tái)既有創(chuàng)作工具的用戶。“預(yù)判”這一因素好似去年十二月沖擊國(guó)內(nèi)游戲產(chǎn)業(yè)的新規(guī)發(fā)布前,字節(jié)便提前鳴金收兵一般,頗有昨日重現(xiàn)的色彩。

實(shí)際上,字節(jié)未必是預(yù)判到了具體情況,而是對(duì)自身發(fā)展的前景與桎梏有著明確的感知。

就目前情況看,圖片、文案、代碼等基礎(chǔ)需求其實(shí)早已是昨日黃花,于此之上的模型應(yīng)用之爭(zhēng)可以說是亂成一鍋粥,但又決不出個(gè)高低來。早在去年下半年,賽道玩家們便有意向prompt工程、多輪對(duì)話記憶與長(zhǎng)文本上發(fā)力,其原因恰是基礎(chǔ)需求實(shí)際上并不能很好地體現(xiàn)模型水平與能力。

基礎(chǔ)需求不過是字節(jié)可以“補(bǔ)課”追趕領(lǐng)域,而更具技術(shù)深度的文生視頻,才稱得上是大模型賽道競(jìng)爭(zhēng)的勝負(fù)手。Sora的發(fā)布不過是2024年模型能力演進(jìn)主線中的一位吹號(hào)人,告訴大家視頻時(shí)代已至。

或許字節(jié)跳動(dòng)已經(jīng)追上了國(guó)內(nèi)大模型賽道的進(jìn)度,但在世界范圍看,它還是一個(gè)追隨者。

       原文標(biāo)題 : 大模型的耐力游戲

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)