訂閱
糾錯
加入自媒體

谷歌“香蕉”爆火啟示:國產(chǎn)垂類AI的危機還是轉(zhuǎn)機?

圖片

圖片AI迎來GPT時刻,大模型吞噬垂類的詛咒還在嗎?圖片

原創(chuàng)科技新知 前沿科技組

作者丨櫻木 編輯丨江蘺

最近,一根香蕉打破了AI圈的平靜。最初可能只是朋友圈病毒式傳播的手辦圖,但隨后事情似乎向著瘋狂的方向發(fā)展,上線不到兩周,谷歌旗下的Nano Banana已在全球生產(chǎn)超2億張圖片,亞太地區(qū)用戶熱情度居首。而英偉達CEO黃仁勛成了它的忠實用戶,在倫敦,他面對一眾記者,公開宣稱自己是Nano Banana的忠實粉絲。瘋狂的流行帶來了另一個好處,就是直接帶動了Gemini App的用戶增長。在短時間內(nèi),Nano Banana為Gemini App帶來了超過1000萬新用戶。而在前不久,Nano Banana更是幫助谷歌Gemini超越了霸榜蘋果應用榜很久的ChatGPT。

相關(guān)的連鎖反應也在進一步加深,在海外,有報道顯示,為了應對nano Banana帶來的沖擊,openAI以約11億美元的全股票交易方式,收購產(chǎn)品實驗平臺Statsig。伴隨此次收購,Statsig的創(chuàng)始人兼首席執(zhí)行官Vijaye Raji將加入OpenAI,擔任新設(shè)立的“應用部門首席技術(shù)官”。

在國內(nèi),字節(jié)快速跟進推出了seedream4.0,試圖通過這一方式強化豆包和即夢的用戶心智。而另一邊,垂類應用美圖,則遭遇了危機,通用模型吞噬垂類應用的故事,影響著資本市場對其未來的判斷,股價經(jīng)歷了巨量波動。雖然外資投行,依然為美圖站臺,但通用模型的勢能仍好像“達摩克利斯之劍”影響著公司。一時間,AI世界的變化,開始圍繞著這一超級應用泛起波瀾。其實類似的波動,讓人總會想起,GPT-4o帶來的吉卜力畫風的時刻,而與之相對應的則是,通用模型是否會代替掉垂類AI應用的探討。前OpenAI研究員姚順雨曾在播客中表達,創(chuàng)業(yè)公司對比大模型公司最大的機會在于能不能設(shè)計出不同的interface(交互方式),可能模型的能力會產(chǎn)生beyond chatgpt的交互方式,變成superAPP。但從另一個維度來看,主流研究員則認為,長期耕耘C端業(yè)務的垂類應用,有著對用戶精細化的理解,而在B端,特定場景的know-how也能為垂類應用公司壘起一定的護城河。無疑nano Banana像是一場突如起來的變革,攪動著AI圈的神經(jīng),而到到底是促增長的功能,還是搶地盤的入侵,似乎值得一番拆解。

01 谷歌“香蕉”攪動AI圈

如果順著姚順雨的思路來看,Nano Banana確實正在顛覆圖片創(chuàng)作的邏輯。在以往,大模型如果要生成圖片,prompt提示詞非常關(guān)鍵,用戶需要學習結(jié)構(gòu)化的提示詞才能獲取較好的效果。甚至在一些場景中,需要專業(yè)的提示詞才能達到應有的效果。后續(xù)的修改,無論是通過Midjourney的“Vary”功能還是DALL-E的局部重繪,都感覺像是獨立的、離散的操作。而現(xiàn)在,Nano Banana的快速響應和自然度,讓創(chuàng)作更像實時對話,而不是反復抽卡。這也是許多人第一次感到,AI圖像生成變得像實時創(chuàng)作。用戶不再需要反復調(diào)試結(jié)構(gòu)化的咒語,而是通過簡單的自然語言對話,就能對圖像進行精確修改。Nano Banana繼承了Gemini大模型的“原生世界知識”,這意味著它不僅僅是一個圖像生成器,更是一個具備常識和推理能力的系統(tǒng)。它能夠理解和生成具有深層語義準確性的圖像.在羅永浩與周鴻祎最新的對談中,也提到了,語言對于AI幫助的核心價值。根據(jù)報道,這一切讓Nano Banana在風格一致性、多圖融合、精準的逐步編輯以及設(shè)計與風格遷移等多個方面上,有了出色的表現(xiàn)。

Nano Banana通過更精確的理解和更細致的任務拆分,實現(xiàn)了高度一致性的圖像編輯。某種程度上,這是通過模型定義實現(xiàn)的一種更近似Agent的能力。

從這個角度來看,其顛覆感正如姚順雨所說,正在改變交互的方式,這也是它為何能夠震動AI圈的原因。在此基礎(chǔ)上,Nano Banana也做到了成本低、速度快。在Google的介紹中,Nano Banana的定價為30美元/百萬token,每張圖片生成所需的token在1290個左右,成本約合0.039美元。而從另一個視角來說,Nano Banana的實現(xiàn)路徑,似乎很難復制,在團隊的訪談和公開分享里,Nano Banana的幾個方向被反復提及:文字渲染、交錯生成、速度哲學,以及世界知識的引入。這些關(guān)鍵詞組成的其實是,背后強大的模型能力所帶來的降維打擊。那么,另一個問題就非常值得關(guān)注了,面對如此強大的工具,以及國內(nèi)已經(jīng)逐漸明朗的大模型廠商格局,是否意味著,如果按照Nano Banana的思路,就可以成功顛覆垂類的AI應用呢?

02 美圖們的護城河在哪兒?

在美圖暴跌之后,相關(guān)券商的調(diào)研也相繼出爐。9月2日,摩根士丹利研報指出,美圖的增長軌跡并未受到AI模型Nano Banana的影響,其真正的價值在于提供了基礎(chǔ)AI模型無法企及的“最后一公里”解決方案。報告強調(diào)美圖憑借其在垂直領(lǐng)域的深厚積累、專有數(shù)據(jù)以及對核心付費功能的專注,構(gòu)筑了堅實的護城河。此外,公司對所有AI模型保持開放和中立,并已將Nano Banana等新技術(shù)無縫整合進產(chǎn)品中。而與此同時,也有業(yè)內(nèi)人士表達,美圖的C端業(yè)務主要優(yōu)勢在于對美顏美體的精細化理解,目前看nano的手辦模型只是一種新的玩法,并不威脅C端主業(yè)。而美圖的B端業(yè)務主要是圍繞商拍等核心功能服務大C小B的客戶,優(yōu)勢在于對于特定場景的know-how、在商拍環(huán)節(jié),nano主要聚焦商品多角度復制性以適應不同社交平臺模板,而美圖產(chǎn)品則聚焦商品高匹配背景及模特,這個賽道國內(nèi)海外目前確實涌現(xiàn)出了許多創(chuàng)業(yè)公司,但是大家在一塊全新的市場,目前的玩法、打法都不甚相同,還沒有到存量競爭的狀態(tài)。盡管如此,從敘事來看,美圖做為垂類應用,AI仍是其轉(zhuǎn)型的關(guān)鍵。從2022年開始,美圖率先在旗下產(chǎn)品Wink中上線視頻畫質(zhì)修復技術(shù),并逐步延伸出畫質(zhì)優(yōu)化、視頻分辨率提升、人像增強等一系列細分功能,形成完整的畫質(zhì)修復能力矩陣。進入2023年,美圖進一步豐富了AI功能版圖,同時正式切入B端市場,為美業(yè)領(lǐng)域量身打造AI測膚解決方案,開啟ToB業(yè)務的探索。

隨后2024年,與阿里巴巴達成2.5億美元(約合人民幣18億元)戰(zhàn)略投資,雙方明確將在電商平臺、AI技術(shù)、云計算三大核心領(lǐng)域展開深度合作。其中在電商合作層面,雙方重點推進兩大方向:一是計劃聯(lián)合推出“AI試衣”功能——依托美圖成熟的AI試衣技術(shù),結(jié)合阿里巴巴平臺豐富的商家服裝資源,從根本上優(yōu)化線上購物的體驗痛點;二是美圖設(shè)計室將向淘天商家后臺開放部分核心能力,例如“AI商品圖”生成功能,幫助商家高效提升商品視覺呈現(xiàn)效果。

從以上可以看出,美圖的位置非常微妙,在c端,它通過AI技術(shù)進行自我迭代與升級,在b端,則通過自身技術(shù)賦能電商用戶,而無論哪一個業(yè)務,似乎都還是技術(shù)沉淀過后的串聯(lián)與精細化。從某種程度來說,美圖更多的優(yōu)勢在于用戶心智、用戶經(jīng)驗以及精細化,而這些是否能夠讓其保持現(xiàn)有的業(yè)務模型不受干擾,似乎需要時間驗證。而另一方面,按照之前的邏輯,美圖圍繞著美圖秀秀等垂類賽道的superapp進行著業(yè)務進行,從某種程度來說,似乎需要更大層面的交互方式的變化,才能占住更強的心智。同時,如國內(nèi)頭部模型廠商開始進入到這一賽道之后,對其是否有更強的顛覆,值得一番思考。美圖是AI變革下的一個典型代表,每一次當巨頭模型公司發(fā)生技術(shù)溢出時,垂類AI應用就將經(jīng)歷考驗,而這種不確定性,則會成為公司需要長期面對的命題。

03 場景賦能是終極勝負手

從硅谷的經(jīng)驗來看,其實大模型公司與垂類AI公司的競爭,從來都是一個經(jīng)久不衰的話題,比如,anthopic旗下的cloude code與編程垂類應用cursor,其追趕的速度都是超乎尋常。而面對這方面的競爭,似乎垂類AI的辦法,并沒有想象的多。 投資人朱嘯虎曾在采訪中坦言:AI Coding我一開始就不敢投,我覺得這肯定是大廠的天下。今年特別有意思,中國在補貼外賣,美國在補貼AI Coding,幾乎都是負毛利。你收幾十美金一個月的訂閱費,消耗的Token可能都是幾百美金,這都是拿投資人的錢在補貼程序員。而程序員這個群體是最沒有忠誠度的,哪個API好用、哪個便宜,他們就用哪個。

回歸到這次事件的主角,美圖在此前的計劃重心是在出海。在大摩的報告中,公司設(shè)定的首個里程碑是,在三年內(nèi)(2025-2028年)將整體付費率提升至8-10%——這是在2024年4.7%基礎(chǔ)上的巨大飛躍;長期來看,其目標更指向休閑類產(chǎn)品付費率10%以上、生產(chǎn)力工具付費率20%以上的更高天花板。但要實現(xiàn)這一系列聚焦“用戶付費轉(zhuǎn)化”的目標,美圖首先要應對的,正是Nano Banana所代表的通用大模型沖擊:當“對話式創(chuàng)作”重構(gòu)了用戶對圖像AI的交互期待,垂類應用若仍困守傳統(tǒng)功能,此前的付費率規(guī)劃便可能淪為空談。而美圖的應對邏輯——將Nano Banana技術(shù)整合進自身產(chǎn)品,同時聯(lián)合阿里深耕“AI試衣”這類場景化服務,恰恰為國產(chǎn)垂類AI指明了破局方向:這場看似“巨頭碾壓垂類”的博弈,實則已被撕開轉(zhuǎn)機的裂縫。

危機從不是大模型的技術(shù)溢出,而是垂類對自身價值的誤判——誤將“工具能力”等同于“用戶價值”;轉(zhuǎn)機也從不是與大模型比拼參數(shù)算力,而是成為大模型落地現(xiàn)實場景的“場景翻譯官”與“價值放大器”。畢竟大模型提供的只是“通用能力底座”,而垂類沉淀的用戶心智(如美圖之于“美”的認知)、場景know-how(如商拍中的背景匹配邏輯)、B端服務閉環(huán)(如對接電商的商家需求),才是把技術(shù)轉(zhuǎn)化為“用戶愿付費的服務”的關(guān)鍵,也是決定AI能否真正解決痛點的“最后一塊拼圖”。對國產(chǎn)垂類AI而言,真正的突破點從不是“造一個更好的香蕉”,而是跳出“與大模型對抗”的思維定式,像美圖錨定付費率目標那樣,聚焦“用大模型賦能場景”:當通用技術(shù)與垂類場景深度綁定,所謂的“危機”便會轉(zhuǎn)化為“差異化競爭”的轉(zhuǎn)機——畢竟AI的終極戰(zhàn)場從不是技術(shù)榜單,而是能否擊中用戶愿意買單的真實需求。也許,正如朱嘯虎所說,AI時代的演化速度可能是移動互聯(lián)網(wǎng)的三倍速,甚至更快,所以很多機會也會更快被證偽。當年移動互聯(lián)網(wǎng)的很多工具App還能有不錯的退出,但在三倍速的AI時代,退出可能會難很多。所以創(chuàng)業(yè)者要用十年、二十年的眼光來看,什么東西是更可持續(xù)的,要去離大廠不只是一條馬路,而是兩條馬路、三條馬路之外尋找機會。

資料來源:鋅刻度,《押注AI,美圖就能奪回失去的一切?》硅星人pro,《Nano Banana有點ChatGPT時刻的味兒了》智百道,《深度體驗谷歌Nano Banana后,我們發(fā)現(xiàn)了它的AB面》硬AI,《AI吞噬軟件又一案例?谷歌Nano Banana走紅,美圖股價重挫》美股IPO,《大摩:美圖的“增長戰(zhàn)略”,AI提升付費率,海外拉動用戶增長》硅星人pro,《對話朱嘯虎:搬離中國,假裝不是中國AI創(chuàng)業(yè)公司,是沒有用的》

       原文標題 : 谷歌“香蕉”爆火啟示:國產(chǎn)垂類AI的危機還是轉(zhuǎn)機?

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號