訂閱
糾錯
加入自媒體

Agent 2025:AI的窄門與寬路

2025-08-11 17:24
正見TrueView
關注

在“AI Agent元年”的光環(huán)之下,AI Agent賽道是否只是一場虛假繁榮?

內(nèi)容/林書

編輯/詠鵝

校對/莽夫

隨著在復雜推理、多模態(tài)融合以及自主代理(Agent)能力上更強大的GPT-5發(fā)布,有人高呼“AI Agent時代真的來了”,也有人持謹慎態(tài)度,認為“GPT-5是對AI Agent創(chuàng)業(yè)者的洗牌”。

當前的AI智能體創(chuàng)業(yè),正如朱嘯虎所言,“非常像互聯(lián)網(wǎng)早期的個人站長”,既充滿草根精神,又面臨殘酷淘汰。曾被捧為“國運級產(chǎn)品”、內(nèi)測邀請碼一度炒至10萬元一個的AI Agent產(chǎn)品Manus退出中國市場,更是為這一賽道添了一把火,引發(fā)廣泛熱議。

實際上,Manus的窘境,也正是當下部分Agent類產(chǎn)品的共同寫照。

盡管2025年被冠以“AI Agent元年”之名,Agent類產(chǎn)品迎來了爆發(fā)式增長,并涌現(xiàn)出扣子空間(Coze Space)、GenSpark、心響、心流等明星產(chǎn)品,但它們?nèi)悦媾R技術、商業(yè)化與產(chǎn)品市場契合度(PMF)等多重挑戰(zhàn)。

具體而言,Agent產(chǎn)品的開發(fā)與運營成本高昂,但用戶付費意愿較低,商業(yè)化模式尚未成熟。銀河證券2025年報告數(shù)據(jù)顯示,AI Agent行業(yè)的平均用戶獲取成本(CAC)高達50美元/用戶,而平均用戶生命周期價值(LTV)僅為20-30美元,表明多數(shù)產(chǎn)品仍未實現(xiàn)盈利。

此外,多數(shù)Agent產(chǎn)品體驗未達預期、功能同質(zhì)化嚴重,導致用戶流失率高,難以建立長期粘性。那么在元年光環(huán)之下,AI Agent賽道是否只是一場虛假繁榮?

Part.1 繁榮下的結構性困境AI Agent的“單點困局”與“組織鴻溝”

從總體來看,當前的AI Agent市場,缺乏能真正穿越周期的、展現(xiàn)出“Agent比人類更懂執(zhí)行”的產(chǎn)品。

究其根源,在于當前的Agent類產(chǎn)品普遍面臨著兩個深層次的結構性問題:一是Agent類產(chǎn)品普遍為“單點”賦能;二則是相當多的企業(yè),都將重心放在了打造所謂的“通用”功能上。

當前的大多數(shù)Agent產(chǎn)品,往往專注于優(yōu)化單一任務或特定場景(如信息檢索、報表生成、任務自動化),但缺乏對企業(yè)生產(chǎn)鏈條中多個環(huán)節(jié)的協(xié)同整合能力。這種“單點”賦能模式導致Agent在復雜、跨部門的業(yè)務流程中難以發(fā)揮“樞紐”作用。

造成這一現(xiàn)象的原因,既有技術上的短板,也有組織上的滯后。

從技術上來說,一部分Agent應用在技術上并不成熟,在執(zhí)行涉及復雜邏輯、多步驟或調(diào)用多個工具的任務時,常出現(xiàn)卡頓、失敗或耗時過長的問題。

以Manus為例,不少用戶發(fā)現(xiàn)在測試中一旦任務涉及多個工具(如文件+郵件+ Notion +云盤),Manus就常常會在執(zhí)行中卡住、步驟結果傳遞錯誤,或耗時超過一小時。這反映出了此類Agent應用缺少顯式記憶機制,以至在多輪對話中狀態(tài)信息經(jīng)常丟失,甚至誤用舊信息;或是各工具接口無統(tǒng)一協(xié)議,調(diào)用全靠prompt“蒙”。

而像扣子空間這樣的產(chǎn)品,在進行“根據(jù)數(shù)據(jù)繪制圖表”的任務時,完成的狀態(tài)、質(zhì)量也十分潦草,難以達到“合格”要求。

這說明現(xiàn)在相當一部分的Agent,基本只有一層prompt調(diào)用API,缺乏一整套結構化的、統(tǒng)一的數(shù)據(jù)接口,以及相應的推理鏈條。

而從組織結構上來說,當前很多企業(yè)實際上并未完成適應AI時代的“人機協(xié)作”轉型。

一個明顯的例子是,今年上半年,有相當一部分企業(yè)落地了編程類Agent應用cursor,但得到的反饋卻是此類應用沒有顯著提效。

原因就在于,在企業(yè)的實際運作中,一段代碼從寫出來,到真正“用得上”,往往要經(jīng)歷需求澄清、任務拆解、代碼開發(fā)、審核、測試等多個環(huán)節(jié),涉及跨部門協(xié)調(diào)。

現(xiàn)在的問題不是Agent寫得慢,而是企業(yè)沒有把Agent“嵌進流程”中去。整條“軟件交付流水線”仍然是人主導的、審批制的、串聯(lián)式結構。

結果便是AI可能節(jié)省了20%的開發(fā)時間,但流程中60%的瓶頸根本不在編碼環(huán)節(jié),而在于組織流程和人為因素。這使得Agent帶來的效率提升,在陳舊的“人治”流程面前幾乎被完全抵消,全都化作了烏有。

Part.2 Agent分野通用虛火噱頭與垂類深耕挑戰(zhàn)

在今年涌現(xiàn)的各類Agent中,不少明星產(chǎn)品如Manus、GenSpark、扣子空間等,都選擇了“通用Agent”的路線。

畢竟,與垂類Agent相比,“通用”Agent的概念聽起來更性感、想象空間更大。對投資人而言,“打造AI操作系統(tǒng)”的故事遠比“開發(fā)HR報銷助手”更動聽。早期用戶也更容易被“全能型”Agent的愿景所吸引,通用Agent看似更先進、更全能,更能制造FOMO效應。

然而,現(xiàn)實與愿景存在明顯落差,當前的通用Agent技術形態(tài)更像一個中等智力的虛擬助理,難以勝任系統(tǒng)調(diào)度、權限管理等核心職能。

對于個人用戶,通用Agent目前處境尷尬。其解決的往往是瑣碎事務,如點外賣、訂酒店、生活規(guī)劃,這些需求本身痛點不深,它們通常不緊急、評估標準模糊。

用戶在這些場景中更關注“心態(tài)”與“體驗”,而非純粹的“效率”。例如在點外賣時,人們往往更在意點哪家外賣,而不是下單速度。

與之相比,一些專注于“專、窄、深”的垂直領域、聚焦于解決企業(yè)具體痛點的AI Agent,反而在今年獲得了相當程度的成功。

例如在金融行業(yè)中,Muffintech作為保險客服Agent,能夠自動處理常見客服查詢(如保單狀態(tài)),回復準確率98%,并將理賠審批時間縮短至1天,為保險公司年節(jié)省500萬美元。

在法律行業(yè),聚焦于文書起草的Harvey,專注解決法律文書起草痛點,如手動研究耗時長(每案平均20小時)、文書起草錯誤率高,實現(xiàn)自動分析法律案例和法規(guī)并生成研究報告,準確率90%,為律所帶來了直觀的效率提升。

盡管這些垂類Agent看上去樸實無華,技術上也并不十分復雜,但也并非任何一家企業(yè)都能輕易照搬,其中存在多重門檻和難點。

垂直領域需要大量且收集門檻頗高的行業(yè)數(shù)據(jù),模型必須針對特定場景進行微調(diào)或重新訓練。

例如,制造業(yè)的Agent需要處理傳感器數(shù)據(jù),法律Agent需要生成符合邏輯的文書,這些任務對準確率要求極高。

這使得模型團隊不僅要精通AI技術,還要熟悉行業(yè)知識,這類復合型人才非常稀缺且招聘成本高昂。

同時,垂類Agent需要與企業(yè)現(xiàn)有的行業(yè)標準系統(tǒng)(如SAP、Salesforce)無縫對接,以實現(xiàn)數(shù)據(jù)共享和流程優(yōu)化。

然而,許多企業(yè)內(nèi)部存在數(shù)據(jù)孤島問題,跨系統(tǒng)集成需要開發(fā)定制API,這需要團隊具備系統(tǒng)架構設計和行業(yè)軟件集成的經(jīng)驗,對技術能力要求極高。

對技術、行業(yè)知識的高要求,使得大部分中小企業(yè)難以打造出有競爭力的垂類Agent。

現(xiàn)階段,包括BAT、字節(jié)在內(nèi)的大廠,都擅長做平臺和demo,例如阿里的釘釘+夸克、百度的千帆App Builder等,但真正把復雜垂直業(yè)務完成端到端改造的案例并不多,大部分還是小規(guī)模試點或簡單輔助。此外,很多企業(yè)做了大量POC(概念驗證),但真正投入規(guī)模化使用的很少。

根據(jù)ThoughtWorks報告披露,因為業(yè)務協(xié)同不足與運營成本高,高達88%的AI POC未能進入大規(guī)模部署。研究發(fā)現(xiàn),每家公司推出的33個AI概念驗證項目中,只有4個能夠進入生產(chǎn)階段。

究其原因是互聯(lián)網(wǎng)大廠更擅長做“通用能力+流量和平臺”,而真正把垂類行業(yè)的臟活、定制、合規(guī)、實施做到位,則需要線下深耕與行業(yè)Know-How積累,這和它們的業(yè)務屬性、考核體系和商業(yè)動力并不十分匹配。

Part.3 跨越市場鴻溝出海抉擇與本土價值驗證

除了前面提到的兩大結構性問題,Agent產(chǎn)品自誕生之初便面臨著一個揮之不去的商業(yè)化難題,即國內(nèi)與國際市場的深度割裂。

對國內(nèi)大部分AI企業(yè)來說,“合規(guī)性”要求下使其發(fā)展高度依賴國產(chǎn)模型能力,然而國產(chǎn)模型與美國頂尖模型之間仍存在代際差距。

與國內(nèi)模型相比,Claude Opus 4 等國外先進模型,在復雜推理鏈條,尤其是跨領域、多條件推導上往往能保持更穩(wěn)定的邏輯一致性,出錯率更低。

且在上下文長度上,也已做到百萬級別。在嚴格按照格式、生成長且結構化的文檔、代碼、JSON 等方面穩(wěn)定性頗高,這些都是當前國內(nèi)模型尚難實現(xiàn)的水準。

同時,受限于國內(nèi)整體數(shù)字化程度與消費習慣,現(xiàn)階段B端、C端用戶的付費意愿皆不理想。這使得消費級AI應用,尤其是初創(chuàng)產(chǎn)品,價值更難以被市場充分認可并實現(xiàn)商業(yè)化。

在這樣的大前提下,國內(nèi)AI應用創(chuàng)業(yè)者需要付出更大的努力,來彌補模型能力與市場期望間的價值差距。這意味著團隊在場景設計、數(shù)據(jù)工程、模型理解、市場和業(yè)務認知等綜合能力上,需具備更加深厚的積淀。

在“高投入、低價值”的壓力下,Manus這樣的Agent產(chǎn)品選擇出海成為情理之中的策略。

據(jù)海外AI創(chuàng)業(yè)者透露,海外市場對AI產(chǎn)品的估值更為慷慨,1萬日活即可支撐1億美元估值。也就是說,1個日活用戶就價值7萬人民幣。

盡管如此,出海也并非終極解藥。所有Agent產(chǎn)品都逃不過模型能力的比拼。

隨著2025年OpenAI、Anthropic等巨頭紛紛開始布局自有的Agent產(chǎn)品,為了保持競爭優(yōu)勢采取“模型斷供”策略,將使套殼類Agent的優(yōu)勢迅速瓦解。

例如前段時間,海外著名的AI編程應用Windsurf,就遭到了Claude的全面斷供,這反映出了很多沒有自研模型的企業(yè)(包括Manus),在巨頭面前的脆弱性。

因此,出海應該是“活下去+練能力”的階段性策略,不是“一去不返”的終局。

而在國內(nèi)市場,資本們留給Agent賽道的耐心亦不會太久。盡管垂直領域大模型及應用廠商口號不斷、標桿案例宣傳頻出,但Agent未來能創(chuàng)造多少真實經(jīng)濟效益,仍是個未知數(shù)。

但可以肯定的是,目前的Agent已經(jīng)在客服、營銷、數(shù)據(jù)分析等流程明確、規(guī)則固定的場景里,切實展現(xiàn)出降本增效的價值。有這些商業(yè)化場景托底,Agent在今年就不會全然是一個“泡沫”。

而未來更大的商業(yè)化突破,則有待Agent在某些高價值的垂類領域,例如金融、醫(yī)療等場景真正發(fā)揮出變革性作用,而這則需要技術演進、組織適配與產(chǎn)業(yè)生態(tài)協(xié)同等多種因素協(xié)同作用。

END

       原文標題 : Agent 2025:AI的窄門與寬路

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號