下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
隨著Deepseek、Manus火遍全網(wǎng),科技圈的熱點過半和大模型、智能體有關(guān)。
4月22日的酷開春季發(fā)布會上,由影音、健康、生活、設(shè)備、創(chuàng)作、教育六大智能體構(gòu)成的超級智能體正式亮相;
3天后的百度AI開發(fā)者大會,李彥宏連發(fā)通用超級智能體心響APP、內(nèi)容操作系統(tǒng)滄舟OS等多款A(yù)I應(yīng)用;
5月中旬舉辦的紅杉AI峰會,意料之中地將“智能體”列為核心議題,坦言AI有著“10倍于云計算”的市場潛力;
以及接踵而至的谷歌I/O 2025、微軟 Build 2025等開發(fā)者大會,無不提到了智能體,涵蓋編程、醫(yī)療、金融等多個行業(yè)……無論是微軟、谷歌、OpenAI等海外巨頭,阿里、騰訊、百度、酷開等國內(nèi)企業(yè),還是紅杉代表的資本機構(gòu),無不開始大力推進智能體。
與之對應(yīng)的問題是:到底什么是智能體,為什么“大廠”都在競逐智能體,又將會帶來哪些改變?
01 智能體的“魔力”:下一個交互入口
開始討論前,不妨先花點時間了解下“智能體”的概念。
智能體是英文AI Agent,其中Agent的含義中有“代理人”的意思,讓智能體和對話式AI產(chǎn)生了質(zhì)的差別:不再局限于問答,而是一種能夠深度思考、自主規(guī)劃、作出決策并深度執(zhí)行的智能應(yīng)用。
場景不可謂不誘人。可想要解開智能體爆紅的原因,還需要找到另一個視角——企業(yè)和消費者為什么需要智能體?
任何一項技術(shù)的普及,最關(guān)鍵的可能不是能力的上限有多高,而是應(yīng)用的門檻有多低。倘若只有工程師才能調(diào)用、專家才能配置、少數(shù)人才能用明白,即使再強大的能力,也只能停留在“實驗室中的奇跡”。
將大模型和云計算的演變歷程做個對比的話:
大模型的訓(xùn)練和推理需要龐大的算力和底層架構(gòu)優(yōu)化,類似于云計算中的IaaS,擔(dān)綱了智能體的“發(fā)動機”,但離業(yè)務(wù)和用戶較遠;
大模型平臺能力與API封裝,包括MCP工具、插件系統(tǒng)、開發(fā)接口等,對應(yīng)的是PaaS,為AI開發(fā)與調(diào)用提供了統(tǒng)一的“工具箱”;
最貼近用戶和業(yè)務(wù)場景的智能體,通過能力的整合、意圖的理解和任務(wù)的執(zhí)行,可以看作是SaaS的形態(tài),提供的是“即買即用”的智能。
以To B場景為例,傳統(tǒng)的企業(yè)系統(tǒng)功能模塊繁多、界面邏輯復(fù)雜,通常需要接受系統(tǒng)培訓(xùn)、掌握業(yè)務(wù)規(guī)則后,才能順利完成一個流程。企業(yè)投入了大量的時間成本,只是為了“讓人適應(yīng)系統(tǒng)”。
當智能體有了理解、推理和執(zhí)行的能力,用戶無需面對復(fù)雜界面,不必理解系統(tǒng)的內(nèi)部邏輯,僅需一句自然語言發(fā)出指令,智能體即可自動識別意圖,調(diào)用系統(tǒng)資源,完成任務(wù)鏈路,并以圖表、文本或通知的形式輸出結(jié)果。從人適應(yīng)系統(tǒng),到AI適配人的需求,生產(chǎn)力將大幅提升。
再比如To C場景中的例子,過去用戶想要看某部電影,需要用遙控器蹩腳地輸入片名進行搜索。有時想不起片名,還要先在手機上搜索關(guān)鍵詞,查看幾十個鏈接找片名,幾乎耗盡了看電影的心情。
如果是搭載了酷開超級智能體的電視,只需要用語音說出“我要看什么電影”,哪怕不記得片名,簡單描述電影里的情節(jié)和角色,超級智能體理解用戶的需求,并將任務(wù)拆解后,分配至影音智能體進行搜索各大視頻網(wǎng)站上的內(nèi)容,一步直達播放界面。甚至在AIOT居家場景中,智能體接收到看電影的需求后,還能自動執(zhí)行調(diào)節(jié)燈光、關(guān)閉窗簾等操作。
可以找到的例子還有很多。
除了生產(chǎn)力上的顛覆,智能體還進一步改變了人機協(xié)作的范式:用戶不需要主動操作工具,而是簡單地發(fā)出指令,讓智能體去完成一系列復(fù)雜的任務(wù)。誰能成為用戶需求的第一個承接者,誰就能掌握系統(tǒng)的調(diào)度權(quán),控制資源分配。
對于AI企業(yè)來說,智能體承載的是下一個入口級機遇,布局智能體即是在搶占下一代交互的“控制權(quán)”。
02 智能體爆發(fā)前夜,涌現(xiàn)出三個“流派”
不可否認的是,現(xiàn)階段的智能體還處于剛剛起步的階段。
但在技術(shù)迭代和市場需求的雙輪驅(qū)動下,在有越來越多的企業(yè)參與其中。因為不同的切入路徑,對智能體價值的不同理解,基于自身的核心優(yōu)勢和資源稟賦,逐漸分化出了三個鮮明的陣營。
第一派是標準意義上的AI廠商,比如百度、字節(jié)跳動、谷歌、OpenAI等,試圖主導(dǎo)技術(shù)生態(tài)的構(gòu)建。
它們的打法可以概括為:以大模型為底座,開放智能體的開發(fā)工具鏈和解決方案,吸引開發(fā)者到平臺上構(gòu)建各類智能體應(yīng)用。目標是構(gòu)建一個面向智能體時代的AppStore,讓智能體像App一樣被創(chuàng)造、調(diào)用與分發(fā)。
在這種理念下,智能體不再是一個產(chǎn)品,而是一個新的“操作系統(tǒng)”,希望在“模型-開發(fā)-分發(fā)”的鏈路中,扮演基礎(chǔ)設(shè)施建設(shè)者與生態(tài)主導(dǎo)者的角色。畢竟誰擁有了最強大的開發(fā)平臺和最活躍的開發(fā)者生態(tài),誰就掌握了AI時代的“分發(fā)權(quán)”與“調(diào)度權(quán)”,可以說是最迷人、難度最大的一門生意。
第二派是主攻垂直場景的企業(yè)服務(wù)商,比如微軟、IBM、阿里云等,正在著手構(gòu)建企業(yè)級的智能體解決方案。
這個陣營大多來自云計算和企業(yè)服務(wù)領(lǐng)域,對行業(yè)Know-How和企業(yè)架構(gòu)有著深厚理解,并不急于打造“面向大眾的入口”,選擇從最具現(xiàn)實價值的垂直場景切入,聚焦智能體的交付能力和效果驗證。
所以在打法上,傾向于將智能體的能力集成進企業(yè)原有的系統(tǒng)流程中,解決財務(wù)、銷售、人力資源、倉儲等業(yè)務(wù)模塊的自動化與智能化問題。微軟對此有一個大膽的判斷:隨著越來越多智能體加入,每位員工都將成為“智能體主管”,負責(zé)建立、委派和管理智能體,最大化它們的能力。
第三派是深諳用戶體驗痛點的軟硬件廠商,比如華為、聯(lián)想、酷開、三星等,將智能體直接植入到了用戶“觸點”。
動輒千萬級的用戶量,讓軟硬件廠商長期處在用戶體驗的第一線,在用戶需求滿足、軟硬件打磨和數(shù)據(jù)積累上有著天然優(yōu)勢,普遍開始將智能體深度融合進終端產(chǎn)品,用智能體解決用戶體驗上的瓶頸。
直接的例子就是酷開,早在2014年就推出了帶有AI功能的智慧屏。2025年率先為“超級智能體”提出了“長記憶、快思考、秒行動”的標準:能夠?qū)崿F(xiàn)在用戶使用過程中形成“經(jīng)驗庫”,讓模型更懂用戶習(xí)慣,減少重復(fù)交互成本。同時采用原子化組件和多智能體協(xié)同框架,將響應(yīng)速度提升至1.5秒內(nèi),滿足終端用戶對“更快、更準、更直達”的體驗要求。
以上分類或許并不嚴謹,就像阿里在To C方向上也有布局,酷開也在向B端市場拓展。
之所以采用三大流派的說法,在于他們構(gòu)成了智能體生態(tài)的三角架構(gòu)——平臺、服務(wù)和體驗,分別從技術(shù)生態(tài)、行業(yè)適配和終端場景出發(fā),既有競爭,也有協(xié)作,一同推動著智能體從概念到落地再到規(guī);瘧(yīng)用。
03 狂熱與理性并存,智能體的可能潮向
多方力量的共振,讓智能體成了當下最具想象力的風(fēng)口。但歷史經(jīng)驗告訴我們,風(fēng)口和泡沫往往如影隨形。
Manus意外走紅后,一線大廠迅速跟進,不到一個月就“炮制”出了同樣的產(chǎn)品。熱度之下也暗藏隱憂:不少“智能體”只是對大模型API的簡單封裝,缺乏任務(wù)編排、長期記憶等核心能力,看似智能,實則“像卻不靈”。
但不能因此否定智能體。
每次新技術(shù)周期的起始,或多或少都存在“泡沫先行”的現(xiàn)象,市場對概念的追逐快于技術(shù)本身的成熟,導(dǎo)致短期價值被高估,長期價值被嚴重低估,最終在狂熱與理性的較量中螺旋式進步。
身處“概念已清晰、路徑未統(tǒng)一”的前夜,我們嘗試從理性思考的角度,“揣測”下智能體接下來的可能潮向。
1、垂直智能體將比通用更早落地。
通用智能體的問題普遍在于“強而不專”。相比之下,貼近業(yè)務(wù)、熟悉流程、擁有明確目標邊界和行業(yè)知識圖譜的垂直智能體,已經(jīng)在醫(yī)療、教育、酒店、制造等場景中初步達到了“能上崗”的要求。
由此產(chǎn)生的一個挑戰(zhàn)在于:單個智能體可以勝任簡單任務(wù),一旦任務(wù)鏈條稍復(fù)雜,就必須依賴多個智能體協(xié)同工作。
比如在日常生活中,可能涉及旅行規(guī)劃、美食推薦、酒店預(yù)訂等任務(wù),需要在用戶給出指令后,準確理解用戶的意圖,將需求進行拆解并分配給不同智能體進行完成。目前只有酷開的超級智能體展示了對家庭服務(wù)的智能化整合,其余大多數(shù)智能體還停留在手動調(diào)用單個智能體對話的階段。
當用戶提出“幫我規(guī)劃下全家5人在深圳 3 日游的行程”這樣的復(fù)雜需求,智能體可以一站式關(guān)聯(lián)天氣、交通、美食、酒店、景點和地圖等服務(wù),制定出一份詳細的旅行計劃,直接選好合適的機票、酒店,你可以直接掃碼購票。
整合用戶個性化意圖識別、動態(tài)任務(wù)編排、多智能體協(xié)同等能力,或?qū)⒊蔀橹悄荏w馬拉松的第一個賽點。
2、屬于硬件的機會可能大于軟件。
當前關(guān)于智能體的討論,話題主要是對軟件形態(tài)的重構(gòu):從工具到助手,從應(yīng)用到代理。一個更值得關(guān)注的現(xiàn)象是——智能體對硬件的影響,可能遠遠大于軟件?僧斨悄荏w開始主導(dǎo)交互邏輯,硬件本身就成了“服務(wù)的入口”。
甚至可以預(yù)見:基于自然語言的交互,將重塑硬件的話語權(quán),每一塊屏幕都可能成為“服務(wù)中樞”。
在智能音箱上已經(jīng)有了類似的趨勢,用戶關(guān)心的只有結(jié)果,不在乎智能音箱播放的是哪個平臺的內(nèi)容。有了智能體的賦能,服務(wù)的交付權(quán)將進一步從APP轉(zhuǎn)移到具備感知與理解能力的硬件:
電視、閨蜜機等不再只是播放工具,而是一個家庭的AI控制中心;學(xué)習(xí)機的能力不再局限于批改作業(yè)、視頻課程,教育智能體的“長記憶”精準記錄孩子的學(xué)習(xí)軌跡,“快思考”實時解析薄弱點,“秒行動”生成個性化方案,真正實現(xiàn)“千人千面”的AI教育范式……
需要說明的是,以上只是我們研究微軟、聯(lián)想、酷開、IBM等企業(yè)的智能體戰(zhàn)略后得出的淺見。
卻可以篤定,智能體不會是單一產(chǎn)品,而是技術(shù)、交互、服務(wù)方式的全面重構(gòu),從通用大模型的“萬能引擎”,到垂直智能體的“行業(yè)大腦”,再到硬件終端的“智能入口”,AI產(chǎn)業(yè)的結(jié)構(gòu)性升級已悄然開始。
04 寫在最后
留給智能體的難關(guān)還有很多很多。
通用智能體能否打破孤島,形成可持續(xù)的開放生態(tài);垂直智能體能否找準應(yīng)用場景,從樣板間走向規(guī)模化部署;以及人機協(xié)同的邊界如何設(shè)定、數(shù)據(jù)安全與個性隱私如何平衡、多智能體之間的協(xié)同機制是否能像現(xiàn)實組織那樣高效有序……都是智能體走向產(chǎn)業(yè)主舞臺必須翻越的“能力之坎”。
當這些問題被一一回答,AGI將不再遙遠。
借用紅杉AI峰會上的共識:AI時代的勝利屬于那些既深耕垂直場景、構(gòu)建護城河,又能保持敏捷迭代、擁抱技術(shù)浪潮的行動派。
原文標題 : 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字