Agent應(yīng)用爆發(fā),誰(shuí)成為向上托舉的力量?
經(jīng)過(guò)兩年多的發(fā)展后,AI開(kāi)始加速進(jìn)入Agent時(shí)代。
當(dāng)AI從“被動(dòng)響應(yīng)”邁向“主動(dòng)決策”,AI Agent正成為連接數(shù)字世界與物理世界的核心樞紐。
從自動(dòng)處理客戶(hù)服務(wù)工單的企業(yè)Agent,到協(xié)調(diào)多步驟科研實(shí)驗(yàn)的學(xué)術(shù)Agent,再到管理智能家居生態(tài)的個(gè)人Agent,這種具備推理、規(guī)劃、記憶與工具使用能力的智能體,正在重塑產(chǎn)業(yè)形態(tài)。
但支撐其智能的,是一套復(fù)雜且精密的基礎(chǔ)設(shè)施——它不僅包含算法與模型,更涵蓋從研發(fā)到部署、從協(xié)作到運(yùn)維的全生命周期支撐體系。
2025年,AI Agentic基礎(chǔ)設(shè)施(Agent Infra)迎來(lái)爆發(fā)拐點(diǎn)。DeepSeek、Qwen等開(kāi)源大模型的突破為 Agent提供了強(qiáng)大的認(rèn)知“大腦”,而模型上下文協(xié)議(MCP)的生態(tài)繁榮則賦予其靈活“四肢”。
據(jù)IDC預(yù)測(cè),全球80%企業(yè)將在年內(nèi)部署Agent。“大腦”與“四肢”的協(xié)同進(jìn)化,正在倒逼承載二者的“軀干”全面升級(jí),Agent Infra成為技術(shù)攻堅(jiān)的核心戰(zhàn)場(chǎng)。
Agent企業(yè)應(yīng)用
面臨五大痛點(diǎn)
利用AI的能力將工作流程自動(dòng)化,這類(lèi)產(chǎn)品早已有之。在生成式AI出現(xiàn)之前,就有RPA類(lèi)產(chǎn)品大行其道。
但限于當(dāng)時(shí)的AI能力還較弱,RPA只能將簡(jiǎn)單的單一工作流程自動(dòng)化,不具備真正的智能,不能解決復(fù)合化的復(fù)雜問(wèn)題。
直到生成式AI出現(xiàn),各種真正具備智能的Agent應(yīng)用出現(xiàn),人們才從AI自動(dòng)化中獲得了很好的效率提升。
Agent本質(zhì)是一個(gè)能調(diào)用各種工具的AI。比如Manus,它用提示詞控制AI模型,并編排了一個(gè)精巧的工作流(Work Flow),讓AI模型使用各種不同的工具,然后完成一個(gè)復(fù)雜的任務(wù)。
但是,無(wú)論是以DeepResearch為代表的研究類(lèi)Agent應(yīng)用,還是Manus這樣的通用Agent應(yīng)用,都是通過(guò)網(wǎng)頁(yè)或App的形式對(duì)終端的用戶(hù)提供。
這種提供方式,并不適合專(zhuān)業(yè)的AI開(kāi)發(fā)者,AI創(chuàng)業(yè)者和企業(yè)用戶(hù)。因?yàn)樗麄兊男枨笫亲孉gent使用專(zhuān)有的數(shù)據(jù),無(wú)縫地嵌入到業(yè)務(wù)中,為業(yè)務(wù)持續(xù)提供價(jià)值。
商業(yè)化使用Agent,首先遇到的就是終端性能,但當(dāng)一個(gè)功能強(qiáng)大的Agent在用戶(hù)本地的終端運(yùn)行時(shí),會(huì)遇到各種各樣的問(wèn)題。
首當(dāng)其沖的是AI推理的算力限制。Agent由一個(gè)能力強(qiáng)大的AI模型及一堆供它調(diào)用的工具鏈組成。
運(yùn)行能力強(qiáng)大的AI模型,通常需要AI專(zhuān)用的算力,由GPU或AI專(zhuān)用芯片提供,幾乎沒(méi)有消費(fèi)級(jí)的PC或手機(jī)能部署高精度的大模型本體。因此,目前大量的Agent公司都采用了云端算力的方式,將模型的訓(xùn)練和推理都放在云端完成。
其次是執(zhí)行任務(wù)的算力。Agent任務(wù)具有高并發(fā)、高算力需求的特點(diǎn),企業(yè)在本地部署了Agent后,當(dāng)Agent支持的業(yè)務(wù)量開(kāi)始快速增長(zhǎng)時(shí),馬上就需要更多算力,本地部署的速度跟不上;反過(guò)來(lái),當(dāng)這個(gè)業(yè)務(wù)閑置時(shí),又沒(méi)有那么多算力需求,會(huì)對(duì)企業(yè)造成巨大資源浪費(fèi)。
比如Manus在初期是用本地服務(wù)器的虛擬機(jī)去做任務(wù),這也導(dǎo)致它在用戶(hù)大量涌入的時(shí)候,出現(xiàn)了性能不足、服務(wù)不穩(wěn)定的情況,一定程度上影響了初期口碑。
再次是AI工具配置麻煩。Agent若不能調(diào)用工具,就很難具備解決復(fù)雜問(wèn)題的能力。
例如,要搭建一個(gè)銷(xiāo)售類(lèi)Agent,它需要調(diào)用CRM獲取客戶(hù)信息,調(diào)用內(nèi)部的知識(shí)庫(kù)以備自動(dòng)向客戶(hù)介紹產(chǎn)品,還需要調(diào)用各種通訊工具以便直接觸及到客戶(hù)。
國(guó)內(nèi)各地已經(jīng)有不少的智算中心,可以初步緩解算力限制問(wèn)題,但是這些智算中心卻只提供算力,不提供搭建Agent需要的各種工具鏈。
企業(yè)要定制與業(yè)務(wù)緊密耦合的Agent,就需要自己搭建工具鏈。這是一個(gè)很復(fù)雜的工程,一方面需要很高的開(kāi)發(fā)成本,另一方面,在Agent正式部署前,需要不短的開(kāi)發(fā)時(shí)間,這反而會(huì)延緩企業(yè)的業(yè)務(wù)發(fā)展速度。
當(dāng)解決了算力限制和AI工具配置的問(wèn)題后,專(zhuān)業(yè)AI開(kāi)發(fā)者和企業(yè)用戶(hù)馬上會(huì)遇到第三個(gè)問(wèn)題是權(quán)限沖突。
開(kāi)發(fā)和部署Agent的目的,是將其嵌入到自己的業(yè)務(wù)中。而這個(gè)過(guò)程,除了要調(diào)用各種各樣的工具以外,還需要與業(yè)務(wù)中的各類(lèi)軟件緊密配合。
以銷(xiāo)售類(lèi)Agent為例,當(dāng)它調(diào)用CRM,內(nèi)部知識(shí)庫(kù)和對(duì)外通訊工具時(shí),不僅會(huì)占用本地計(jì)算資源,更麻煩的是,它會(huì)搶占人類(lèi)員工的訪問(wèn)和操作權(quán)限。
當(dāng)Agent不是與人類(lèi)協(xié)同,而是互相內(nèi)耗時(shí),反而可能拉低整個(gè)團(tuán)隊(duì)的整體工作效率。
對(duì)于企業(yè)用戶(hù),還有一個(gè)大問(wèn)題,就是安全性差。企業(yè)使用Agent的目的就是要增強(qiáng)自己的業(yè)務(wù),或者提高員工的效率,這勢(shì)必需要使用公司的內(nèi)部數(shù)據(jù)。
但是Agent任務(wù)執(zhí)行是一個(gè)黑盒子,執(zhí)行過(guò)程對(duì)于用戶(hù)來(lái)說(shuō)是不透明的,有可能對(duì)本地電腦文件系統(tǒng)進(jìn)行修改、刪減等操作,輕則留下垃圾文件造成系統(tǒng)臃腫,重則造成文件丟失或數(shù)據(jù)泄露。
更進(jìn)一步,其實(shí)Agent在調(diào)用工具時(shí),本身就會(huì)有安全隱患。
據(jù)統(tǒng)計(jì),超過(guò)43%的MCP服務(wù)節(jié)點(diǎn)存在未經(jīng)驗(yàn)證的Shell調(diào)用路徑,超過(guò)83%的部署存在MCP配置漏洞;88%的AI組件部署根本沒(méi)啟用任何形式的防護(hù)機(jī)制。
當(dāng)未來(lái)Agent的使用越來(lái)越普及,安全和信任的重要性,在AI時(shí)代比在互聯(lián)網(wǎng)時(shí)代更加重要。
當(dāng)真正把本地部署Agent用起來(lái)后,企業(yè)還會(huì)面臨一個(gè)問(wèn)題,就是Agent缺乏長(zhǎng)期記憶。
當(dāng)缺乏語(yǔ)義記憶和場(chǎng)景記憶,Agent能完成一次性的任務(wù),這會(huì)嚴(yán)重影響Agent在企業(yè)業(yè)務(wù)中的使用范圍。
當(dāng)企業(yè)用戶(hù)將Agent用到業(yè)務(wù)中時(shí),如果能為其賦予長(zhǎng)期記憶,那么Agent除了能夠完成多次任務(wù),企業(yè)還可以根據(jù)這些記憶迭代Agent,使其對(duì)業(yè)務(wù)或用戶(hù)的理解越來(lái)越深,在特定任務(wù)上的能力越來(lái)越強(qiáng)。
Agent Infra乘風(fēng)而來(lái)
如今,云廠商競(jìng)相推出新一代Agent Infra技術(shù)架構(gòu)。
比如AWS 推出AgentCore(預(yù)覽版),其基于Lambda FaaS基礎(chǔ)設(shè)施深度定制和優(yōu)化的全托管運(yùn)行時(shí),為Bedrock Agents解決了標(biāo)準(zhǔn)Lambda的關(guān)鍵限制,如長(zhǎng)時(shí)執(zhí)行、狀態(tài)記錄、會(huì)話隔離等。
Azure則推出AI Foundry Agent Service,集成Functions FaaS事件驅(qū)動(dòng)使得Agent Service能夠利用Serverless計(jì)算的事件驅(qū)動(dòng)、可擴(kuò)展性和靈活性,更輕松地構(gòu)建和部署Agent。
Google Cloud推出Vertex AI Agent Builder,官方雖未明確但普遍推斷其高度依賴(lài)并優(yōu)化了Cloud Run(Cloud Functions 2nd Gen已經(jīng)基于Cloud Run來(lái)構(gòu)建)來(lái)支撐長(zhǎng)時(shí)運(yùn)行、并發(fā)和有狀態(tài)的需求。
阿里云推出函數(shù)計(jì)算Function AI,官方明確基于FC FaaS的Serverless x AI運(yùn)行時(shí)深度優(yōu)化,推出模型服務(wù)、工具服務(wù)、Agent 服務(wù),開(kāi)發(fā)者可自主選擇模型、運(yùn)行時(shí)、工具的一個(gè)或多個(gè)以組裝式設(shè)計(jì)構(gòu)建和部署Agent。
PPIO推出國(guó)內(nèi)首個(gè)Agentic AI基礎(chǔ)設(shè)施服務(wù)平臺(tái)——AI智能體,該AI智能體平臺(tái)產(chǎn)品分為通用版和企業(yè)版。
通用版以分布式GPU云底座為支撐,發(fā)布中國(guó)首款兼容E2B接口的Agent沙箱,以及更適用于Agent構(gòu)建的模型服務(wù)。
Agent沙箱專(zhuān)為Agent執(zhí)行任務(wù)設(shè)計(jì)的云端安全運(yùn)行環(huán)境,支持動(dòng)態(tài)調(diào)用Browser use、Computer use、MCP、RAG、Search等各種工具,為Agent賦予安全可靠、高效敏捷的“手和腳”。目前,該沙箱已接入Camel AI、OpenManus、Dify等著名開(kāi)源項(xiàng)目。
這些技術(shù)共同指向同一目標(biāo)——為Agent提供更高彈性、更低延遲、更強(qiáng)安全、更長(zhǎng)會(huì)話的“軀干”,支撐其從實(shí)驗(yàn)室邁向千萬(wàn)級(jí)企業(yè)場(chǎng)景。
當(dāng)認(rèn)知與行動(dòng)完成閉環(huán),Agent Infra的技術(shù)代差將決定企業(yè)AI創(chuàng)新和轉(zhuǎn)型的落地速度與質(zhì)量。
Agent開(kāi)發(fā)范式的演進(jìn)對(duì)底層基礎(chǔ)設(shè)施提出了全新要求。
各大云廠商的新一代 Agent Infra聚焦長(zhǎng)時(shí)運(yùn)行、會(huì)話親和、會(huì)話隔離、企業(yè)級(jí)IAM和VPC及模型/框架開(kāi)放等技術(shù)突破,本質(zhì)上是為滿(mǎn)足三類(lèi)核心Agent形態(tài)的共性需求。
首先是LLM Agent連續(xù)調(diào)用工具的強(qiáng)訴求。LLM Agent需連續(xù)調(diào)用工具鏈完成復(fù)雜推理,可能跨越數(shù)分鐘甚至數(shù)小時(shí)。
傳統(tǒng)Serverless的執(zhí)行時(shí)長(zhǎng)限制(如 AWS Lambda 的15分鐘上限)會(huì)強(qiáng)制中斷任務(wù),因此新一代Agent Infra必須突破該限制,支持長(zhǎng)時(shí)運(yùn)行。
同時(shí),為維持多輪對(duì)話的上下文一致性,需會(huì)話親和確保同一請(qǐng)求路由到同一計(jì)算實(shí)例,避免狀態(tài)丟失。
其次,Workflow Agent對(duì)狀態(tài)管理的依賴(lài)。自動(dòng)化工作流(如數(shù)據(jù)處理 Pipeline)需持久化記錄執(zhí)行狀態(tài)。
傳統(tǒng)Serverless的無(wú)狀態(tài)特性無(wú)法保存中間結(jié)果,而新一代Agent Infra通過(guò)提供有狀態(tài)會(huì)話保障工作流的原子性和可恢復(fù)性。會(huì)話隔離則確保多租戶(hù)或高并發(fā)場(chǎng)景下任務(wù)互不干擾,滿(mǎn)足企業(yè)級(jí)安全合規(guī)要求。
第三,Custom Agent的靈活性與生態(tài)整合。Custom Agent需集成異構(gòu)工具(API、領(lǐng)域模型、數(shù)據(jù)庫(kù)、Code Interpreter、Browser Use等),要求新一代Agent Infra支持模型/框架開(kāi)放(如 AutoGen、LangChain、AgentScope)。
封閉式架構(gòu)會(huì)限制Agent能力擴(kuò)展,而云廠商通過(guò)解耦計(jì)算層與框架層,可提供插件化集成接口。
新一代Agent Infra在保留Serverless核心優(yōu)勢(shì)(全托管免運(yùn)維、輕量彈性更經(jīng)濟(jì))的同時(shí),通過(guò)關(guān)鍵功能(長(zhǎng)時(shí)運(yùn)行、會(huì)話親和/會(huì)話隔離)和技術(shù)突破(狀態(tài)持久化、冷啟動(dòng)優(yōu)化、開(kāi)放集成),解決了LLM Agent的持續(xù)推理、Workflow Agent的復(fù)雜狀態(tài)流轉(zhuǎn)、Custom Agent的靈活定制等核心需求。
這標(biāo)志著Agent開(kāi)發(fā)正從“手動(dòng)拼湊傳統(tǒng)組件”轉(zhuǎn)向“利用原生Infra實(shí)現(xiàn)高效、安全、可擴(kuò)展的開(kāi)發(fā)部署”這一全新的技術(shù)路徑。
隨著Agent應(yīng)用進(jìn)一步加速,Agent Infra成為模型公司、云廠商、初創(chuàng)公司都在積極拓展的領(lǐng)域。除了云巨頭外,創(chuàng)業(yè)公司在這個(gè)領(lǐng)域也有不小的機(jī)會(huì)。
首先,是在已有Infra中尋找有AI-native需求的環(huán)節(jié)。這種需求可以是Agent開(kāi)發(fā)對(duì)該環(huán)節(jié)的某些性能提出了更高的要求,例如Sandbox需要更快冷啟動(dòng)速度、更強(qiáng)的隔離性;這種需求也可以是需要和AI workflow結(jié)合的更好,有更多AI-native的功能點(diǎn),例如增加RAG功能,或者和某些AI開(kāi)發(fā)者常用的語(yǔ)言或SDK有更好的結(jié)合。
其次,抓住Agent開(kāi)發(fā)中的新痛點(diǎn)。Agent開(kāi)發(fā)要追求R&D和時(shí)間投入的ROI,對(duì)降低開(kāi)發(fā)門(mén)檻和工程量的Infra產(chǎn)品有較大需求,因此一套易用性高且價(jià)格合理的Infra就有機(jī)會(huì)被廣泛采用。而且Agent生態(tài)是一個(gè)強(qiáng)調(diào)共建的生態(tài)系統(tǒng),而Infra的持續(xù)創(chuàng)新,正在大力推動(dòng)這種生態(tài)的構(gòu)建。
當(dāng)開(kāi)發(fā)一個(gè)Agent變得像組裝樂(lè)高積木一樣便捷,當(dāng)Agent協(xié)作網(wǎng)絡(luò)滲透到社會(huì)的每個(gè)角落,我們將不再爭(zhēng)論“這是風(fēng)口還是泡沫”,因?yàn)檫@是一個(gè)正在到來(lái)的新未來(lái)。
原文標(biāo)題 : Agent應(yīng)用爆發(fā),誰(shuí)成為向上托舉的力量?

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
-
機(jī)器人奧運(yùn)會(huì)戰(zhàn)報(bào):宇樹(shù)機(jī)器人摘下首金,天工Ultra搶走首位“百米飛人”
-
存儲(chǔ)圈掐架!江波龍起訴佰維,索賠121萬(wàn)
-
長(zhǎng)安汽車(chē)母公司突然更名:從“中國(guó)長(zhǎng)安”到“辰致科技”
-
豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
-
字節(jié)AI Lab負(fù)責(zé)人李航卸任后返聘,Seed進(jìn)入調(diào)整期
-
員工持股爆雷?廣汽埃安緊急回應(yīng)
-
中國(guó)“智造”背后的「關(guān)鍵力量」
-
小米汽車(chē)研發(fā)中心重磅落地,寶馬家門(mén)口“搶人”
最新活動(dòng)更多
-
即日-9.16點(diǎn)擊進(jìn)入 >> 【限時(shí)福利】TE 2025國(guó)際物聯(lián)網(wǎng)展·深圳站
-
10月23日火熱報(bào)名中>> 2025是德科技創(chuàng)新技術(shù)峰會(huì)
-
10月23日立即報(bào)名>> Works With 開(kāi)發(fā)者大會(huì)深圳站
-
10月24日立即參評(píng)>> 【評(píng)選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評(píng)選
-
11月27日立即報(bào)名>> 【工程師系列】汽車(chē)電子技術(shù)在線大會(huì)
-
12月18日立即報(bào)名>> 【線下會(huì)議】OFweek 2025(第十屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
推薦專(zhuān)題
- 1 先進(jìn)算力新選擇 | 2025華為算力場(chǎng)景發(fā)布會(huì)暨北京xPN伙伴大會(huì)成功舉辦
- 2 人形機(jī)器人,正狂奔在批量交付的曠野
- 3 宇樹(shù)機(jī)器人撞人事件的深度剖析:六維力傳感器如何成為人機(jī)安全的關(guān)鍵屏障
- 4 解碼特斯拉新AI芯片戰(zhàn)略 :從Dojo到AI5和AI6推理引擎
- 5 AI版“四萬(wàn)億刺激”計(jì)劃來(lái)了
- 6 2025年8月人工智能投融資觀察
- 7 8 a16z最新AI百?gòu)?qiáng)榜:硅谷頂級(jí)VC帶你讀懂全球生成式AI賽道最新趨勢(shì)
- 9 Manus跑路,大廠掉線,只能靠DeepSeek了
- 10 地平線的野心:1000萬(wàn)套HSD上車(chē)