訂閱
糾錯(cuò)
加入自媒體

Agent應(yīng)用爆發(fā),誰(shuí)成為向上托舉的力量?

經(jīng)過(guò)兩年多的發(fā)展后,AI開(kāi)始加速進(jìn)入Agent時(shí)代。

當(dāng)AI從“被動(dòng)響應(yīng)”邁向“主動(dòng)決策”,AI Agent正成為連接數(shù)字世界與物理世界的核心樞紐。

從自動(dòng)處理客戶(hù)服務(wù)工單的企業(yè)Agent,到協(xié)調(diào)多步驟科研實(shí)驗(yàn)的學(xué)術(shù)Agent,再到管理智能家居生態(tài)的個(gè)人Agent,這種具備推理、規(guī)劃、記憶與工具使用能力的智能體,正在重塑產(chǎn)業(yè)形態(tài)。

但支撐其智能的,是一套復(fù)雜且精密的基礎(chǔ)設(shè)施——它不僅包含算法與模型,更涵蓋從研發(fā)到部署、從協(xié)作到運(yùn)維的全生命周期支撐體系。

2025年,AI Agentic基礎(chǔ)設(shè)施(Agent Infra)迎來(lái)爆發(fā)拐點(diǎn)。DeepSeek、Qwen等開(kāi)源大模型的突破為 Agent提供了強(qiáng)大的認(rèn)知“大腦”,而模型上下文協(xié)議(MCP)的生態(tài)繁榮則賦予其靈活“四肢”。

據(jù)IDC預(yù)測(cè),全球80%企業(yè)將在年內(nèi)部署Agent。“大腦”與“四肢”的協(xié)同進(jìn)化,正在倒逼承載二者的“軀干”全面升級(jí),Agent Infra成為技術(shù)攻堅(jiān)的核心戰(zhàn)場(chǎng)。

Agent企業(yè)應(yīng)用

面臨五大痛點(diǎn)

利用AI的能力將工作流程自動(dòng)化,這類(lèi)產(chǎn)品早已有之。在生成式AI出現(xiàn)之前,就有RPA類(lèi)產(chǎn)品大行其道。

但限于當(dāng)時(shí)的AI能力還較弱,RPA只能將簡(jiǎn)單的單一工作流程自動(dòng)化,不具備真正的智能,不能解決復(fù)合化的復(fù)雜問(wèn)題。

直到生成式AI出現(xiàn),各種真正具備智能的Agent應(yīng)用出現(xiàn),人們才從AI自動(dòng)化中獲得了很好的效率提升。

Agent本質(zhì)是一個(gè)能調(diào)用各種工具的AI。比如Manus,它用提示詞控制AI模型,并編排了一個(gè)精巧的工作流(Work Flow),讓AI模型使用各種不同的工具,然后完成一個(gè)復(fù)雜的任務(wù)。

但是,無(wú)論是以DeepResearch為代表的研究類(lèi)Agent應(yīng)用,還是Manus這樣的通用Agent應(yīng)用,都是通過(guò)網(wǎng)頁(yè)或App的形式對(duì)終端的用戶(hù)提供。

這種提供方式,并不適合專(zhuān)業(yè)的AI開(kāi)發(fā)者,AI創(chuàng)業(yè)者和企業(yè)用戶(hù)。因?yàn)樗麄兊男枨笫亲孉gent使用專(zhuān)有的數(shù)據(jù),無(wú)縫地嵌入到業(yè)務(wù)中,為業(yè)務(wù)持續(xù)提供價(jià)值。

商業(yè)化使用Agent,首先遇到的就是終端性能,但當(dāng)一個(gè)功能強(qiáng)大的Agent在用戶(hù)本地的終端運(yùn)行時(shí),會(huì)遇到各種各樣的問(wèn)題。

首當(dāng)其沖的是AI推理的算力限制。Agent由一個(gè)能力強(qiáng)大的AI模型及一堆供它調(diào)用的工具鏈組成。

運(yùn)行能力強(qiáng)大的AI模型,通常需要AI專(zhuān)用的算力,由GPU或AI專(zhuān)用芯片提供,幾乎沒(méi)有消費(fèi)級(jí)的PC或手機(jī)能部署高精度的大模型本體。因此,目前大量的Agent公司都采用了云端算力的方式,將模型的訓(xùn)練和推理都放在云端完成。

其次是執(zhí)行任務(wù)的算力。Agent任務(wù)具有高并發(fā)、高算力需求的特點(diǎn),企業(yè)在本地部署了Agent后,當(dāng)Agent支持的業(yè)務(wù)量開(kāi)始快速增長(zhǎng)時(shí),馬上就需要更多算力,本地部署的速度跟不上;反過(guò)來(lái),當(dāng)這個(gè)業(yè)務(wù)閑置時(shí),又沒(méi)有那么多算力需求,會(huì)對(duì)企業(yè)造成巨大資源浪費(fèi)。

比如Manus在初期是用本地服務(wù)器的虛擬機(jī)去做任務(wù),這也導(dǎo)致它在用戶(hù)大量涌入的時(shí)候,出現(xiàn)了性能不足、服務(wù)不穩(wěn)定的情況,一定程度上影響了初期口碑。

再次是AI工具配置麻煩。Agent若不能調(diào)用工具,就很難具備解決復(fù)雜問(wèn)題的能力。

例如,要搭建一個(gè)銷(xiāo)售類(lèi)Agent,它需要調(diào)用CRM獲取客戶(hù)信息,調(diào)用內(nèi)部的知識(shí)庫(kù)以備自動(dòng)向客戶(hù)介紹產(chǎn)品,還需要調(diào)用各種通訊工具以便直接觸及到客戶(hù)。

國(guó)內(nèi)各地已經(jīng)有不少的智算中心,可以初步緩解算力限制問(wèn)題,但是這些智算中心卻只提供算力,不提供搭建Agent需要的各種工具鏈。

企業(yè)要定制與業(yè)務(wù)緊密耦合的Agent,就需要自己搭建工具鏈。這是一個(gè)很復(fù)雜的工程,一方面需要很高的開(kāi)發(fā)成本,另一方面,在Agent正式部署前,需要不短的開(kāi)發(fā)時(shí)間,這反而會(huì)延緩企業(yè)的業(yè)務(wù)發(fā)展速度。

當(dāng)解決了算力限制和AI工具配置的問(wèn)題后,專(zhuān)業(yè)AI開(kāi)發(fā)者和企業(yè)用戶(hù)馬上會(huì)遇到第三個(gè)問(wèn)題是權(quán)限沖突。

開(kāi)發(fā)和部署Agent的目的,是將其嵌入到自己的業(yè)務(wù)中。而這個(gè)過(guò)程,除了要調(diào)用各種各樣的工具以外,還需要與業(yè)務(wù)中的各類(lèi)軟件緊密配合。

以銷(xiāo)售類(lèi)Agent為例,當(dāng)它調(diào)用CRM,內(nèi)部知識(shí)庫(kù)和對(duì)外通訊工具時(shí),不僅會(huì)占用本地計(jì)算資源,更麻煩的是,它會(huì)搶占人類(lèi)員工的訪問(wèn)和操作權(quán)限。

當(dāng)Agent不是與人類(lèi)協(xié)同,而是互相內(nèi)耗時(shí),反而可能拉低整個(gè)團(tuán)隊(duì)的整體工作效率。

對(duì)于企業(yè)用戶(hù),還有一個(gè)大問(wèn)題,就是安全性差。企業(yè)使用Agent的目的就是要增強(qiáng)自己的業(yè)務(wù),或者提高員工的效率,這勢(shì)必需要使用公司的內(nèi)部數(shù)據(jù)。

但是Agent任務(wù)執(zhí)行是一個(gè)黑盒子,執(zhí)行過(guò)程對(duì)于用戶(hù)來(lái)說(shuō)是不透明的,有可能對(duì)本地電腦文件系統(tǒng)進(jìn)行修改、刪減等操作,輕則留下垃圾文件造成系統(tǒng)臃腫,重則造成文件丟失或數(shù)據(jù)泄露。

更進(jìn)一步,其實(shí)Agent在調(diào)用工具時(shí),本身就會(huì)有安全隱患。

據(jù)統(tǒng)計(jì),超過(guò)43%的MCP服務(wù)節(jié)點(diǎn)存在未經(jīng)驗(yàn)證的Shell調(diào)用路徑,超過(guò)83%的部署存在MCP配置漏洞;88%的AI組件部署根本沒(méi)啟用任何形式的防護(hù)機(jī)制。

當(dāng)未來(lái)Agent的使用越來(lái)越普及,安全和信任的重要性,在AI時(shí)代比在互聯(lián)網(wǎng)時(shí)代更加重要。

當(dāng)真正把本地部署Agent用起來(lái)后,企業(yè)還會(huì)面臨一個(gè)問(wèn)題,就是Agent缺乏長(zhǎng)期記憶。

當(dāng)缺乏語(yǔ)義記憶和場(chǎng)景記憶,Agent能完成一次性的任務(wù),這會(huì)嚴(yán)重影響Agent在企業(yè)業(yè)務(wù)中的使用范圍。

當(dāng)企業(yè)用戶(hù)將Agent用到業(yè)務(wù)中時(shí),如果能為其賦予長(zhǎng)期記憶,那么Agent除了能夠完成多次任務(wù),企業(yè)還可以根據(jù)這些記憶迭代Agent,使其對(duì)業(yè)務(wù)或用戶(hù)的理解越來(lái)越深,在特定任務(wù)上的能力越來(lái)越強(qiáng)。

Agent Infra乘風(fēng)而來(lái)

如今,云廠商競(jìng)相推出新一代Agent Infra技術(shù)架構(gòu)。

比如AWS 推出AgentCore(預(yù)覽版),其基于Lambda FaaS基礎(chǔ)設(shè)施深度定制和優(yōu)化的全托管運(yùn)行時(shí),為Bedrock Agents解決了標(biāo)準(zhǔn)Lambda的關(guān)鍵限制,如長(zhǎng)時(shí)執(zhí)行、狀態(tài)記錄、會(huì)話隔離等。

Azure則推出AI Foundry Agent Service,集成Functions FaaS事件驅(qū)動(dòng)使得Agent Service能夠利用Serverless計(jì)算的事件驅(qū)動(dòng)、可擴(kuò)展性和靈活性,更輕松地構(gòu)建和部署Agent。

Google Cloud推出Vertex AI Agent Builder,官方雖未明確但普遍推斷其高度依賴(lài)并優(yōu)化了Cloud Run(Cloud Functions 2nd Gen已經(jīng)基于Cloud Run來(lái)構(gòu)建)來(lái)支撐長(zhǎng)時(shí)運(yùn)行、并發(fā)和有狀態(tài)的需求。

阿里云推出函數(shù)計(jì)算Function AI,官方明確基于FC FaaS的Serverless x AI運(yùn)行時(shí)深度優(yōu)化,推出模型服務(wù)、工具服務(wù)、Agent 服務(wù),開(kāi)發(fā)者可自主選擇模型、運(yùn)行時(shí)、工具的一個(gè)或多個(gè)以組裝式設(shè)計(jì)構(gòu)建和部署Agent。

PPIO推出國(guó)內(nèi)首個(gè)Agentic AI基礎(chǔ)設(shè)施服務(wù)平臺(tái)——AI智能體,該AI智能體平臺(tái)產(chǎn)品分為通用版和企業(yè)版。

通用版以分布式GPU云底座為支撐,發(fā)布中國(guó)首款兼容E2B接口的Agent沙箱,以及更適用于Agent構(gòu)建的模型服務(wù)。

Agent沙箱專(zhuān)為Agent執(zhí)行任務(wù)設(shè)計(jì)的云端安全運(yùn)行環(huán)境,支持動(dòng)態(tài)調(diào)用Browser use、Computer use、MCP、RAG、Search等各種工具,為Agent賦予安全可靠、高效敏捷的“手和腳”。目前,該沙箱已接入Camel AI、OpenManus、Dify等著名開(kāi)源項(xiàng)目。

這些技術(shù)共同指向同一目標(biāo)——為Agent提供更高彈性、更低延遲、更強(qiáng)安全、更長(zhǎng)會(huì)話的“軀干”,支撐其從實(shí)驗(yàn)室邁向千萬(wàn)級(jí)企業(yè)場(chǎng)景。

當(dāng)認(rèn)知與行動(dòng)完成閉環(huán),Agent Infra的技術(shù)代差將決定企業(yè)AI創(chuàng)新和轉(zhuǎn)型的落地速度與質(zhì)量。

Agent開(kāi)發(fā)范式的演進(jìn)對(duì)底層基礎(chǔ)設(shè)施提出了全新要求。

各大云廠商的新一代 Agent Infra聚焦長(zhǎng)時(shí)運(yùn)行、會(huì)話親和、會(huì)話隔離、企業(yè)級(jí)IAM和VPC及模型/框架開(kāi)放等技術(shù)突破,本質(zhì)上是為滿(mǎn)足三類(lèi)核心Agent形態(tài)的共性需求。

首先是LLM Agent連續(xù)調(diào)用工具的強(qiáng)訴求。LLM Agent需連續(xù)調(diào)用工具鏈完成復(fù)雜推理,可能跨越數(shù)分鐘甚至數(shù)小時(shí)。

傳統(tǒng)Serverless的執(zhí)行時(shí)長(zhǎng)限制(如 AWS Lambda 的15分鐘上限)會(huì)強(qiáng)制中斷任務(wù),因此新一代Agent Infra必須突破該限制,支持長(zhǎng)時(shí)運(yùn)行。

同時(shí),為維持多輪對(duì)話的上下文一致性,需會(huì)話親和確保同一請(qǐng)求路由到同一計(jì)算實(shí)例,避免狀態(tài)丟失。

其次,Workflow Agent對(duì)狀態(tài)管理的依賴(lài)。自動(dòng)化工作流(如數(shù)據(jù)處理 Pipeline)需持久化記錄執(zhí)行狀態(tài)。

傳統(tǒng)Serverless的無(wú)狀態(tài)特性無(wú)法保存中間結(jié)果,而新一代Agent Infra通過(guò)提供有狀態(tài)會(huì)話保障工作流的原子性和可恢復(fù)性。會(huì)話隔離則確保多租戶(hù)或高并發(fā)場(chǎng)景下任務(wù)互不干擾,滿(mǎn)足企業(yè)級(jí)安全合規(guī)要求。

第三,Custom Agent的靈活性與生態(tài)整合。Custom Agent需集成異構(gòu)工具(API、領(lǐng)域模型、數(shù)據(jù)庫(kù)、Code Interpreter、Browser Use等),要求新一代Agent Infra支持模型/框架開(kāi)放(如 AutoGen、LangChain、AgentScope)。

封閉式架構(gòu)會(huì)限制Agent能力擴(kuò)展,而云廠商通過(guò)解耦計(jì)算層與框架層,可提供插件化集成接口。

新一代Agent Infra在保留Serverless核心優(yōu)勢(shì)(全托管免運(yùn)維、輕量彈性更經(jīng)濟(jì))的同時(shí),通過(guò)關(guān)鍵功能(長(zhǎng)時(shí)運(yùn)行、會(huì)話親和/會(huì)話隔離)和技術(shù)突破(狀態(tài)持久化、冷啟動(dòng)優(yōu)化、開(kāi)放集成),解決了LLM Agent的持續(xù)推理、Workflow Agent的復(fù)雜狀態(tài)流轉(zhuǎn)、Custom Agent的靈活定制等核心需求。

這標(biāo)志著Agent開(kāi)發(fā)正從“手動(dòng)拼湊傳統(tǒng)組件”轉(zhuǎn)向“利用原生Infra實(shí)現(xiàn)高效、安全、可擴(kuò)展的開(kāi)發(fā)部署”這一全新的技術(shù)路徑。

隨著Agent應(yīng)用進(jìn)一步加速,Agent Infra成為模型公司、云廠商、初創(chuàng)公司都在積極拓展的領(lǐng)域。除了云巨頭外,創(chuàng)業(yè)公司在這個(gè)領(lǐng)域也有不小的機(jī)會(huì)。

首先,是在已有Infra中尋找有AI-native需求的環(huán)節(jié)。這種需求可以是Agent開(kāi)發(fā)對(duì)該環(huán)節(jié)的某些性能提出了更高的要求,例如Sandbox需要更快冷啟動(dòng)速度、更強(qiáng)的隔離性;這種需求也可以是需要和AI workflow結(jié)合的更好,有更多AI-native的功能點(diǎn),例如增加RAG功能,或者和某些AI開(kāi)發(fā)者常用的語(yǔ)言或SDK有更好的結(jié)合。

其次,抓住Agent開(kāi)發(fā)中的新痛點(diǎn)。Agent開(kāi)發(fā)要追求R&D和時(shí)間投入的ROI,對(duì)降低開(kāi)發(fā)門(mén)檻和工程量的Infra產(chǎn)品有較大需求,因此一套易用性高且價(jià)格合理的Infra就有機(jī)會(huì)被廣泛采用。而且Agent生態(tài)是一個(gè)強(qiáng)調(diào)共建的生態(tài)系統(tǒng),而Infra的持續(xù)創(chuàng)新,正在大力推動(dòng)這種生態(tài)的構(gòu)建。

當(dāng)開(kāi)發(fā)一個(gè)Agent變得像組裝樂(lè)高積木一樣便捷,當(dāng)Agent協(xié)作網(wǎng)絡(luò)滲透到社會(huì)的每個(gè)角落,我們將不再爭(zhēng)論“這是風(fēng)口還是泡沫”,因?yàn)檫@是一個(gè)正在到來(lái)的新未來(lái)。

       原文標(biāo)題 : Agent應(yīng)用爆發(fā),誰(shuí)成為向上托舉的力量?

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)