訂閱
糾錯(cuò)
加入自媒體

從 Manus 到 GO-1:當(dāng)AI逐漸走入物理世界

2025-03-11 09:19
山自
關(guān)注

2025年3月的中國AI領(lǐng)域無疑是一顆投入平靜湖面的巨石,激起層層巨浪,吸引了全球的目光。先是Manus通用AI Agent以“全球首款執(zhí)行級(jí)智能體”的姿態(tài)橫空出世,如同一道耀眼的閃電劃破科技的夜空;緊接著,GO - 1通用具身基座大模型宣布開源,宣稱要“重新定義人機(jī)交互邊界”,似一場(chǎng)風(fēng)暴席卷而來。這兩大技術(shù)的碰撞與競(jìng)爭(zhēng),讓人們不禁思考:當(dāng)AI開始從云端走向物理世界,真正參與到現(xiàn)實(shí)的交互與創(chuàng)造中,人類距離真正的智能革命究竟還有多遠(yuǎn)?

Manus:“執(zhí)行級(jí)AI Agent”的降維打擊Manus是由中國初創(chuàng)公司Monica.im開發(fā)的全球首款通用型AI智能體,其核心定位是自主執(zhí)行復(fù)雜任務(wù)并交付成果。Manus的出現(xiàn)標(biāo)志著AI智能體從單一任務(wù)執(zhí)行向復(fù)雜決策的跨越,其名稱源自拉丁文“mens et manus”,意為“知行合一”,強(qiáng)調(diào)知識(shí)與行動(dòng)的結(jié)合。

 1. 核心能力:從“思考”到“行動(dòng)”的閉環(huán)

Manus的出現(xiàn),宛如一場(chǎng)技術(shù)革命,打破了傳統(tǒng)AI僅僅作為“工具”的屬性。它不再是被動(dòng)地等待指令,而是具備了從理解指令到自主拆解任務(wù)、調(diào)用工具、跨平臺(tái)執(zhí)行并最終交付完整成果的能力,形成了一個(gè)從“思考”到“行動(dòng)”的完美閉環(huán)。

在金融分析領(lǐng)域,當(dāng)用戶輸入“分析特斯拉股價(jià)波動(dòng)”這樣的指令時(shí),Manus就像一位專業(yè)的金融分析師,能夠自動(dòng)抓取特斯拉的財(cái)報(bào),關(guān)聯(lián)美聯(lián)儲(chǔ)的政策信息,最終生成可視化的報(bào)告。這一過程不僅高效,而且精準(zhǔn),大大節(jié)省了金融從業(yè)者的時(shí)間和精力。

在教育場(chǎng)景中,教師只需上傳教材,Manus就能自動(dòng)生成教案、制作PPT、編寫練習(xí)題,甚至還能模擬課堂互動(dòng)。這對(duì)于教育工作者來說,無疑是一個(gè)得力的助手,能夠讓他們將更多的精力放在教學(xué)方法的創(chuàng)新和與學(xué)生的互動(dòng)上。

在企業(yè)級(jí)應(yīng)用方面,某跨境電商客戶利用Manus完成了競(jìng)品分析、廣告投放、物流調(diào)度等全流程工作,效率提升了400%。這一顯著的成效充分展示了Manus在實(shí)際業(yè)務(wù)中的強(qiáng)大執(zhí)行力和價(jià)值。

圖片

更值得一提的是,Manus在GAIA基準(zhǔn)測(cè)試中的表現(xiàn)堪稱驚艷。其綜合得分達(dá)到了86.5%,遠(yuǎn)超OpenAI Deep Research的67.9%。這一數(shù)據(jù)表明,AI終于從“實(shí)驗(yàn)室玩具”進(jìn)化為“職場(chǎng)殺手級(jí)助手”,能夠在實(shí)際工作中發(fā)揮重要作用。

圖片

2. 技術(shù)底層:通用智能體的“靈魂三要素”

Manus之所以能夠具備如此強(qiáng)大的能力,得益于其通用智能體的“靈魂三要素”。

多模態(tài)感知是Manus的重要特性之一。它能夠兼容文本、圖像、語音等多維度輸入,就像人類擁有多種感官一樣,能夠從不同的渠道獲取信息,從而更全面地理解用戶的需求。

動(dòng)態(tài)規(guī)劃則是Manus高效執(zhí)行任務(wù)的關(guān)鍵。通過強(qiáng)化學(xué)習(xí),它能夠?qū)崟r(shí)調(diào)整任務(wù)的優(yōu)先級(jí),根據(jù)實(shí)際情況靈活安排工作流程,確保任務(wù)能夠以最優(yōu)的方式完成。

云端執(zhí)行是Manus的強(qiáng)大后盾。依托分布式算力網(wǎng)絡(luò),它能夠?qū)崿F(xiàn)7×24小時(shí)不間斷作業(yè),無論何時(shí)何地,都能為用戶提供及時(shí)、高效的服務(wù)。

正如團(tuán)隊(duì)核心成員季逸超所言:“Manus不是更聰明的AI,而是更像‘人’的AI。”它的出現(xiàn),讓AI更加貼近人類的思維和行為方式,為人類的工作和生活帶來了更多的便利。

GO - 1:具身智能時(shí)代的“全能智囊團(tuán)”

如果說Manus代表了人工智能在工具化應(yīng)用上的突破,那么智元機(jī)器人發(fā)布的GO-1則是具身智能領(lǐng)域的一次重大飛躍。GO-1是全球首個(gè)通用具身基座大模型,它開創(chuàng)性地提出了Vision-Language-Latent-Action(ViLLA)架構(gòu)。這一架構(gòu)由VLM(多模態(tài)大模型)和MoE(混合專家)組成,通過深度學(xué)習(xí)和生成式人工智能技術(shù),實(shí)現(xiàn)了視覺、語言和動(dòng)作的深度融合。

圖片

1. ViLLA架構(gòu):從“數(shù)據(jù)模型”到“物理世界的交互接口”

ViLLA架構(gòu)的核心在于彌合圖像-文本輸入與機(jī)器人執(zhí)行動(dòng)作之間的鴻溝。與傳統(tǒng)的Vision-Language-Action(VLA)架構(gòu)相比,ViLLA通過引入Latent Action Tokens(隱式動(dòng)作標(biāo)記),顯著提升了模型的動(dòng)作規(guī)劃和執(zhí)行能力。在實(shí)驗(yàn)中,GO-1在五種不同復(fù)雜度的任務(wù)上表現(xiàn)卓越,成功率比現(xiàn)有最優(yōu)模型提高了32。

圖片

2. GO-1的四大創(chuàng)新

(1)人類視頻學(xué)習(xí)

GO-1能夠結(jié)合互聯(lián)網(wǎng)視頻和真實(shí)人類示范進(jìn)行學(xué)習(xí),增強(qiáng)模型對(duì)人類行為的理解。

(2)小樣本快速泛化

在極少數(shù)據(jù)甚至零樣本的情況下,GO-1能夠快速泛化到新場(chǎng)景和任務(wù),極大地降低了具身智能的應(yīng)用門。

(3)一腦多形

GO-1能夠靈活部署到不同類型的機(jī)器人本體上,支持多種機(jī)器人形態(tài),展現(xiàn)出極高的通用性和靈活。

(4)持續(xù)進(jìn)化

通過數(shù)據(jù)回流系統(tǒng),GO-1能夠在實(shí)際使用中不斷學(xué)習(xí)和優(yōu)化自身性能,越用越聰。

3. GO-1的應(yīng)用場(chǎng)景

GO-1的推出標(biāo)志著具身智能向通用化、開放化和智能化方向的快速發(fā)展。未來,機(jī)器人將不再局限于實(shí)驗(yàn)室,而是能夠適應(yīng)多變的真實(shí)世界環(huán)。例如,在工業(yè)制造、物流配送、家庭服務(wù)等領(lǐng)域,GO-1能夠通過視覺、語言和動(dòng)作的深度融合,實(shí)現(xiàn)高效的任務(wù)執(zhí)行。

產(chǎn)業(yè)鏈重構(gòu)與競(jìng)爭(zhēng)升維 以生成式AI和大模型為代表的新一輪人工智能浪潮正在使廣泛的價(jià)值鏈?zhǔn)芤。例如,算力需求的激增推?dòng)了芯片和云計(jì)算產(chǎn)業(yè)升級(jí),數(shù)據(jù)成為核心生產(chǎn)資料,催生數(shù)據(jù)治理和隱私計(jì)算市場(chǎng)。同時(shí),智能化應(yīng)用的深化加速了制造、醫(yī)療、內(nèi)容、金融等行業(yè)的轉(zhuǎn)型升級(jí)。  從“數(shù)據(jù)模型”到“物理世界的交互接口”

與Manus側(cè)重“執(zhí)行”不同,GO - 1主打“理解與生成”,它的技術(shù)定位是成為物理世界的交互接口。其核心技術(shù)包括多模態(tài)大模型、具身推理和工具學(xué)習(xí)。

多模態(tài)大模型支持圖文音視頻的實(shí)時(shí)融合分析,能夠像人類一樣綜合處理多種信息,從而更準(zhǔn)確地理解物理世界中的各種場(chǎng)景和指令。

具身推理通過傳感器數(shù)據(jù)構(gòu)建動(dòng)態(tài)環(huán)境模型,讓GO - 1能夠感知周圍的環(huán)境變化,并根據(jù)這些變化做出相應(yīng)的決策。

工具學(xué)習(xí)則使GO - 1能夠調(diào)用機(jī)械臂、無人機(jī)等實(shí)體設(shè)備執(zhí)行指令,真正實(shí)現(xiàn)了從虛擬世界到物理世界的跨越。

商業(yè)博弈:中國AI軍團(tuán)的全球突圍戰(zhàn)

Manus派強(qiáng)調(diào)“任務(wù)導(dǎo)向”,通過標(biāo)準(zhǔn)化接口接入現(xiàn)有工具鏈,這種方式適合快速商業(yè)化。它能夠在短時(shí)間內(nèi)為企業(yè)和用戶提供高效的服務(wù),滿足市場(chǎng)的需求。

GO - 1派則專注于 “系統(tǒng)級(jí)智能”,通過深度硬件協(xié)同與自主決策能力,構(gòu)建物理世界的實(shí)時(shí)交互閉環(huán)。它更像是 “嬰兒學(xué)習(xí)”—— 從感知環(huán)境到動(dòng)作執(zhí)行全鏈路自主進(jìn)化,而非依賴外部工具。例如,GO-1 通過 AgiBot World 百萬真機(jī)數(shù)據(jù)集訓(xùn)練,能在無預(yù)設(shè)場(chǎng)景下理解人類指令并完成倒水、組裝等精細(xì)操作,這種能力在工業(yè)質(zhì)檢、服務(wù)機(jī)器人等領(lǐng)域展現(xiàn)出顛覆性潛力。其與蘑菇車聯(lián)車路云網(wǎng)絡(luò)的結(jié)合,更實(shí)現(xiàn)了從 “單車智能” 到 “城市級(jí)智能體” 的躍遷,為自動(dòng)駕駛、低空物流等場(chǎng)景提供系統(tǒng)級(jí)解決方案。

兩者并無優(yōu)劣之分。Manus搶占企業(yè)服務(wù)市場(chǎng),憑借其強(qiáng)大的執(zhí)行能力和高效的任務(wù)處理能力,為企業(yè)提供全方位的解決方案;GO - 1深耕硬件集成領(lǐng)域,通過與實(shí)體設(shè)備的深度融合,實(shí)現(xiàn)物理世界的智能交互。

政策對(duì)AI的支持

在政策層面,中國政府高度重視人工智能的發(fā)展。2025年全國兩會(huì)再次強(qiáng)調(diào)“人工智能+”行動(dòng),提出要持續(xù)推進(jìn)“人工智能+”,將數(shù)字技術(shù)與制造優(yōu)勢(shì)、市場(chǎng)優(yōu)勢(shì)更好結(jié)合起來。這一政策導(dǎo)向?qū)槿斯ぶ悄芗夹g(shù)的落地和應(yīng)用提供有力支持。 從“互聯(lián)網(wǎng)+”到“人工智能+”,AI已成為全球新一輪科技革命和產(chǎn)業(yè)變革的核心內(nèi)容。未來,隨著技術(shù)的不斷進(jìn)步和政策的支持,人工智能將在更多領(lǐng)域?qū)崿F(xiàn)突破,推動(dòng)社會(huì)的智能化發(fā)展。 AI的 “具身化” 與 “通用化”

從 Manus 的爭(zhēng)議到 GO-1 的突破,AI 的發(fā)展從未如此貼近現(xiàn)實(shí)。當(dāng)智元機(jī)器人在臨港工廠量產(chǎn)人形機(jī)器人,當(dāng) Manus 的更新預(yù)告引發(fā)期待,我們正站在一個(gè)新時(shí)代的門檻:AI 不再是屏幕后的代碼,而是能感知、思考、行動(dòng)的 “數(shù)字生命體”,

正如蘑菇車聯(lián)通過深度整合物理世界實(shí)時(shí)數(shù)據(jù)的AI大模型--MogoMind構(gòu)建城市的實(shí)時(shí)數(shù)字孿生底座,其通感算網(wǎng)絡(luò)已賦能自動(dòng)駕駛、低空經(jīng)濟(jì)等領(lǐng)域,為 AI 與物理世界的深度融合提供了基礎(chǔ)設(shè)施支撐。這場(chǎng)技術(shù)革命,或?qū)⒅匦露x人類與世界的交互方式。

具身化是AI發(fā)展的重要方向。AI將從虛擬世界走向物理世界,通過機(jī)器人、無人機(jī)等終端直接參與生產(chǎn)生活。這意味著AI將不再僅僅是人們?cè)谄聊磺笆褂玫墓ぞ,而是能夠真正融入到人們的生活和工作中,成為人們的伙伴和助手?/p>

通用化也是AI發(fā)展的必然趨勢(shì)。單一任務(wù)模型將被基座模型取代,AI系統(tǒng)需同時(shí)具備理解、推理、執(zhí)行的綜合能力。這將使AI能夠更加靈活地應(yīng)對(duì)各種復(fù)雜的任務(wù)和場(chǎng)景,為人類提供更加全面、高效的服務(wù)。

這一趨勢(shì)與馬斯克的Optimus、特斯拉的AI戰(zhàn)略不謀而合。當(dāng)具身智能與通用智能體深度融合,AI或?qū)⒄嬲蔀?“人類的延伸”—— 既能在云端運(yùn)籌帷幄,又能在現(xiàn)實(shí)世界動(dòng)手創(chuàng)造智能時(shí)代的終極圖景 —— 一個(gè)虛實(shí)交融、萬物互聯(lián)的實(shí)時(shí)數(shù)字孿生世界。

       原文標(biāo)題 : 從 Manus 到 GO-1:當(dāng)AI逐漸走入物理世界

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)