紅杉中國(guó)連投三輪,上海交大教授帶隊(duì)造機(jī)器人大腦
作者|向欣
編輯|白雪
今年,Deepseek 橫空出世。
超強(qiáng)性能、免費(fèi)開源、低訓(xùn)練成本等特點(diǎn)讓它如同一聲驚雷震撼了全世界,投資市場(chǎng)也在它的誕生和火爆中,看到中國(guó)企業(yè)做大模型的巨大潛力。
以具身智能大模型為代表的機(jī)器人大腦,現(xiàn)已成為具身智能領(lǐng)域,資本重點(diǎn)關(guān)注的核心賽道。
最近,具身智能大模型企業(yè)穹徹智能就完成了數(shù)億元 Pre-A++輪融資。盛宇投資、清科創(chuàng)投、嘉御資本、云啟資本、上海科創(chuàng)基金等機(jī)構(gòu)參投。
現(xiàn)下具身智能大模型技術(shù)路線以 VLA(視覺-語(yǔ)言-動(dòng)作模型)、VLM(視覺-語(yǔ)言模型)為主流。
而穹徹智能則另辟蹊徑,把力反饋融入機(jī)器人決策過程,選擇研發(fā)「以力為中心」的具身智能大模型和相關(guān)工具與平臺(tái),發(fā)布了穹徹具身大腦(Noematrix Brain)。
這種技術(shù)路線在視覺、語(yǔ)言信息之外,增加了力反饋的信息,使得機(jī)器人能夠更全面地認(rèn)識(shí)現(xiàn)實(shí)世界。
借助 Noematrix Brain,在 2024 年 7 月,機(jī)器人就學(xué)會(huì)了幫人刮胡子,還能削黃瓜、疊衣服、收納桌面物品。
這個(gè)被刮胡子的人就是穹徹智能創(chuàng)始人之一盧策吾
其中,機(jī)器人疊衣服這一技能的展示,比美國(guó)明星具身智能企業(yè) Physical Intelligence 早了 4 個(gè)月。
針對(duì)業(yè)界普遍頭疼的數(shù)據(jù)問題,穹徹智能也提出了多種低成本、高效率的數(shù)據(jù)收集與機(jī)器人訓(xùn)練方案,包括 CoMiner 伴隨式數(shù)采系統(tǒng)、規(guī);Ψ答伳7聰(shù)據(jù)與學(xué)習(xí)模型-力捕捉系統(tǒng) ForceMimic 等。
宇樹科技創(chuàng)始人王興興認(rèn)為,相比硬件本體,機(jī)器人大腦才是目前最大的難題,全球都在等待機(jī)器人大腦的誕生。
穹徹智能給出了一個(gè)切實(shí)可行的答案。
創(chuàng)始人來(lái)自斯坦福
產(chǎn)業(yè)化經(jīng)驗(yàn)豐富
穹徹智能 2023 年 11 月成立,由成立近十年、估值達(dá) 10 億美元的智能機(jī)器人公司非夕科技孵化。
截至目前,穹徹智能已完成 4 輪融資。頂尖投資機(jī)構(gòu) Prosperity7、紅杉中國(guó)連續(xù)三輪加注,充分顯示出資本對(duì)這家公司技術(shù)路線的高度認(rèn)可。
縱觀具身智能領(lǐng)域,受資本歡迎的企業(yè),在人才上一般為「科研精英+產(chǎn)業(yè)老將」的配置,穹徹智能也不例外。
高校,或許是連接兩位創(chuàng)始人的紐帶。
穹徹智能創(chuàng)始人盧策吾、王世全均來(lái)自在機(jī)器人領(lǐng)域長(zhǎng)期領(lǐng)先的頂尖高!绹(guó)斯坦福大學(xué),且目前都任職于上海交通大學(xué)。
盧策吾是斯坦福大學(xué)人工智能實(shí)驗(yàn)室博士后,師從知名學(xué)者李飛飛和 Leo Guibas 教授(美國(guó)工程院院士)。
2016 年,盧策吾回國(guó)發(fā)展,現(xiàn)任上海交通大學(xué)人工智能學(xué)院副院長(zhǎng)及教授。
與盧策吾一樣,王世全也在斯坦福大學(xué)人工智能實(shí)驗(yàn)室工作過。
王世全是斯坦福大學(xué)仿生與靈巧操作實(shí)驗(yàn)室及人工智能實(shí)驗(yàn)室(機(jī)器人方向)博士,于 2016 年創(chuàng)辦非夕科技,在通用機(jī)器人本體 AI 技術(shù)融合與場(chǎng)景應(yīng)用中積累了豐富經(jīng)驗(yàn)。
2021 年,王世全開始擔(dān)任上海交通大學(xué)客座教授,目前兼任上海市科協(xié)常委。
在團(tuán)隊(duì)中,盧策吾代表的是前沿科學(xué)力量,而王世全則代表商業(yè)化能力。
盧策吾是國(guó)內(nèi)最早研究具身智能領(lǐng)域的學(xué)者之一,也是該領(lǐng)域唯一的科學(xué)探索獎(jiǎng)獲得者。
盧策吾在學(xué)術(shù)研究方面成果豐碩,他主導(dǎo)的科研團(tuán)隊(duì)在《自然》、《自然-機(jī)器智能》、TPAMI、T-RO 等頂級(jí)期刊上發(fā)表了 100 多篇論文,獲國(guó)際機(jī)器人頂會(huì)最佳論文、最佳系統(tǒng)論文提名。
盧策吾團(tuán)隊(duì)還原創(chuàng)提出了 AnyGrasp 抓取算法,讓機(jī)器人首次實(shí)現(xiàn)了在雜亂場(chǎng)景中也能像人一樣精準(zhǔn)抓取物品。
團(tuán)隊(duì)也是國(guó)內(nèi)唯一獲邀加入 Open X Embodiment Dataset 國(guó)際聯(lián)合具身智能大規(guī)模數(shù)據(jù)集項(xiàng)目的學(xué)術(shù)力量。
實(shí)際上,AnyGrasp 抓取算法也是上海交大-非夕科技聯(lián)合實(shí)驗(yàn)室的研究成果。
該實(shí)驗(yàn)室于 2019 年成立,為后續(xù)非夕科技孵化穹徹智能奠定了基礎(chǔ)。穹徹智能多項(xiàng)技術(shù)成果都是與上海交通大學(xué)聯(lián)合推出的。
除了高?蒲匈Y源支持外,作為穹徹智能的產(chǎn)業(yè)支持方,非夕科技不僅讓穹徹智能繼承了其在機(jī)器人力控技術(shù)上的技術(shù)優(yōu)勢(shì),也能夠?yàn)轳窂刂悄芴峁┯布A(chǔ)與產(chǎn)品落地能力,使其技術(shù)能夠得到規(guī);瘧(yīng)用。
非夕科技是一家自適應(yīng)機(jī)器人公司,2022 年估值已達(dá) 10 億美元(約合人民幣 73 億),已發(fā)布兩款機(jī)器人產(chǎn)品,分別是七軸自適應(yīng)機(jī)器人 RIZON 拂曉、自適應(yīng)并聯(lián)機(jī)器人玄暉 Moonlight。
自適應(yīng)機(jī)器人可以理解為能夠適應(yīng)多個(gè)操作對(duì)象、多種環(huán)境、多類任務(wù)的智能機(jī)器人,兼具傳統(tǒng)工業(yè)機(jī)器人的高性能與協(xié)作機(jī)器人的安全性,主要形態(tài)為機(jī)械臂、四足機(jī)器人等。
2020 年,非夕科技就已實(shí)現(xiàn)了規(guī);慨a(chǎn),首批百臺(tái)自適應(yīng)機(jī)器人在華南制造中心順利投產(chǎn)下線。
目前,非夕科技機(jī)器人產(chǎn)品已在工業(yè)制造、食品加工及醫(yī)療服務(wù)等多個(gè)行業(yè)廣泛應(yīng)用,能夠執(zhí)行裝配、打磨拋光、汽車座椅熨燙、新能源汽車充電等多種復(fù)雜任務(wù),產(chǎn)品已經(jīng)過市場(chǎng)驗(yàn)證。
這意味著相較其他具身智能大模型企業(yè),穹徹智能擁有天然的硬件優(yōu)勢(shì)。其在技術(shù)成果展示中,也多次使用非夕科技的機(jī)械臂作為載體。
雖然力控技術(shù)一脈相承,但兩家公司的路線仍然有差異,穹徹展示的技能大多面向家庭場(chǎng)景,而非夕科技的機(jī)器人多應(yīng)用于工業(yè)場(chǎng)景。
頂尖科研力量與成熟產(chǎn)業(yè)化經(jīng)驗(yàn)的融合,使得穹徹智能更容易在技術(shù)深度與商業(yè)落地之間實(shí)現(xiàn)高效閉環(huán)。
讓機(jī)器人學(xué)會(huì)削黃瓜、疊衣服
自主性極高
穹徹智能的研發(fā)思路是,回歸問題本質(zhì)提出解決方案,同時(shí)保證技術(shù)的可實(shí)現(xiàn)性與商業(yè)上的可落地性。
這兩點(diǎn),恰好滿足了現(xiàn)在資本既追求前沿技術(shù),又希望快速實(shí)現(xiàn)投資回報(bào)的需求。
穹徹智能主要解決具身智能領(lǐng)域兩個(gè)目前最核心的難題:大模型、數(shù)據(jù),提出了創(chuàng)新的解決方案,并且一直以低成本、高效率、可規(guī);鳛樨灤┘夹g(shù)研發(fā)、方案設(shè)計(jì)全流程的重要原則。
大模型方面,穹徹智能推出了兼顧泛化性和落地性能要求的具身智能大腦 Noematrix Brain。
盧策吾認(rèn)為,不能單純地通過復(fù)制語(yǔ)言大模型 Scaling Law 的方式來(lái)打造具身智能大模型。
因?yàn)檎Z(yǔ)言大模型的訓(xùn)練方法是填充海量的互聯(lián)網(wǎng)數(shù)據(jù)。具身智能相應(yīng)需要的是大量來(lái)自現(xiàn)實(shí)世界的物理交互數(shù)據(jù)
按照這種技術(shù)路線,具身智能需要 1:1 的實(shí)際數(shù)據(jù)采集,但這些數(shù)據(jù)的生成、獲取難度和成本遠(yuǎn)高于互聯(lián)網(wǎng)數(shù)據(jù),在數(shù)量和質(zhì)量上都無(wú)法滿足具身智能大模型的訓(xùn)練需求。
所以,盧策吾團(tuán)隊(duì)不依賴于傳統(tǒng)路徑,而是基于第一性原理,回歸到具身智能大模型需要知道「世界是什么」;其次它要知道「如何決策」這兩個(gè)本質(zhì)問題上來(lái)思考解決方法,重新設(shè)計(jì)技術(shù)框架。
穹徹智能通過將操作的物理常識(shí)和力反饋結(jié)合在一起,打造了兩個(gè)大模型。
具身智能大腦 Noematrix Brain 就是由這兩個(gè)大模型組成,它們分別是:
實(shí)體世界大模型:教機(jī)器人掌握基本的物理常識(shí),理解世界
機(jī)器人行為大模型:機(jī)器人結(jié)合物理常識(shí)和操作時(shí)的反饋力來(lái)調(diào)整動(dòng)作,像人類一樣進(jìn)行決策、使用力量。
兩個(gè)大模型構(gòu)成一體,進(jìn)行端到端的聯(lián)合訓(xùn)練。
打個(gè)比喻,傳統(tǒng)的技術(shù)路線是讓人類老師親身給機(jī)器人示范動(dòng)作,并且事無(wú)巨細(xì)告訴機(jī)器人現(xiàn)場(chǎng)的所有細(xì)節(jié),每面對(duì)一個(gè)新環(huán)境、新任務(wù),需要重新進(jìn)行基礎(chǔ)教學(xué)。
而穹徹智能的技術(shù)路線是,讓老師教機(jī)器人物理知識(shí),理解物體之間的力學(xué)關(guān)系,結(jié)合語(yǔ)言/視覺大模型做預(yù)訓(xùn)練或輔助,再讓機(jī)器人自己在現(xiàn)實(shí)世界中根據(jù)這些知識(shí)和力反饋進(jìn)行學(xué)習(xí)。
理論上,穹徹智能創(chuàng)新的技術(shù)路線能夠降低具身智能大模型的數(shù)據(jù)量需求,使訓(xùn)練變得低成本、可規(guī)模化。而在現(xiàn)實(shí)中,它已經(jīng)展示出可行性。
2024 年 7 月舉辦的世界人工智能大會(huì)期間,具身智能大腦 Noematrix Brain 部署到雙臂機(jī)器人、單臂移動(dòng)機(jī)器人上,在展會(huì)現(xiàn)場(chǎng)首次公開展示多種技能,成功執(zhí)行了整理、收納桌面/地面物品,疊衣服,削黃瓜等任務(wù)。
這些任務(wù)對(duì)于人類來(lái)說(shuō)很簡(jiǎn)單,對(duì)于機(jī)器人來(lái)說(shuō)卻極其復(fù)雜,尤其是疊衣服與削黃瓜。
執(zhí)行這些任務(wù)涉及高精度的力控和運(yùn)動(dòng)規(guī)劃,對(duì)柔性物體的操作要求極高,需要機(jī)器人實(shí)時(shí)調(diào)整抓取力道,避免破損或滑動(dòng)。
任務(wù)之間差異大,也要求大模型具備強(qiáng)大的泛化能力,以便應(yīng)對(duì)不同形態(tài)和材質(zhì)的物品,并根據(jù)環(huán)境實(shí)時(shí)調(diào)整策略完成操作。
自主性是這個(gè)大腦的重要特點(diǎn)。任務(wù)執(zhí)行過程中,具身大腦自主進(jìn)行的操作包括但不限于物品識(shí)別、軌跡規(guī)劃、決策、避障等等。
降低數(shù)據(jù)獲取成本
數(shù)采系統(tǒng)已獲百套訂單
數(shù)據(jù)方面,穹徹智能聯(lián)合上交大研發(fā)了三種數(shù)據(jù)采集方式,并推出了一個(gè)數(shù)據(jù)集,包括:
Noematrix CoMiner 伴隨式數(shù)采系統(tǒng),基于「生產(chǎn)伴隨」式外骨骼數(shù)據(jù)采集方式研發(fā);
規(guī)模化力反饋模仿數(shù)據(jù)與學(xué)習(xí)模型-力捕捉系統(tǒng) ForceMimic;
視覺-觸覺聯(lián)合記錄和追蹤系統(tǒng) ViTaM;
雙手復(fù)雜操作任務(wù)數(shù)據(jù)集 OakInk2:涵蓋廚房、書房、實(shí)驗(yàn)室、浴室 4 大交互場(chǎng)景,包含 75 類物體。
這些數(shù)據(jù)采集方案,都在降低數(shù)據(jù)獲取成本的同時(shí),提高了數(shù)據(jù)利用效率。
「生產(chǎn)伴隨」式外骨骼數(shù)據(jù)采集方式解決的是傳統(tǒng)遙操作設(shè)備昂貴且缺乏便攜性的問題。
研究團(tuán)隊(duì)開發(fā)了一款開源、低成本、通用、便攜、持久耐用和易維護(hù)的外骨骼設(shè)備 AirExo,可適配多種機(jī)械臂。
AirExo 不僅支持雙臂機(jī)器人的遙操作完成數(shù)據(jù)采集,還能不局限于實(shí)驗(yàn)室,直接記錄廣泛且經(jīng)濟(jì)的野外演示數(shù)據(jù)。
團(tuán)隊(duì)僅通過 3 分鐘的遙操作演示,結(jié)合 AirExo 收集的廣泛和多樣化的野外數(shù)據(jù),所訓(xùn)練的機(jī)器人策略能夠媲美通過超過 20 分鐘遙操作演示學(xué)習(xí)的策略,數(shù)采效率提升 7 倍。
規(guī)模化力反饋模仿數(shù)據(jù)與學(xué)習(xí)模型-力捕捉系統(tǒng) ForceMimic,則是解決機(jī)器人力控?cái)?shù)據(jù)收集的問題。力控技術(shù)在機(jī)器人操作中至關(guān)重要,而業(yè)界缺乏大規(guī)模力交互數(shù)據(jù)。
ForceMimic 系統(tǒng)由兩個(gè)部分組成:
ForceCapture:能「記錄人怎么操作東西」的設(shè)備,可精準(zhǔn)、實(shí)時(shí)捕捉并記錄操作過程中的力、姿態(tài)及運(yùn)動(dòng)軌跡等多維度數(shù)據(jù);
HybridIL:能「讓機(jī)器人學(xué)會(huì)人類怎么操作」的模仿學(xué)習(xí)算法。
實(shí)驗(yàn)表明,F(xiàn)orceCapture 的數(shù)據(jù)采集效率幾乎是遙操作的 3 倍,且該設(shè)備幾乎無(wú)需任何額外培訓(xùn),比需要對(duì)操作員進(jìn)行專業(yè)培訓(xùn)的遙操作設(shè)備更具易用性。
系統(tǒng)的另一組成部分——算法 HybridIL 也表現(xiàn)出優(yōu)秀的性能,能夠在嚴(yán)苛的條件下保持 85% 的任務(wù)執(zhí)行成功率。
視覺-觸覺聯(lián)合記錄和追蹤系統(tǒng) ViTaM 解決的是數(shù)據(jù)收集過程中,存在視野盲區(qū)的問題。
ViTaM 系統(tǒng)同樣由兩個(gè)部分組成:
一個(gè)可伸縮的觸覺手套和一個(gè) 3D 相機(jī):負(fù)責(zé)記錄操作過程;
一個(gè)基于視覺-觸覺的聯(lián)合學(xué)習(xí)框架:重建被手部遮擋或形變的物體細(xì)節(jié)。
人在操作時(shí)常常會(huì)遮擋關(guān)鍵部位,尤其是處理柔軟或易變形物體時(shí),單靠視覺難以感知細(xì)節(jié)。
ViTaM 系統(tǒng)的作用就是,幫助機(jī)器人從現(xiàn)實(shí)世界中獲得操作數(shù)據(jù)的完整狀態(tài),從而實(shí)現(xiàn)和人類一樣的靈巧操作。
比如在拿一塊海綿時(shí),ViTaM 系統(tǒng)能夠讓機(jī)器人感知到其柔軟性、面向手掌心部分的形變情況以及接觸的力度,從而精確地控制操作。
在商業(yè)化方面,穹徹智能的種種技術(shù)成果,得到了市場(chǎng)的初步認(rèn)可,不僅獲得了訂單,也正在家庭服務(wù)、食品加工等場(chǎng)景嘗試落地。
穹徹智能具身智能大腦 Noematrix Brain 獲得單場(chǎng)景百套訂單的突破,基于「生產(chǎn)伴隨」式數(shù)據(jù)采集方式研發(fā)的數(shù)采系統(tǒng)也獲得了近百套訂單。
在家庭服務(wù)場(chǎng)景,穹徹智能與海爾機(jī)器人聯(lián)合研發(fā)了兩款家庭機(jī)器人,分別能夠自主閉環(huán)完成地面物品清理、衣物洗烘任務(wù)。
在食品加工領(lǐng)域,「穹徹智能」已與知名食品廠商達(dá)成合作意向,雙方將加快復(fù)雜食品生產(chǎn)、加工處理產(chǎn)線的智能化與自動(dòng)化轉(zhuǎn)型。
具身智能仍面臨著許多技術(shù)和應(yīng)用上的挑戰(zhàn),尤其是在大模型訓(xùn)練的數(shù)據(jù)難題、低效的訓(xùn)練方式以及如何讓機(jī)器人真正理解和適應(yīng)復(fù)雜的現(xiàn)實(shí)世界等問題上進(jìn)展緩慢。
結(jié)合低成本、高效率的數(shù)據(jù)收集、利用方式,以及創(chuàng)新的具身智能大模型技術(shù)路線,穹徹智能為行業(yè)提供了一個(gè)具有可持續(xù)性與可擴(kuò)展性的技術(shù)方案,有望繼續(xù)拓展具身智能的應(yīng)用邊界。
原文標(biāo)題 : 紅杉中國(guó)連投三輪,上海交大教授帶隊(duì)造機(jī)器人大腦

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車】汽車E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺(tái)
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來(lái)商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽(yáng)光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長(zhǎng)空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?