訂閱
糾錯(cuò)
加入自媒體

紅杉中國(guó)連投三輪,上海交大教授帶隊(duì)造機(jī)器人大腦

作者|向欣

編輯|白雪

今年,Deepseek 橫空出世。

超強(qiáng)性能、免費(fèi)開源、低訓(xùn)練成本等特點(diǎn)讓它如同一聲驚雷震撼了全世界,投資市場(chǎng)也在它的誕生和火爆中,看到中國(guó)企業(yè)做大模型的巨大潛力。

以具身智能大模型為代表的機(jī)器人大腦,現(xiàn)已成為具身智能領(lǐng)域,資本重點(diǎn)關(guān)注的核心賽道。

最近,具身智能大模型企業(yè)穹徹智能就完成了數(shù)億元 Pre-A++輪融資。盛宇投資、清科創(chuàng)投、嘉御資本、云啟資本、上海科創(chuàng)基金等機(jī)構(gòu)參投。

現(xiàn)下具身智能大模型技術(shù)路線以 VLA(視覺-語(yǔ)言-動(dòng)作模型)、VLM(視覺-語(yǔ)言模型)為主流。

而穹徹智能則另辟蹊徑,把力反饋融入機(jī)器人決策過程,選擇研發(fā)「以力為中心」的具身智能大模型和相關(guān)工具與平臺(tái),發(fā)布了穹徹具身大腦(Noematrix Brain)。

這種技術(shù)路線在視覺、語(yǔ)言信息之外,增加了力反饋的信息,使得機(jī)器人能夠更全面地認(rèn)識(shí)現(xiàn)實(shí)世界。

借助 Noematrix Brain,在 2024 年 7 月,機(jī)器人就學(xué)會(huì)了幫人刮胡子,還能削黃瓜、疊衣服、收納桌面物品。

這個(gè)被刮胡子的人就是穹徹智能創(chuàng)始人之一盧策吾

其中,機(jī)器人疊衣服這一技能的展示,比美國(guó)明星具身智能企業(yè) Physical Intelligence 早了 4 個(gè)月。

針對(duì)業(yè)界普遍頭疼的數(shù)據(jù)問題,穹徹智能也提出了多種低成本、高效率的數(shù)據(jù)收集與機(jī)器人訓(xùn)練方案,包括 CoMiner 伴隨式數(shù)采系統(tǒng)、規(guī);Ψ答伳7聰(shù)據(jù)與學(xué)習(xí)模型-力捕捉系統(tǒng) ForceMimic 等。

宇樹科技創(chuàng)始人王興興認(rèn)為,相比硬件本體,機(jī)器人大腦才是目前最大的難題,全球都在等待機(jī)器人大腦的誕生。

穹徹智能給出了一個(gè)切實(shí)可行的答案。

創(chuàng)始人來(lái)自斯坦福

產(chǎn)業(yè)化經(jīng)驗(yàn)豐富

穹徹智能 2023 年 11 月成立,由成立近十年、估值達(dá) 10 億美元的智能機(jī)器人公司非夕科技孵化。

截至目前,穹徹智能已完成 4 輪融資。頂尖投資機(jī)構(gòu) Prosperity7、紅杉中國(guó)連續(xù)三輪加注,充分顯示出資本對(duì)這家公司技術(shù)路線的高度認(rèn)可。

縱觀具身智能領(lǐng)域,受資本歡迎的企業(yè),在人才上一般為「科研精英+產(chǎn)業(yè)老將」的配置,穹徹智能也不例外。

高校,或許是連接兩位創(chuàng)始人的紐帶。

穹徹智能創(chuàng)始人盧策吾、王世全均來(lái)自在機(jī)器人領(lǐng)域長(zhǎng)期領(lǐng)先的頂尖高!绹(guó)斯坦福大學(xué),且目前都任職于上海交通大學(xué)。

盧策吾是斯坦福大學(xué)人工智能實(shí)驗(yàn)室博士后,師從知名學(xué)者李飛飛和 Leo Guibas 教授(美國(guó)工程院院士)。

2016 年,盧策吾回國(guó)發(fā)展,現(xiàn)任上海交通大學(xué)人工智能學(xué)院副院長(zhǎng)及教授。

與盧策吾一樣,王世全也在斯坦福大學(xué)人工智能實(shí)驗(yàn)室工作過。

王世全是斯坦福大學(xué)仿生與靈巧操作實(shí)驗(yàn)室及人工智能實(shí)驗(yàn)室(機(jī)器人方向)博士,于 2016 年創(chuàng)辦非夕科技,在通用機(jī)器人本體 AI 技術(shù)融合與場(chǎng)景應(yīng)用中積累了豐富經(jīng)驗(yàn)。

2021 年,王世全開始擔(dān)任上海交通大學(xué)客座教授,目前兼任上海市科協(xié)常委。

在團(tuán)隊(duì)中,盧策吾代表的是前沿科學(xué)力量,而王世全則代表商業(yè)化能力。

盧策吾是國(guó)內(nèi)最早研究具身智能領(lǐng)域的學(xué)者之一,也是該領(lǐng)域唯一的科學(xué)探索獎(jiǎng)獲得者。

盧策吾在學(xué)術(shù)研究方面成果豐碩,他主導(dǎo)的科研團(tuán)隊(duì)在《自然》、《自然-機(jī)器智能》、TPAMI、T-RO 等頂級(jí)期刊上發(fā)表了 100 多篇論文,獲國(guó)際機(jī)器人頂會(huì)最佳論文、最佳系統(tǒng)論文提名。

盧策吾團(tuán)隊(duì)還原創(chuàng)提出了 AnyGrasp 抓取算法,讓機(jī)器人首次實(shí)現(xiàn)了在雜亂場(chǎng)景中也能像人一樣精準(zhǔn)抓取物品。

團(tuán)隊(duì)也是國(guó)內(nèi)唯一獲邀加入 Open X Embodiment Dataset 國(guó)際聯(lián)合具身智能大規(guī)模數(shù)據(jù)集項(xiàng)目的學(xué)術(shù)力量。

實(shí)際上,AnyGrasp 抓取算法也是上海交大-非夕科技聯(lián)合實(shí)驗(yàn)室的研究成果。

該實(shí)驗(yàn)室于 2019 年成立,為后續(xù)非夕科技孵化穹徹智能奠定了基礎(chǔ)。穹徹智能多項(xiàng)技術(shù)成果都是與上海交通大學(xué)聯(lián)合推出的。

除了高?蒲匈Y源支持外,作為穹徹智能的產(chǎn)業(yè)支持方,非夕科技不僅讓穹徹智能繼承了其在機(jī)器人力控技術(shù)上的技術(shù)優(yōu)勢(shì),也能夠?yàn)轳窂刂悄芴峁┯布A(chǔ)與產(chǎn)品落地能力,使其技術(shù)能夠得到規(guī);瘧(yīng)用。

非夕科技是一家自適應(yīng)機(jī)器人公司,2022 年估值已達(dá) 10 億美元(約合人民幣 73 億),已發(fā)布兩款機(jī)器人產(chǎn)品,分別是七軸自適應(yīng)機(jī)器人 RIZON 拂曉、自適應(yīng)并聯(lián)機(jī)器人玄暉 Moonlight。

自適應(yīng)機(jī)器人可以理解為能夠適應(yīng)多個(gè)操作對(duì)象、多種環(huán)境、多類任務(wù)的智能機(jī)器人,兼具傳統(tǒng)工業(yè)機(jī)器人的高性能與協(xié)作機(jī)器人的安全性,主要形態(tài)為機(jī)械臂、四足機(jī)器人等。

2020 年,非夕科技就已實(shí)現(xiàn)了規(guī);慨a(chǎn),首批百臺(tái)自適應(yīng)機(jī)器人在華南制造中心順利投產(chǎn)下線。

目前,非夕科技機(jī)器人產(chǎn)品已在工業(yè)制造、食品加工及醫(yī)療服務(wù)等多個(gè)行業(yè)廣泛應(yīng)用,能夠執(zhí)行裝配、打磨拋光、汽車座椅熨燙、新能源汽車充電等多種復(fù)雜任務(wù),產(chǎn)品已經(jīng)過市場(chǎng)驗(yàn)證。

這意味著相較其他具身智能大模型企業(yè),穹徹智能擁有天然的硬件優(yōu)勢(shì)。其在技術(shù)成果展示中,也多次使用非夕科技的機(jī)械臂作為載體。

雖然力控技術(shù)一脈相承,但兩家公司的路線仍然有差異,穹徹展示的技能大多面向家庭場(chǎng)景,而非夕科技的機(jī)器人多應(yīng)用于工業(yè)場(chǎng)景。

頂尖科研力量與成熟產(chǎn)業(yè)化經(jīng)驗(yàn)的融合,使得穹徹智能更容易在技術(shù)深度與商業(yè)落地之間實(shí)現(xiàn)高效閉環(huán)。

讓機(jī)器人學(xué)會(huì)削黃瓜、疊衣服

自主性極高

穹徹智能的研發(fā)思路是,回歸問題本質(zhì)提出解決方案,同時(shí)保證技術(shù)的可實(shí)現(xiàn)性與商業(yè)上的可落地性。

這兩點(diǎn),恰好滿足了現(xiàn)在資本既追求前沿技術(shù),又希望快速實(shí)現(xiàn)投資回報(bào)的需求。

穹徹智能主要解決具身智能領(lǐng)域兩個(gè)目前最核心的難題:大模型、數(shù)據(jù),提出了創(chuàng)新的解決方案,并且一直以低成本、高效率、可規(guī);鳛樨灤┘夹g(shù)研發(fā)、方案設(shè)計(jì)全流程的重要原則。

大模型方面,穹徹智能推出了兼顧泛化性和落地性能要求的具身智能大腦 Noematrix Brain。

盧策吾認(rèn)為,不能單純地通過復(fù)制語(yǔ)言大模型 Scaling Law 的方式來(lái)打造具身智能大模型。

因?yàn)檎Z(yǔ)言大模型的訓(xùn)練方法是填充海量的互聯(lián)網(wǎng)數(shù)據(jù)。具身智能相應(yīng)需要的是大量來(lái)自現(xiàn)實(shí)世界的物理交互數(shù)據(jù)

按照這種技術(shù)路線,具身智能需要 1:1 的實(shí)際數(shù)據(jù)采集,但這些數(shù)據(jù)的生成、獲取難度和成本遠(yuǎn)高于互聯(lián)網(wǎng)數(shù)據(jù),在數(shù)量和質(zhì)量上都無(wú)法滿足具身智能大模型的訓(xùn)練需求。

所以,盧策吾團(tuán)隊(duì)不依賴于傳統(tǒng)路徑,而是基于第一性原理,回歸到具身智能大模型需要知道「世界是什么」;其次它要知道「如何決策」這兩個(gè)本質(zhì)問題上來(lái)思考解決方法,重新設(shè)計(jì)技術(shù)框架。

穹徹智能通過將操作的物理常識(shí)和力反饋結(jié)合在一起,打造了兩個(gè)大模型。

具身智能大腦 Noematrix Brain 就是由這兩個(gè)大模型組成,它們分別是:

實(shí)體世界大模型:教機(jī)器人掌握基本的物理常識(shí),理解世界

機(jī)器人行為大模型:機(jī)器人結(jié)合物理常識(shí)和操作時(shí)的反饋力來(lái)調(diào)整動(dòng)作,像人類一樣進(jìn)行決策、使用力量。

兩個(gè)大模型構(gòu)成一體,進(jìn)行端到端的聯(lián)合訓(xùn)練。

打個(gè)比喻,傳統(tǒng)的技術(shù)路線是讓人類老師親身給機(jī)器人示范動(dòng)作,并且事無(wú)巨細(xì)告訴機(jī)器人現(xiàn)場(chǎng)的所有細(xì)節(jié),每面對(duì)一個(gè)新環(huán)境、新任務(wù),需要重新進(jìn)行基礎(chǔ)教學(xué)。

而穹徹智能的技術(shù)路線是,讓老師教機(jī)器人物理知識(shí),理解物體之間的力學(xué)關(guān)系,結(jié)合語(yǔ)言/視覺大模型做預(yù)訓(xùn)練或輔助,再讓機(jī)器人自己在現(xiàn)實(shí)世界中根據(jù)這些知識(shí)和力反饋進(jìn)行學(xué)習(xí)。

理論上,穹徹智能創(chuàng)新的技術(shù)路線能夠降低具身智能大模型的數(shù)據(jù)量需求,使訓(xùn)練變得低成本、可規(guī)模化。而在現(xiàn)實(shí)中,它已經(jīng)展示出可行性。

2024 年 7 月舉辦的世界人工智能大會(huì)期間,具身智能大腦 Noematrix Brain 部署到雙臂機(jī)器人、單臂移動(dòng)機(jī)器人上,在展會(huì)現(xiàn)場(chǎng)首次公開展示多種技能,成功執(zhí)行了整理、收納桌面/地面物品,疊衣服,削黃瓜等任務(wù)。

這些任務(wù)對(duì)于人類來(lái)說(shuō)很簡(jiǎn)單,對(duì)于機(jī)器人來(lái)說(shuō)卻極其復(fù)雜,尤其是疊衣服與削黃瓜。

執(zhí)行這些任務(wù)涉及高精度的力控和運(yùn)動(dòng)規(guī)劃,對(duì)柔性物體的操作要求極高,需要機(jī)器人實(shí)時(shí)調(diào)整抓取力道,避免破損或滑動(dòng)。

任務(wù)之間差異大,也要求大模型具備強(qiáng)大的泛化能力,以便應(yīng)對(duì)不同形態(tài)和材質(zhì)的物品,并根據(jù)環(huán)境實(shí)時(shí)調(diào)整策略完成操作。

自主性是這個(gè)大腦的重要特點(diǎn)。任務(wù)執(zhí)行過程中,具身大腦自主進(jìn)行的操作包括但不限于物品識(shí)別、軌跡規(guī)劃、決策、避障等等。

降低數(shù)據(jù)獲取成本

數(shù)采系統(tǒng)已獲百套訂單

數(shù)據(jù)方面,穹徹智能聯(lián)合上交大研發(fā)了三種數(shù)據(jù)采集方式,并推出了一個(gè)數(shù)據(jù)集,包括:

Noematrix CoMiner 伴隨式數(shù)采系統(tǒng),基于「生產(chǎn)伴隨」式外骨骼數(shù)據(jù)采集方式研發(fā);

規(guī)模化力反饋模仿數(shù)據(jù)與學(xué)習(xí)模型-力捕捉系統(tǒng) ForceMimic;

視覺-觸覺聯(lián)合記錄和追蹤系統(tǒng) ViTaM;

雙手復(fù)雜操作任務(wù)數(shù)據(jù)集 OakInk2:涵蓋廚房、書房、實(shí)驗(yàn)室、浴室 4 大交互場(chǎng)景,包含 75 類物體。

這些數(shù)據(jù)采集方案,都在降低數(shù)據(jù)獲取成本的同時(shí),提高了數(shù)據(jù)利用效率。

「生產(chǎn)伴隨」式外骨骼數(shù)據(jù)采集方式解決的是傳統(tǒng)遙操作設(shè)備昂貴且缺乏便攜性的問題。

研究團(tuán)隊(duì)開發(fā)了一款開源、低成本、通用、便攜、持久耐用和易維護(hù)的外骨骼設(shè)備 AirExo,可適配多種機(jī)械臂。

AirExo 不僅支持雙臂機(jī)器人的遙操作完成數(shù)據(jù)采集,還能不局限于實(shí)驗(yàn)室,直接記錄廣泛且經(jīng)濟(jì)的野外演示數(shù)據(jù)。

團(tuán)隊(duì)僅通過 3 分鐘的遙操作演示,結(jié)合 AirExo 收集的廣泛和多樣化的野外數(shù)據(jù),所訓(xùn)練的機(jī)器人策略能夠媲美通過超過 20 分鐘遙操作演示學(xué)習(xí)的策略,數(shù)采效率提升 7 倍。

規(guī)模化力反饋模仿數(shù)據(jù)與學(xué)習(xí)模型-力捕捉系統(tǒng) ForceMimic,則是解決機(jī)器人力控?cái)?shù)據(jù)收集的問題。力控技術(shù)在機(jī)器人操作中至關(guān)重要,而業(yè)界缺乏大規(guī)模力交互數(shù)據(jù)。

ForceMimic 系統(tǒng)由兩個(gè)部分組成:

ForceCapture:能「記錄人怎么操作東西」的設(shè)備,可精準(zhǔn)、實(shí)時(shí)捕捉并記錄操作過程中的力、姿態(tài)及運(yùn)動(dòng)軌跡等多維度數(shù)據(jù);

HybridIL:能「讓機(jī)器人學(xué)會(huì)人類怎么操作」的模仿學(xué)習(xí)算法。

實(shí)驗(yàn)表明,F(xiàn)orceCapture 的數(shù)據(jù)采集效率幾乎是遙操作的 3 倍,且該設(shè)備幾乎無(wú)需任何額外培訓(xùn),比需要對(duì)操作員進(jìn)行專業(yè)培訓(xùn)的遙操作設(shè)備更具易用性。

系統(tǒng)的另一組成部分——算法 HybridIL 也表現(xiàn)出優(yōu)秀的性能,能夠在嚴(yán)苛的條件下保持 85% 的任務(wù)執(zhí)行成功率。

視覺-觸覺聯(lián)合記錄和追蹤系統(tǒng) ViTaM 解決的是數(shù)據(jù)收集過程中,存在視野盲區(qū)的問題。

ViTaM 系統(tǒng)同樣由兩個(gè)部分組成:

一個(gè)可伸縮的觸覺手套和一個(gè) 3D 相機(jī):負(fù)責(zé)記錄操作過程;

一個(gè)基于視覺-觸覺的聯(lián)合學(xué)習(xí)框架:重建被手部遮擋或形變的物體細(xì)節(jié)。

人在操作時(shí)常常會(huì)遮擋關(guān)鍵部位,尤其是處理柔軟或易變形物體時(shí),單靠視覺難以感知細(xì)節(jié)。

ViTaM 系統(tǒng)的作用就是,幫助機(jī)器人從現(xiàn)實(shí)世界中獲得操作數(shù)據(jù)的完整狀態(tài),從而實(shí)現(xiàn)和人類一樣的靈巧操作。

比如在拿一塊海綿時(shí),ViTaM 系統(tǒng)能夠讓機(jī)器人感知到其柔軟性、面向手掌心部分的形變情況以及接觸的力度,從而精確地控制操作。

在商業(yè)化方面,穹徹智能的種種技術(shù)成果,得到了市場(chǎng)的初步認(rèn)可,不僅獲得了訂單,也正在家庭服務(wù)、食品加工等場(chǎng)景嘗試落地。

穹徹智能具身智能大腦 Noematrix Brain 獲得單場(chǎng)景百套訂單的突破,基于「生產(chǎn)伴隨」式數(shù)據(jù)采集方式研發(fā)的數(shù)采系統(tǒng)也獲得了近百套訂單。

在家庭服務(wù)場(chǎng)景,穹徹智能與海爾機(jī)器人聯(lián)合研發(fā)了兩款家庭機(jī)器人,分別能夠自主閉環(huán)完成地面物品清理、衣物洗烘任務(wù)。

在食品加工領(lǐng)域,「穹徹智能」已與知名食品廠商達(dá)成合作意向,雙方將加快復(fù)雜食品生產(chǎn)、加工處理產(chǎn)線的智能化與自動(dòng)化轉(zhuǎn)型。

具身智能仍面臨著許多技術(shù)和應(yīng)用上的挑戰(zhàn),尤其是在大模型訓(xùn)練的數(shù)據(jù)難題、低效的訓(xùn)練方式以及如何讓機(jī)器人真正理解和適應(yīng)復(fù)雜的現(xiàn)實(shí)世界等問題上進(jìn)展緩慢。

結(jié)合低成本、高效率的數(shù)據(jù)收集、利用方式,以及創(chuàng)新的具身智能大模型技術(shù)路線,穹徹智能為行業(yè)提供了一個(gè)具有可持續(xù)性與可擴(kuò)展性的技術(shù)方案,有望繼續(xù)拓展具身智能的應(yīng)用邊界。

       原文標(biāo)題 : 紅杉中國(guó)連投三輪,上海交大教授帶隊(duì)造機(jī)器人大腦

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)