訂閱
糾錯(cuò)
加入自媒體

靈巧手,人形機(jī)器人的“最后一厘米”

作者|毛心如

編輯|白雪

機(jī)器人一定要做人形嗎?

黃仁勛說,人形機(jī)器人很可能是唯一可行的機(jī)器人。

深圳市人工智能與機(jī)器人研究院常務(wù)副院長丁寧認(rèn)為,在我們的工業(yè)體系里,想把一件事做成,首先需要有個(gè)對標(biāo)對象。

以人類作為對標(biāo),大家就能迅速地形成共識,集中精力把各項(xiàng)功能發(fā)展起來。

維他動(dòng)力聯(lián)合創(chuàng)始人趙哲倫認(rèn)為,對人形機(jī)器人的討論最后還是會落到通用,在一些工業(yè)化場景下,輪式機(jī)器人的運(yùn)動(dòng)作業(yè)效率會更高。

獵豹移動(dòng)董事長傅盛認(rèn)為,做人形是人對自己的一種「自戀」,機(jī)器人的形態(tài)不一定要像人。

「是否要做人形」并沒有達(dá)成共識,但有一個(gè)共識是,機(jī)器人需要有強(qiáng)作業(yè)能力,都需要一雙能完成精細(xì)操作的手來完成各項(xiàng)作業(yè)。

因此,人形機(jī)器人的快速發(fā)展中,靈巧手技術(shù)是關(guān)鍵突破點(diǎn)。

兩家靈巧手公司一周內(nèi)相繼獲得融資

今年,資本市場頻頻加碼機(jī)器人。

據(jù)不完全統(tǒng)計(jì),今年機(jī)器人領(lǐng)域融資已有近 80 起,其中以靈巧手或末端執(zhí)行器為核心業(yè)務(wù)的企業(yè)融資事件有 8 起,占比約 10%。

在融資熱潮中,資本市場對專攻靈巧手領(lǐng)域的企業(yè)卻表現(xiàn)得有點(diǎn)「興致缺缺」。

其中的關(guān)鍵就是,「是否一定要做三到五指靈巧手」這個(gè)共識還未達(dá)成。

在大部分機(jī)器人功能演示中我們能看見,有些機(jī)器人展現(xiàn)了借用靈巧手的作業(yè)能力,但有些機(jī)器人還是使用兩指夾爪完成相應(yīng)的作業(yè)。

眾所周知,三個(gè)點(diǎn)即可確定一個(gè)平面,所以機(jī)器人要實(shí)現(xiàn)精細(xì)操作,至少需要三指結(jié)構(gòu)。

雖然投資圈內(nèi)對靈巧手的觀點(diǎn)存在著分化,但也沒有影響對其看好的資本積極下注。

今年 5 月,兩家做靈巧手的科技公司傲意科技、星際光年分別完成了近億元的 B++輪融資和數(shù)千萬元的天使輪和天使+輪融資,給靈巧手融資市場帶來了一波熱度。

5 月 13 日,傲意科技迎來新一輪融資。

本輪融資資金將重點(diǎn)用于加速靈巧手技術(shù)領(lǐng)域的持續(xù)研發(fā)突破,推動(dòng)新一代靈巧手產(chǎn)品上市進(jìn)程,并加速手指關(guān)節(jié)外骨骼機(jī)器人的上市進(jìn)度。

同時(shí),傲意科技將建立國際領(lǐng)先的標(biāo)準(zhǔn)化生產(chǎn)體系,優(yōu)化生產(chǎn)流程,實(shí)現(xiàn)年產(chǎn)能 100% 增長。

傲意科技靈巧手 ROH-A001

傲意科技是國內(nèi)最早專注在手型機(jī)器人研究的團(tuán)隊(duì),已經(jīng)擁有批量生產(chǎn)經(jīng)驗(yàn)和批量交付能力,而且成功推動(dòng)手型機(jī)器人在各個(gè)場景的落地,是現(xiàn)在國內(nèi)靈巧手的第一梯隊(duì)玩家。

目前,傲意科技正在研發(fā)新一代靈巧手 ROH-AP001,該產(chǎn)品將具備觸覺、壓力等感知能力,預(yù)計(jì)近期將正式推出市場。

與傲意科技這個(gè)「資深玩家」不同,星際光年是一個(gè)初出茅廬的新星。星際光年成立于 2024 年,其創(chuàng)始人位德浩是位「95 后」,畢業(yè)于清華大學(xué),曾任字節(jié)跳動(dòng) AI Lab 機(jī)器人學(xué)習(xí)算法工程師,該公司首席科學(xué)家是香港大學(xué)教授羅平。

此次天使輪和天使+輪融資將用于加速產(chǎn)品研發(fā)升級,擴(kuò)大團(tuán)隊(duì)規(guī)模,加速場景落地。

5 月 14 日剛宣布完成融資的星際光年,在 16 號就迎來了新品發(fā)布會。

在發(fā)布會上,星際光年推出了家族產(chǎn)品——輕量化驅(qū)手分離繩驅(qū)靈巧手「輕羽 15」Pantheon Hand 01 、微型驅(qū)控一體關(guān)節(jié)模組 JA106-25Q1 以及高維觸覺感知陣列式觸覺傳感器 MGTS01-25Q1。

同時(shí),星際光年將搭建基于微型驅(qū)控一體關(guān)節(jié)模組搭建的開源兩指、三指、五指靈巧手,并全部面向全球開發(fā)者及科研機(jī)構(gòu)開源共享,提供從數(shù)據(jù)采集、訓(xùn)練、部署的一站式解決方案。

這兩家公司的融資事件都標(biāo)志著資本市場對于機(jī)器人產(chǎn)業(yè)鏈上游核心技術(shù)的戰(zhàn)略布局。

在人形機(jī)器人快速發(fā)展的當(dāng)下,靈巧手不僅是控制機(jī)器人整機(jī)成本的重要一環(huán),更決定著機(jī)器人作業(yè)能力的上限。

靈巧手,機(jī)器人的「最后一厘米」

清華大學(xué)計(jì)算機(jī)系教授孫富春曾表示,機(jī)器人是自動(dòng)化的「最后一公里」,而靈巧手則是機(jī)器人的「最后一厘米」。

靈巧手,是一種高度仿生設(shè)計(jì)的機(jī)器人末端執(zhí)行器,其核心在于模擬人類手部的結(jié)構(gòu)和功能,實(shí)現(xiàn)復(fù)雜物體的精細(xì)操作與交互。

其中的關(guān)鍵技術(shù)包括高自由度運(yùn)動(dòng)、多模態(tài)感知反饋、動(dòng)態(tài)環(huán)境適應(yīng)和傳動(dòng)方案四個(gè)方面。

高自由度運(yùn)動(dòng)

嚴(yán)格意義上講,人手擁有 27 個(gè)自由度,包括手掌本體的 21 個(gè)自由度,以及整只手在相對空間的 3 個(gè)平移自由度和 3 個(gè)旋轉(zhuǎn)自由度。

人類單手的結(jié)構(gòu)很復(fù)雜,由骨骼、肌肉和韌帶協(xié)同實(shí)現(xiàn)精細(xì)操作,而靈巧手則是通過模塊化設(shè)計(jì)實(shí)現(xiàn)復(fù)雜功能的平衡。

雖然現(xiàn)在大多靈巧手的自由度不能來到人手的自由度,但像靈心巧手的 Linker Hand 靈巧手系列已經(jīng)做到了 Pro 版 20 個(gè)主動(dòng)自由度,工業(yè)版 25-30 個(gè)自由度,科研版 42 個(gè)自由度。

這里需要提一個(gè)很容易忽略的點(diǎn),現(xiàn)在有些公司宣傳的自由度,是主動(dòng)自由度和被動(dòng)自由度加在一起的數(shù)量。

主動(dòng)自由度需要電機(jī)、腱繩或連桿等驅(qū)動(dòng)裝置通過外部能源提供動(dòng)力,被動(dòng)自由度依靠機(jī)械結(jié)構(gòu)被動(dòng)響應(yīng)外力。

考驗(yàn)驅(qū)動(dòng)方案以及決定作業(yè)能力的是主動(dòng)自由度。因時(shí)機(jī)器人 CMO 房海南表示:「從自由度的原始定義來講的話,不太存在被動(dòng)的概念!

多模態(tài)感知反饋感知系統(tǒng)是靈巧手實(shí)現(xiàn)「智能操作」的神經(jīng)中樞,具體包括傳感器和感知方法兩個(gè)方面。

根據(jù)傳感器的布局差異,可以分成靈巧手內(nèi)部感知傳感器和外部感知傳感器。它們?yōu)闄C(jī)械手提供了豐富的信息,包括姿態(tài)、物體的接觸信息和環(huán)境的物理信息。

內(nèi)部感知傳感器用于反饋機(jī)械手自身的位置或力等狀態(tài)信息,外部傳感器是機(jī)器人獲取周圍環(huán)境信息的必要部件。

感知方法是指對感知信息進(jìn)行處理以完成靈巧操作任務(wù)。

為了對物體進(jìn)行操作,可以采用規(guī)劃、控制和學(xué)習(xí)等不同的方法來計(jì)算機(jī)器人靈巧手的運(yùn)動(dòng)和控制。

相應(yīng)的,感知方法可以分三種,分別是規(guī)劃級、控制級和學(xué)習(xí)級感知。

動(dòng)態(tài)環(huán)境適應(yīng)

靈巧手在實(shí)際應(yīng)用中需要應(yīng)對復(fù)雜多變的環(huán)境,最終目標(biāo)是在現(xiàn)實(shí)世界里實(shí)現(xiàn)「類人直覺」。

當(dāng)前有三種算法路徑來達(dá)成這一目的,分別是強(qiáng)化學(xué)習(xí)、大模型賦能和數(shù)字孿生。

強(qiáng)化學(xué)習(xí)是通過仿真環(huán)境的千萬次試錯(cuò)來優(yōu)化抓取策略,OpenAI 團(tuán)隊(duì)曾發(fā)表過一篇論文,內(nèi)容圍繞通過強(qiáng)化學(xué)習(xí)方法,最終實(shí)現(xiàn)了五指靈巧手操作方塊和八棱柱,解決了非學(xué)習(xí)類方法無法解決的操作問題。

大模型賦能主要是跟運(yùn)動(dòng)規(guī)劃結(jié)合,使機(jī)器人能理解自然語言指令并生成動(dòng)作序列,像星動(dòng)紀(jì)元發(fā)布的大模型 ERA-42,實(shí)現(xiàn)了五指靈巧手像人手一樣靈活地使用各種工具完成上百種靈巧復(fù)雜操作任務(wù)。

數(shù)字孿生是通過建立機(jī)器人和現(xiàn)實(shí)世界 1:1 的復(fù)制體,然后在訓(xùn)練模型中進(jìn)行測試,再直接應(yīng)用到真實(shí)世界里,實(shí)現(xiàn)零樣本學(xué)習(xí)。

英偉達(dá)研究員曾經(jīng)試過讓真狗站在瑜伽球上,但是失敗了,通過數(shù)字孿生,他們實(shí)現(xiàn)了讓機(jī)器狗站在瑜伽球上。

傳動(dòng)方案

當(dāng)前有四種傳動(dòng)方案,分別是剛性連桿傳動(dòng)方案、電機(jī)直驅(qū)傳動(dòng)方案、腱繩傳動(dòng)方案以及人工肌肉傳動(dòng)方案。

目前,各家在靈巧手方案上各有不同,形成了差異化競爭。

因時(shí)機(jī)器人和靈寶 CASBOT 采用連桿傳動(dòng),星動(dòng)紀(jì)元通過電機(jī)直驅(qū),靈心巧手則是采用「連桿+腱繩」的雙結(jié)構(gòu)。

星際光年 CEO 位德浩認(rèn)為,腱繩傳動(dòng)方案是最具潛力的傳動(dòng)方案。因?yàn)殡炖K傳動(dòng)最類似于人手的肌腱結(jié)構(gòu),適合空間狹小且需要驅(qū)動(dòng)自由度數(shù)量較多的場合。

目前,星際光年也正在對材料、結(jié)構(gòu)和算法三者進(jìn)行創(chuàng)新,計(jì)劃做一種不一樣的腱繩傳動(dòng)方案,能夠在根本上去解決由于繩索蠕變,對精度和負(fù)載帶來的各種問題。

當(dāng)然,雖然現(xiàn)在各家公司都在「各顯神通」,多模塊發(fā)展技術(shù),但靈巧手離盡善盡美還有一段距離。

做好靈巧手,技術(shù)突破和商業(yè)化落地雙線并行

盡管靈巧手技術(shù)前景開闊,但是靈巧手研發(fā)仍然有硬件設(shè)計(jì)、算法挑戰(zhàn)、量產(chǎn)瓶頸和成本控制這三個(gè)痛點(diǎn)。

一直以來,靈巧手的「負(fù)載能力、自由度、尺寸/重量」構(gòu)成了「不可能三角」。

資料顯示,靈巧手需要滿足至少 9 個(gè)自由度才能實(shí)現(xiàn)物體任意運(yùn)動(dòng)控制,但高自由度帶來的結(jié)構(gòu)復(fù)雜程度是呈指數(shù)級上升的。

以英國公司 ShadowHand 舉例,其靈巧手產(chǎn)品有 20 個(gè)主動(dòng)自由度,這就需要 20 個(gè)微型電機(jī)驅(qū)動(dòng),導(dǎo)致其重量達(dá)到 4.3kg,遠(yuǎn)超人手質(zhì)量,所以很難滿足工業(yè)場景的輕量化需求。

因此,在這個(gè)「不可能三角」下,往往高自由度就會帶來質(zhì)量偏重,高負(fù)載能力多數(shù)需要犧牲自由度,而追逐輕量化,可能在自由度和負(fù)載能力上都表現(xiàn)一般。

在算法方面,第一個(gè)挑戰(zhàn)就是模型和手難以適配。

一方面現(xiàn)階段強(qiáng)化學(xué)習(xí)在仿真環(huán)境中使用低自由度夾爪訓(xùn)練的模型很難兼容、控制高自由度靈巧手。

另一方面,現(xiàn)有的靈巧手在結(jié)構(gòu)上并沒有統(tǒng)一,會出現(xiàn)手指關(guān)節(jié)、腕掌關(guān)節(jié)等細(xì)節(jié)設(shè)計(jì)丟失情況。

這同時(shí)也會拖累具身算法本身的發(fā)展——基于現(xiàn)有硬件訓(xùn)練出的算法,隨著靈巧手仿生程度的提高而失效。

此外,當(dāng)手發(fā)展到一定階段需要采用柔性皮膚時(shí),當(dāng)前的仿真環(huán)境難以精確模擬柔性、彈性以及摩擦力等物理現(xiàn)象。

第二個(gè)難點(diǎn)就是多模態(tài)感知融合。

人類不是通過單一的感官形態(tài)來探測物體,而是通過多種感官整合信息,例如觸覺、視覺、聲音信息等來理解物體。

現(xiàn)有靈巧手多采用觸覺+視覺的二元感知,但視覺、觸覺、力覺數(shù)據(jù)的時(shí)空對齊仍缺乏統(tǒng)一框架,需要探索對不同模態(tài)信息建立統(tǒng)一的特征表示和關(guān)聯(lián)關(guān)系。

無疑,所有的靈巧手最后都是要走上商業(yè)化的道路,而商業(yè)化產(chǎn)品必然要面臨成本壓縮與性能維持的矛盾。

目前,國內(nèi)外靈巧手的價(jià)格普遍較高,在幾萬到幾十萬不等,像英國 Shadow Hand 的市場價(jià)格大概在 105 萬元,國內(nèi)的靈心巧手的 Linker Hand、因時(shí)機(jī)器人的 RH56DFX 系列售價(jià)在 5 萬左右。

靈巧手作為人形機(jī)器人很重要的一環(huán),其成本占整個(gè)人形機(jī)器人成本的 20%-30%,幾乎僅次于身體執(zhí)行部分。

在當(dāng)前人形機(jī)器人都在降成本的趨勢下,靈巧手也需要跨過「高性能+低成本」的關(guān)。

目前降價(jià)最主要的路徑,就是通過國產(chǎn)可替代的方式,降低對進(jìn)口產(chǎn)品的依賴,從零部件開始把控生產(chǎn)成本。

以靈巧手核心零部件微型減速電機(jī)為例,該零部件大多來自德國,價(jià)格昂貴且供貨周期長,存在諸多不確定因素。

像傲意科技就選擇和國內(nèi)供應(yīng)商合作,將價(jià)格降至國外同類產(chǎn)品的 1/5。

當(dāng)下,國內(nèi)已經(jīng)有近十家做靈巧手本體的公司走上了商業(yè)化道路,其中靈巧智能、因時(shí)機(jī)器人、傲意科技和強(qiáng)腦科技被稱為國產(chǎn)靈巧手四小龍。

做好靈巧手,不僅是人類在技術(shù)領(lǐng)域的一次大跨步,同時(shí)也是人類將生物智能轉(zhuǎn)化成機(jī)器智能的重要標(biāo)志。

當(dāng)靈巧手真正實(shí)現(xiàn)「手腦協(xié)同」之時(shí),人形機(jī)器人將不再是冰冷的工具,而會成為我們身邊更加親切的伙伴。

       原文標(biāo)題 : 靈巧手,人形機(jī)器人的“最后一厘米”

聲明: 本文由入駐維科號的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報(bào)。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個(gè)字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號