訂閱
糾錯(cuò)
加入自媒體

具身智能落地難:卡在「算控分離」的開發(fā)困局

作者|向欣

編輯|白雪

具身智能的熱度,正在和其技術(shù)實(shí)用性產(chǎn)生割裂感。

不少人形機(jī)器人宣布進(jìn)廠上班,但實(shí)則是在「訓(xùn)練」完成任務(wù),反應(yīng)遲緩、效率有限,距離真正替代人工還有很大差距。企業(yè)也因無(wú)法實(shí)現(xiàn)實(shí)現(xiàn)真正落地,產(chǎn)生商業(yè)價(jià)值而遭受質(zhì)疑。

具身智能機(jī)器人應(yīng)用落地為什么這么難?

一個(gè)在開發(fā)環(huán)節(jié)就存在的困局是,沒有統(tǒng)一標(biāo)準(zhǔn)、沒有可復(fù)用組件,不同企業(yè)不得不重走一遍基礎(chǔ)設(shè)施的搭建流程,消耗大量資源,卻難以真正落地。

地瓜機(jī)器人 CEO 王叢指出,當(dāng)前機(jī)器人領(lǐng)域存在大量「重復(fù)造輪子」的現(xiàn)象,這些重復(fù)行為并不會(huì)帶來(lái)額外價(jià)值,問(wèn)題根源在于市場(chǎng)缺乏好用、通用的工具。

要讓具身智能機(jī)器人動(dòng)起來(lái)干活,需要打通從認(rèn)知到執(zhí)行的全鏈條。

而這一切的前提,是能否構(gòu)建出一套高效、靈活、可復(fù)用的機(jī)器人開發(fā)體系。

對(duì)產(chǎn)業(yè)來(lái)說(shuō),開發(fā)平臺(tái)不僅是技術(shù)落地的橋梁,更決定了具身智能能否走出實(shí)驗(yàn)室,真正進(jìn)入工廠、園區(qū)和家庭。

開發(fā)機(jī)器人,像在拼一套碎片化的積木

對(duì)于尚未形成規(guī)模化的具身智能機(jī)器人行業(yè)來(lái)說(shuō),做機(jī)器人開發(fā),每次都要從 0 到 1 進(jìn)行構(gòu)建。

在機(jī)器人進(jìn)入各類真實(shí)場(chǎng)景前,開發(fā)者們面臨三大痛點(diǎn):開發(fā)過(guò)程復(fù)雜、缺乏工具鏈、泛化能力弱。

機(jī)器人要完成「感知-決策-控制」三個(gè)核心環(huán)節(jié),傳統(tǒng)開發(fā)中常需多個(gè)處理器,如主控 MCU+邊緣 AI 板+運(yùn)動(dòng)控制器等,各個(gè)環(huán)節(jié)相對(duì)獨(dú)立,而不同廠商提供的模塊標(biāo)準(zhǔn)不統(tǒng)一,接口適配難、調(diào)試成本高、開發(fā)周期長(zhǎng),一般初創(chuàng)團(tuán)隊(duì)難以承受。

在機(jī)器人開發(fā)環(huán)節(jié),多數(shù)廠商僅提供個(gè)別軟硬件,沒有完善的開發(fā)者工具鏈和仿真驗(yàn)證環(huán)境,缺乏模型倉(cāng)庫(kù)和一站式部署支持,導(dǎo)致產(chǎn)品更新、迭代困難。

目前多數(shù)機(jī)器人開發(fā)方案針對(duì)特定硬件平臺(tái)或特定機(jī)器人形態(tài)定制,難以跨平臺(tái)或復(fù)用。適配不同形態(tài)、不同場(chǎng)景代價(jià)巨大。

面對(duì)開發(fā)復(fù)雜、控制鏈路斷裂、算力分散等問(wèn)題,目前機(jī)器人開發(fā)者主要依賴以下三種主流方案,各有優(yōu)劣。

第一類方案是使用 NVIDIA Jetson 系列開發(fā)板,主要適配巡檢、配送、工業(yè)視覺檢測(cè)等高性能機(jī)器人。

Jetson 系列開發(fā)板集成了英偉達(dá) SoC 芯片、DDR 芯片、PMIC 芯片等核心芯片,產(chǎn)品算力覆蓋 20~275TOPS。

它的優(yōu)點(diǎn)是 AI 推理能力強(qiáng)大,尤其擅長(zhǎng)視覺處理,可部署深度學(xué)習(xí)模型。但由于其本質(zhì)上是為 AI 而非控制場(chǎng)景優(yōu)化,Jetson 在實(shí)時(shí)性與控制精度上存在明顯短板,難以勝任精細(xì)的運(yùn)動(dòng)控制或快速響應(yīng)的多關(guān)節(jié)協(xié)調(diào)任務(wù)。

第二類方案是將控制計(jì)算分拆為多個(gè)模塊,由 MCU+ FPGA + 運(yùn)動(dòng)控制板分別完成控制、信號(hào)處理等任務(wù)。

MCU(微控制器單元):負(fù)責(zé)邏輯控制和實(shí)時(shí)任務(wù);

FPGA(現(xiàn)場(chǎng)可編程門陣列):通過(guò)硬件編程實(shí)現(xiàn)高速并行計(jì)算,延遲可低至微秒級(jí);

運(yùn)動(dòng)控制板:連接 MCU 與 FPGA,形成「決策 - 執(zhí)行」閉環(huán)。

這種方案的優(yōu)點(diǎn)是具備較高的實(shí)時(shí)性、控制精度,常用于工業(yè)自動(dòng)化中的固定流程或精密機(jī)械控制中,如傳統(tǒng)的工業(yè)機(jī)械臂、協(xié)作機(jī)器人與醫(yī)療手術(shù)機(jī)器人等。

然而這種方案原生不支持深度學(xué)習(xí)框架,難以直接運(yùn)行視覺與 AI 算法、不擅長(zhǎng)承載復(fù)雜感知與規(guī)劃,也就不適合需要持續(xù)算法迭代的具身智能機(jī)器人。

同時(shí),模塊化設(shè)計(jì)導(dǎo)致系統(tǒng)集成難度大、維護(hù)成本高,開發(fā)周期長(zhǎng)、調(diào)試不友好。

最后一類是樹莓派/STM32 等通用開發(fā)板+ROS 的方案。

多數(shù)通用開發(fā)板功耗較低,價(jià)格親民,幾十到幾百元就能解決,ROS 則是一個(gè)開源的機(jī)器人操作系統(tǒng)。

這種方案在教育與科研領(lǐng)域很常見,具有良好的開源生態(tài)和入門門檻低的優(yōu)勢(shì),適合學(xué)生和初創(chuàng)團(tuán)隊(duì)快速做原型驗(yàn)證。

但通用開發(fā)板與 ROS 兩者的科研教育定位,也決定了他們均未針對(duì)工業(yè)級(jí)實(shí)時(shí)性、可靠性進(jìn)行優(yōu)化,更多適用于非關(guān)鍵任務(wù)原型開發(fā)。

這種方案下開發(fā)的機(jī)器人不適合大規(guī)模部署或商用機(jī)器人產(chǎn)品化。若開發(fā)者想進(jìn)一步升級(jí)迭代機(jī)器人,則需要更換別的開發(fā)方案以適應(yīng)性能要求。

三類方案雖然各有亮點(diǎn),但要同時(shí)滿足「算力強(qiáng)、控制準(zhǔn)、開發(fā)快、生態(tài)全」的要求,仍然存在瓶頸。

行業(yè)需要的,是一種集成度高、算控協(xié)同、工具鏈完整的新一代開發(fā)平臺(tái)。

業(yè)內(nèi)首款 SoC 算控一體計(jì)算平臺(tái):RDK S100

地瓜機(jī)器人新推出的 RDK S100,成為行業(yè)中的新解法。

RDK S100 是地瓜機(jī)器人面向具身智能領(lǐng)域推出的一款機(jī)器人開發(fā)套件,擁有 80/128TOPS 兩種算力規(guī)格。

地瓜機(jī)器人開發(fā)者生態(tài)副總裁胡春旭介紹,如果人的大腦是整個(gè)計(jì)算中心,RDK S100 就相當(dāng)于大腦的物理部分。

大模型、算法等 AI 技術(shù)與機(jī)器人數(shù)據(jù)的傳輸都需要硬件作為載體。

RDK S100 就可以充當(dāng)這個(gè)硬件載體。除此之外,它還集成了相應(yīng)的軟件、文檔及開發(fā)工具。RDK S100 在機(jī)器人開發(fā)方面具備三大優(yōu)勢(shì)。

首先,RDK S100 是算控一體的,采用大小腦協(xié)同的設(shè)計(jì),單個(gè)開發(fā)套件就能實(shí)現(xiàn)具身智能機(jī)器人「感知-決策-執(zhí)行」的閉環(huán)。

算,指的是大腦的感知決策;控,則指的是小腦的運(yùn)動(dòng)控制。

以往的機(jī)器人開發(fā)平臺(tái)是算控分離的,大小腦由不同的開發(fā)板控制,需要通過(guò)外接的線連接,由于硬件堆疊,需要額外布線,開發(fā)成本上升,難度也變大。

RDK S100 最大的亮點(diǎn)在于 CPU+BPU+MCU 的異構(gòu)架構(gòu),充分釋放了不同計(jì)算單元的算力,將大腦的計(jì)算推理與小腦的控制功能都集成到一塊開發(fā)板上,解決了軟硬件分離導(dǎo)致的集成與成本難題,部署更為簡(jiǎn)單快速,性能效率也更高。

具體來(lái)看,RDK S100 中的架構(gòu)分為兩個(gè)板塊:

CPU+BPU:共同組成大腦。

6 核 CPU:負(fù)責(zé)通信與邏輯推理;

BPU:針對(duì) Transformer 優(yōu)化的全新一代納什架構(gòu),是提供核心算力的硬件引擎,負(fù)責(zé)模型推理;

MCU:小腦。

4 核 MCU 為運(yùn)控核心,負(fù)責(zé)底層高頻運(yùn)動(dòng)控制。

RDK S100 的第二大優(yōu)勢(shì)是軟硬一體,提供了機(jī)器人開發(fā)的相應(yīng)算法模型以及全鏈路工具鏈,生態(tài)資源豐富。

在算法模型方面,RDK S100 支持部署多種主流 AI 模型,地瓜機(jī)器人既提供官方調(diào)優(yōu),適用于 RDK S100 的 AI 模型倉(cāng)庫(kù) ModelZoo,也通過(guò)機(jī)器人算法中心 NodeHub 為客戶提供 200+開源算法和應(yīng)用示例,幫助用戶快速完成算法部署。

算法要部署到硬件上,通常需要進(jìn)行適配才能高效運(yùn)行,即模型轉(zhuǎn)換。

在工具鏈方面,地瓜機(jī)器人一方面提供完善的模型轉(zhuǎn)換工具鏈,通過(guò)多種模型轉(zhuǎn)換輔助工具與仿真環(huán)境加速算法落地;另一方面提供基于 ROS2 的硬件加速功能包 TogetheROS.Bot,提升機(jī)器人應(yīng)用開發(fā)的易用性。

RDK S100 的第三大優(yōu)勢(shì),是跨場(chǎng)景與多形態(tài)的通用適配能力。

RDK S100 能夠針對(duì)不同場(chǎng)景需求,高效切換多種模型,應(yīng)對(duì)園區(qū)巡檢、末端配送、商業(yè)清潔等場(chǎng)景,并適配四足機(jī)器人、半人形機(jī)器人與全尺寸人形機(jī)器人等不同形態(tài),滿足多樣化機(jī)器人形態(tài)的實(shí)時(shí)推理需求。

RDK S100 的部署速度也很快。將 RDK S100 部署到逐際動(dòng)力的 TRON1 雙足機(jī)器人上僅需 1 小時(shí)。

三重優(yōu)勢(shì),使得 RDK S100 既具備科研的開發(fā)性,也具備場(chǎng)景的應(yīng)用性。

例如,以宇樹科技的 G1 人形機(jī)器人為載體,開發(fā)者在 RDK S100 成功部署了優(yōu)化后的 ASAP 框架(由英偉達(dá)和卡內(nèi)基梅隆大學(xué)聯(lián)合研發(fā)的框架),讓 G1 能夠跳舞,并且大幅降低部署工程的資源占用,BPU 推理占用率僅 2%,CPU 占用降 250%,為復(fù)雜任務(wù)釋放算力。

在智能交通、工業(yè)檢測(cè)、果園檢測(cè)等檢測(cè)場(chǎng)景,RDK S100 支持多種攝像頭接入與多路視頻流并行處理,可實(shí)現(xiàn)微小目標(biāo)的精準(zhǔn)識(shí)別,提供極其細(xì)膩的圖像感知信息。

不過(guò),產(chǎn)品做得好只是第一步,如何推動(dòng)下游產(chǎn)品應(yīng)用與落地,還要看開發(fā)生態(tài)如何構(gòu)建,以及產(chǎn)業(yè)趨勢(shì)如何演進(jìn)。

誰(shuí)能定義下一代開發(fā)平臺(tái)?

機(jī)器人開發(fā)正在成為一片快速升溫的「藍(lán)!埂

中商產(chǎn)業(yè)研究院數(shù)據(jù)顯示,中國(guó)具身智能市場(chǎng)規(guī)模不斷擴(kuò)大,預(yù)計(jì) 2027 年有望達(dá)到 1.25 萬(wàn)億元。

國(guó)信證券預(yù)測(cè),人形機(jī)器人是有望超過(guò)智能手機(jī)、新能源汽車市場(chǎng)規(guī)模的兆億元級(jí)賽道,應(yīng)用潛力巨大。

與此同時(shí),面向機(jī)器人應(yīng)用的開發(fā)平臺(tái)卻鳳毛麟角,能夠貫通從底層硬件到上層應(yīng)用的完整體系更是稀缺。

目前機(jī)器人開發(fā)領(lǐng)域的玩家大致可以分為兩類。

一類是芯片企業(yè)。代表企業(yè)主要是英偉達(dá)、地平線(地瓜機(jī)器人)。它們的策略是從開發(fā)工具切入,構(gòu)建底層標(biāo)準(zhǔn)。

英偉達(dá)強(qiáng)在仿真平臺(tái)與生成式 AI 生態(tài),優(yōu)勢(shì)偏向云端部署;

地瓜機(jī)器人更聚焦端側(cè),強(qiáng)調(diào)控制能力。

英偉達(dá)在 2018 年開始就向機(jī)器人方向布局,以開發(fā)平臺(tái)(計(jì)算中心)、硬件產(chǎn)品、基礎(chǔ)模型三大類產(chǎn)品為主,圍繞仿真、開發(fā)與訓(xùn)練環(huán)境打通「云端機(jī)器人!梗m合云訓(xùn)練、大模型推理等場(chǎng)景。

地瓜機(jī)器人則從地平線孵化而來(lái),雖然同樣具備云端協(xié)同能力,但產(chǎn)品布局重心明顯偏向端側(cè)——它更關(guān)注機(jī)器人真實(shí)運(yùn)行過(guò)程中的控制精度、實(shí)時(shí)響應(yīng)與系統(tǒng)閉環(huán)能力。

地瓜機(jī)器人產(chǎn)品布局

地瓜機(jī)器人在端側(cè)布局了芯片、RDK 開發(fā)套件、機(jī)器人操作系統(tǒng),在云側(cè)提供云端開發(fā)環(huán)境、NodeHub 機(jī)器人算法中心。

目前芯片為地瓜機(jī)器人的主要營(yíng)收核心,迄今出貨量已超過(guò) 500 萬(wàn)片,搭載于科沃斯、云鯨等行業(yè)頭部客戶的熱銷產(chǎn)品中。

在具身智能領(lǐng)域,地瓜機(jī)器人基于 RDK S100,已與 20+具有行業(yè)影響力的具身智能領(lǐng)域頭部客戶建立合作,包括樂聚機(jī)器人、逐際動(dòng)力、維他動(dòng)力等。

此外,RDK S100 還獲超過(guò) 50 家客戶開展測(cè)評(píng)。

背靠地平線芯片能力,疊加地瓜機(jī)器人在服務(wù)機(jī)器人賽道積累的實(shí)踐經(jīng)驗(yàn),它正試圖打造一條適用于科研、教學(xué)、產(chǎn)業(yè)多場(chǎng)景的通用開發(fā)平臺(tái)路徑。

另一類機(jī)器人開發(fā)的玩家,是人形機(jī)器人整機(jī)廠商,它們主要從上往下反哺生態(tài)。

這類玩家的代表有智元機(jī)器人、宇樹科技、眾擎機(jī)器人等。

它們通過(guò)提供完整的機(jī)器人本體,以及與機(jī)器人產(chǎn)品配套的開發(fā)資料來(lái)完成商業(yè)化。

相比芯片企業(yè),它們更擅長(zhǎng)將軟硬件系統(tǒng)打包成工程化產(chǎn)品,開發(fā)者可基于本體接口快速部署視覺識(shí)別、動(dòng)作模仿等任務(wù)。

兩類機(jī)器人開發(fā)市場(chǎng)的主要玩家,發(fā)展路徑有明顯差異:

芯片企業(yè)提供「硬標(biāo)準(zhǔn)」——即面向開發(fā)者的標(biāo)準(zhǔn)化硬件平臺(tái)和工具體系,需要開發(fā)者自行搭建機(jī)器人系統(tǒng);

整機(jī)企業(yè)提供「軟接口」——即將本體搭建好,開發(fā)者只需調(diào)用其預(yù)設(shè)接口進(jìn)行功能二次開發(fā)。

它們之間并非直接競(jìng)爭(zhēng)關(guān)系,而是構(gòu)成一種協(xié)同共生的生態(tài)網(wǎng)絡(luò):芯片企業(yè)打通底層、整機(jī)企業(yè)提供功能開發(fā),未來(lái)有希望連接場(chǎng)景。

這些企業(yè)不約而同瞄準(zhǔn)了機(jī)器人開發(fā),而非場(chǎng)景應(yīng)用,主要原因有兩個(gè)。

一方面,開發(fā)平臺(tái)對(duì)應(yīng)的科研與教學(xué)市場(chǎng)是當(dāng)前最明確、可持續(xù)的商業(yè)化通路。

另一方面,一旦開發(fā)者習(xí)慣在某平臺(tái)上完成從建模到部署的全過(guò)程,這個(gè)平臺(tái)就具備了對(duì)下游廠商、整機(jī)商甚至操作系統(tǒng)層的向上影響力。

做機(jī)器人開發(fā)平臺(tái),不僅意味著短期內(nèi)的產(chǎn)品出貨機(jī)會(huì),還有望主導(dǎo)下一代機(jī)器人產(chǎn)業(yè)格局。

這種路徑已經(jīng)在消費(fèi)電子和 PC 產(chǎn)業(yè)領(lǐng)域被反復(fù)驗(yàn)證成功。地瓜機(jī)器人的定位,可類比手機(jī)時(shí)代的高通、安卓,或是 PC 時(shí)代的英特爾、英偉達(dá)。

手機(jī)時(shí)代,高通提供統(tǒng)一的硬件能力,安卓和蘋果建立開發(fā)生態(tài),共同撐起移動(dòng)互聯(lián)網(wǎng)十年黃金期;

PC 時(shí)代,英特爾、英偉達(dá)在底層制訂標(biāo)準(zhǔn),開發(fā)工具和操作系統(tǒng)則推動(dòng)整個(gè)行業(yè)走向規(guī);。

具身智能時(shí)代,也將誕生類似的「生態(tài)型企業(yè)」:既有控制底層的芯片和平臺(tái)能力,又能搭建上層的開發(fā)工具和應(yīng)用生態(tài)。

機(jī)器人產(chǎn)業(yè)的第一批贏家,可能就是那個(gè)既能降低開發(fā)門檻、又能定義開發(fā)范式的平臺(tái)型企業(yè)。

       原文標(biāo)題 : 具身智能落地難:卡在「算控分離」的開發(fā)困局

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)