訂閱
糾錯
加入自媒體

DeepSeek顛覆一切?人形機器人集體轉(zhuǎn)身:攔路虎被消滅了

2025-02-08 10:43
雷科技
關(guān)注

開源的 DeepSeek是人形機器人「進化」的催化劑。

如果說 2023、2024 開年科技行業(yè)最重要的新聞分別是 ChatGPT 和 Sora,那 2025 開年科技行業(yè)最重要的新聞毫無疑問就是——DeepSeek(R1)。

只看一點,從國內(nèi)到海外,不斷有科技互聯(lián)網(wǎng)公司宣布接入甚至基于 DeepSeek 開發(fā)產(chǎn)品。其中雖然有不少是出于「蹭熱點」的營銷,但更多廠商也確實是看到了 DeepSeek R1 的巨大潛力,包括看似關(guān)系不大的人形機器人廠商。

2 月 7 日,作為國內(nèi)人形機器人第一股,優(yōu)必選官方就表示公司正在人形機器人應(yīng)用場景中驗證 DeepSeek 技術(shù)的有效性,如多模態(tài)人機交互、復(fù)雜環(huán)境中的指令理解、工業(yè)場景中的任務(wù)分解與規(guī)劃等,「有望利用推理大模型的深度思考能力解決這些復(fù)雜任務(wù)中的挑戰(zhàn),讓人形機器人更加接近人的思考和行為表現(xiàn)!

優(yōu)必選可能并非個例。

就在兩天前,一度引起全球科技圈集體關(guān)注的硅谷人形機器人公司 Figure,創(chuàng)始人 Brett Adcock 突然在 X 平臺上宣布決定終止與 OpenAI 的合作,并轉(zhuǎn)向內(nèi)部自主開發(fā)端到端的機器人 AI。

SCR-20250207-odyi.png

圖/ X

Brett Adcock 還透露,F(xiàn)igure 目前已經(jīng)取得「a major breakthrough(重大突破)」,將在接下來 30 天展示一些從未在人形機器人上見過的東西?紤]到最近一段時間人工智能行業(yè)最大的變化就是 DeepSeek 的開源模型,很多人認為 Figure 是在基于 DeepSeek R1 等開源模型進行開發(fā)機器人 AI。

甚至,打造出白菜價人形機器人的宇樹科技也傳出了與 DeepSeek 達成深度合作的消息。而更多的人形機器人廠商,或許都在思考和謀劃基于 DeepSeek 模型的新路線,就像優(yōu)必選一樣。

但不管是或不是,DeepSeek 正在改寫的 AI 敘事,似乎不可避免將改變?nèi)诵螜C器人的故事方向。

DeepSeek如何消滅人形機器人普及的攔路虎?

優(yōu)必選和 Figure 的「轉(zhuǎn)身」,并非偶然。事實上,DeepSeek 的出現(xiàn),恰好擊中了當前人形機器人的痛點,首當其沖的就是「成本」。

了解人形機器人研發(fā)的人都知道,訓(xùn)練一個具身智能的機器人,需要消耗大量的算力。而算力,意味著真金白銀的投入。科技巨頭之所以能在人工智能領(lǐng)域呼風喚雨,除了技術(shù)領(lǐng)先外,更重要的是它們有足夠的財力支撐起「天價」的算力支出。

但對于大多數(shù)人形機器人初創(chuàng)公司來說,高昂的算力費用無疑是一筆巨大的負擔。另一方面,數(shù)據(jù)匱乏更是整個行業(yè)共同面臨的困境,甚至 OpenAI 四年前解散人形機器人團隊就是因為數(shù)據(jù)極其匱乏的難題。

這也是為什么去年年底智元機器人開源百萬真機數(shù)據(jù)集 AgiBot World,引起了廣泛關(guān)注。

SCR-20250207-qpub.jpeg

AgiBot World 數(shù)據(jù)集在 GitHub,圖/雷科技

智元機器人聯(lián)合創(chuàng)始人、首席技術(shù)官彭志輝(稚暉君)就提到,具身智能領(lǐng)域,真機數(shù)據(jù)的采集成本和門檻非常高。但實際上,「百萬真機數(shù)據(jù)集」在一些業(yè)內(nèi)人士看來也只是杯水車薪,「只能訓(xùn)練一個動作的泛化,譬如分揀,對實現(xiàn)理想狀態(tài)中的具身智能還遠不夠。」

這就像一個有天賦的運動員,卻苦于沒有訓(xùn)練場地和器材,最終也只能泯然眾人矣。但 DeepSeek R1 的出現(xiàn),卻很有可能改變了這一切。

最直接的一點就是 4 元/百萬 tokens(緩存未命中)、1 元/百萬 tokens(緩存命中)的輸入價格和 16 元/百萬 tokens 的輸出價格,讓 DeepSeek R1 在推理成本上的優(yōu)勢一覽無遺。

 

DeepSeek R1 Price.jpeg

圖/ DeepSeek

與之相比,OpenAI o1 正式版的 API 價格分別是 55 元、110 元、438 元。僅這一點,就能讓人形機器人公司終于可以擺脫「天價」算力的束縛,將更多的資金投入到機器人本體的研發(fā)中,加速產(chǎn)品的迭代和升級。

當然,根本還在于 DeepSeek R1 作為性能上與 OpenAI o1 比肩的頂級推理模型,可以低成本地提供強大的數(shù)學、代碼以及自然語言推理等能力,正如優(yōu)必選所期望的——改進人形機器人面對復(fù)雜任務(wù)的指令理解、任務(wù)規(guī)劃和分解,「讓人形機器人更加接近人的思考和行為表現(xiàn)!

不單如此,DeepSeek R1 的一大優(yōu)勢還在于算法的改進和優(yōu)化,不像以前要求那么大的數(shù)據(jù)量。一方面是基于數(shù)據(jù)蒸餾實現(xiàn)自動篩選高價值數(shù)據(jù),同時也通過對抗訓(xùn)練生成合成數(shù)據(jù),將高質(zhì)量代碼數(shù)據(jù)獲取成本從每 100 個 tokens 的 0.8 元降低至 0.12 元。

DeepSeek-R1 的官方新聞稿中也提到了,DeepSeek-R1 在后訓(xùn)練階段大規(guī)模使用了強化學習技術(shù),「在僅有極少標注數(shù)據(jù)的情況下,極大提升了模型推理能力!

SCR-20250207-qqmf.png

圖/ DeepSeek

這對于困于數(shù)據(jù)難題的具身智能來說極具重要性,實際上也為整個具身智能領(lǐng)域指明了方向。更何況,DeepSeek-R1 還是開源的,允許開發(fā)者和廠商自由修改、蒸餾。

換言之,所有人形機器人都可以基于 DeepSeek-R1 開發(fā)更適合自己的頂級推理模型,甚至沿著 DeepSeek 的技術(shù)路線重新訓(xùn)練真正屬于具身智能的模型。盡管很難直接橫向?qū)Ρ,但在整體性能比肩 OpenAI o1 的同時,DeepSeek R1 毋庸置疑大幅降低了頂級模型的訓(xùn)練成本。

開源的 DeepSeek,人形機器人「進化」的催化劑

今天打造一款人形機器人,最重要的技術(shù)就在于機電和大模型,如果說前者對應(yīng)「身體」,后者則是對應(yīng)「大腦」。

而除了「成本」之外,技術(shù)的自主性也是制約人形機器人發(fā)展的一大因素。一般來說,此前人形機器人廠商要么是自主開發(fā)模型,要么就是選擇與 OpenAI、Google、科大訊飛、華為等大模型廠商合作。最典型的例子就是 Figure 與 OpenAI 的合作。

其實不難理解合作的方式,自主開發(fā)的問題在于訓(xùn)練成本高昂,技術(shù)上也難以追趕領(lǐng)先的 AI 巨頭。不過與此對應(yīng)的是,選擇合作也意味著在技術(shù)上的依賴,不僅需要面對不菲的推理成本,更重要的是模型適配度、開發(fā)節(jié)奏上受制于大模型廠商。

BMW_Factory_View-1280x720.jpg

Figure 02 在寶馬工廠,圖/ Figure

DeepSeek 的開源策略,則為人形機器人公司提供了新的選擇。通過開源,DeepSeek 讓人形機器人公司可以基于其模型進行二次開發(fā),構(gòu)建自己的技術(shù)閉環(huán),真正掌握核心技術(shù)的主動權(quán)。

開源意味著越來越多的機器人可以直接使用先進的 AI 技術(shù),而不必從零開始開發(fā)自己的解決方案。對于優(yōu)必選、Figure 等人形機器人廠商而言,這種技術(shù)門檻的降低意味著可以將更多資源集中在硬件開發(fā)和實際應(yīng)用的優(yōu)化上。

尤其是 DeepSeek 的出現(xiàn)讓更多人形機器人廠商看到了自主研發(fā)的優(yōu)勢,不僅是成本和技術(shù)門檻的大幅降低,還能定制自己的大模型,同時構(gòu)建技術(shù)閉環(huán)。

還是以 Figure 為例,之所以與 OpenAI 分道揚鑣,直接的一個原因可能在于 OpenAI 早就被曝光內(nèi)部也在自研人形機器人?梢灶A(yù)見的是,相比 Figure 這種參股的「干兒子」,OpenAI 在開發(fā)模型上無疑會更重視自家的「親兒子」的需求和發(fā)展路線。

然而更深層的問題在于,F(xiàn)igure 始終還是會受制 OpenAI 的技術(shù)路線、成本等,如果繼續(xù)合作很可能面臨成本上的巨大劣勢。反過來,得益于 DeepSeek 等開源模型的強大和經(jīng)濟,不僅在綜合成本可能還有優(yōu)勢,更重要的是能夠構(gòu)建自主的技術(shù)閉環(huán),適配自身的迭代路線和產(chǎn)品節(jié)奏。

DeepSeek-VL,人形機器人的 One more thing?

不僅是 DeepSeek-R1,在很多人還震撼 R1 超高性價比之余,并不知道 DeepSeek 這幾天剛提出了一個全新的視覺語言模型——DeepSeek-VL。

SCR-20250207-qtri.png

DeepSeek 新論文,圖/ DeepSeek

雖然目前僅公開 1.3B 與 7B 兩個版本的模型,但 DeepSeek-VL 追求的基于現(xiàn)實場景的領(lǐng)先性能,同時多次強調(diào)保留強大的「語言能力」——這一點可能被很多大模型和人形機器人廠商都忽略了。

DeepSeek 團隊在論文中就強調(diào),「在訓(xùn)練過程中,我們不僅進行多模態(tài)數(shù)據(jù)訓(xùn)練,還將大量語言數(shù)據(jù)納入訓(xùn)練!

但這條技術(shù)路線的正確與否,最終還是要「實踐出真知」,就像 DeepSeek-R1 一樣。不過對于人形機器人廠商來說,在 DeepSeek-R1 之外,DeepSeek-VL 確實可能成為了人形機器人加速走向落地的 One more thing。

來源:雷科技

       原文標題 : DeepSeek顛覆一切?人形機器人集體轉(zhuǎn)身:攔路虎被消滅了

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號