訂閱
糾錯
加入自媒體

成立8個月估值24億,這家機器人公司拿什么吸引了投資人?

前言:目前,兩條路徑正在同步推進。一些人形機器人公司專注于構(gòu)建硬件,并側(cè)重于訓(xùn)練機器人全身運動的控制能力,而另一些廠商則采取垂直一體化的策略。

同時,還有其他公司致力于構(gòu)建世界模型或通用模型。Physical Intelligence代表了第三種路徑。

作者 | 方文三圖片來源 |  網(wǎng) 絡(luò) 

圖片

PI成立8個月估值24億美元

據(jù)《紐約時報》報道,美國機器人初創(chuàng)企業(yè)Physical Intelligence近日成功完成了四億美元的融資。

此次融資的主要投資者包括亞馬遜創(chuàng)始人杰夫·貝佐斯、風(fēng)險投資公司Thrive Capital以及Lux Capital,而OpenAI、Redpoint Ventures和Bond亦參與了投資,使得公司在投資前的估值達到了二十億美元。

Physical Intelligence是一家致力于將通用人工智能技術(shù)應(yīng)用于物理世界的新興企業(yè),目前正致力于開發(fā)能夠驅(qū)動當(dāng)前機器人技術(shù)及未來物理設(shè)備的基礎(chǔ)模型和學(xué)習(xí)算法。

該公司于今年三月在美國特拉華州正式注冊成立,總部設(shè)在舊金山。

成立僅一個月后,Physical Intelligence便從Khosla Ventures、Lux Capital、紅杉資本、Thrive Capital和OpenAI等知名投資機構(gòu)成功籌集了七千萬美元的資金,當(dāng)時公司的估值約為四億美元。

Physical Intelligence官網(wǎng)介紹稱,該公司致力于將通用人工智能技術(shù)引入現(xiàn)實世界。

π0模型的訓(xùn)練過程分為兩個階段:預(yù)訓(xùn)練和微調(diào)。

在預(yù)訓(xùn)練階段,模型通過學(xué)習(xí)大量數(shù)據(jù)來掌握廣泛的知識和技能,以便適應(yīng)各種不同的應(yīng)用場景。

隨后,在微調(diào)階段,模型針對特定任務(wù)進行優(yōu)化,以提升在這些任務(wù)上的性能表現(xiàn)。

此外,π0模型采用了流匹配技術(shù),使其能夠處理連續(xù)的動作序列,而不僅僅是單一的、離散的步驟。

結(jié)合其混合專家架構(gòu),這一技術(shù)的應(yīng)用顯著提高了模型在預(yù)測動作時的準(zhǔn)確性。

谷歌斯坦福伯克利大佬領(lǐng)銜的團隊

公司的聯(lián)合創(chuàng)始人兼首席執(zhí)行官Karol Hausman,曾擔(dān)任Google DeepMind的資深研究科學(xué)家,并兼任斯坦福大學(xué)的兼職教授。

Chelsea Finn,斯坦福大學(xué)計算機科學(xué)與電氣工程系的教授,同時也是Google Brain團隊的前成員,其研究興趣集中在如何通過學(xué)習(xí)使機器人和其他智能體變得更加智能。

Sergey Levine,加州大學(xué)伯克利分校電氣工程與計算機科學(xué)系的助理教授,專注于研究自主智能體通過學(xué)習(xí)獲得復(fù)雜行為的通用算法,尤其在機器學(xué)習(xí)決策和控制領(lǐng)域有所建樹。

Brian Ichter,曾是Google Brain的研究科學(xué)家,并在斯坦福大學(xué)獲得博士學(xué)位,其研究方向是通過學(xué)習(xí)提升移動機器人在現(xiàn)實環(huán)境中執(zhí)行任務(wù)的能力。

π0模型具有以下三大優(yōu)勢

①π0模型展現(xiàn)了優(yōu)秀的跨平臺及跨任務(wù)遷移學(xué)習(xí)能力。

該模型通過融合視覺、語言和動作數(shù)據(jù),實現(xiàn)了從物體分類到動態(tài)操控的多樣化技能。

其訓(xùn)練數(shù)據(jù)集涵蓋了來自八種不同機器人的交互數(shù)據(jù),以及開放的圖像和文本數(shù)據(jù)集,這使得π0能夠在不同的機器人和任務(wù)平臺上進行遷移和適應(yīng)。

這種跨平臺的兼容性賦予了π0處理多種不同機器人配置的能力,包括單臂機器人、雙臂機器人和移動機械臂,從而顯著提升了模型的通用性和適應(yīng)性。

②π0模型在任務(wù)處理和指令執(zhí)行方面表現(xiàn)出色。它能夠通過[零樣本]方式執(zhí)行任務(wù),即在沒有特定任務(wù)樣本數(shù)據(jù)的情況下完成指令,這在動態(tài)環(huán)境中尤為適用。

同時,π0還支持[微調(diào)]功能,可根據(jù)具體應(yīng)用場景進行數(shù)據(jù)增強訓(xùn)練,以提升復(fù)雜任務(wù)的執(zhí)行效果。

這種靈活性和適應(yīng)性使得π0能夠應(yīng)對各種復(fù)雜任務(wù),如疊衣服、收拾桌子、組裝盒子等,并在這些任務(wù)中表現(xiàn)出色。

③π0模型采用了獨特的技術(shù)架構(gòu)和方法。它基于視覺-語言模型(VLM)構(gòu)建,通過整合視覺、語言和動作數(shù)據(jù),實現(xiàn)了復(fù)雜任務(wù)的操作。

在動作輸出模塊,π0運用了一種基于擴散模型變體的[流匹配]方法,該方法通過對連續(xù)運動指令的建模,實現(xiàn)了高頻動作控制。

這種高頻控制確保了機器人在動態(tài)任務(wù)中具備靈活的運動調(diào)整能力,從而提高了操作的流暢性和準(zhǔn)確性。

與OpenAI志同道合使其獲得巨額融資

Physical Intelligence與OpenAI一樣,致力于從模型和數(shù)據(jù)層面打破傳統(tǒng)技術(shù)的局限。

①ChatGPT的精確語義理解能力是其核心優(yōu)勢之一,對于π0模型而言,這種能力同樣至關(guān)重要。

π0模型必須具備理解物理世界交互指令和上下文的能力,這涵蓋了視覺、語言和觸覺等多種感官輸入。

②ChatGPT的優(yōu)秀之處在于其能夠?qū)⒑暧^問題拆解為微觀問題,并巧妙地整合答案。

對于π0模型而言,這意味著它需要將復(fù)雜的物理任務(wù)拆解為一系列可操作的步驟,并根據(jù)環(huán)境的實時反饋靈活調(diào)整其行動,以確保實現(xiàn)既定目標(biāo)。

③ChatGPT的通用性體現(xiàn)在其能夠?qū)⑷祟愔R遷移到語言交流中。

相比之下,Physical Intelligence的通用性則體現(xiàn)在其能夠?qū)幕ヂ?lián)網(wǎng)規(guī)模數(shù)據(jù)中學(xué)習(xí)到的深層語義知識,成功應(yīng)用于物理世界的實際操作中。

總體而言,ChatGPT之所以成為一個重要里程碑,是因為其在理解及生成自然語言方面展現(xiàn)出優(yōu)秀的能力;

而Physical Intelligence之所以吸引投資者的關(guān)注,關(guān)鍵在于其對物理世界的深刻理解和操控技巧。

結(jié)尾:

在現(xiàn)實世界中,讓人工智能執(zhí)行諸如洗衣、疊衣、包裝等簡單任務(wù),對于當(dāng)前的人工智能技術(shù)而言,并非易事。

實際上,人工智能要真正理解物理世界的系統(tǒng)性工程,仍面臨諸多挑戰(zhàn)。

然而,要實現(xiàn)所謂的AGI,人工智能必須走出黑盒,進入現(xiàn)實世界。

在這一過程中,機器人,尤其是人形機器人,被視為人工智能在人類設(shè)計的社會環(huán)境中最佳的載體,這使得人工智能能夠具備通才通用性,從而使人形機器人能夠真正服務(wù)于人類。

部分資料參考:雷鋒網(wǎng):《貝索斯領(lǐng)投、OpenAI連續(xù)跟投,這家機器人公司再融4億美金》,AIGC最前線:《Chelsea Finn帶隊的Physical Intelligence成果來了》,機器人前瞻:《28億!又一機器人公司完成巨額融資,OpenAI和貝佐斯都投了》,Robot獵場備忘錄:《估值約150億!具身大模型初創(chuàng)公司最新成果:機器人通用基礎(chǔ)模型[π0]》,人形機器人場景應(yīng)用聯(lián)盟:《4億美元巨額融資!具身智能機器人創(chuàng)企估值飆升至170億》

       原文標(biāo)題 : AI芯天下丨分析丨成立8個月估值24億,這家機器人公司拿什么吸引了投資人?

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號