成立8個月估值24億,這家機器人公司拿什么吸引了投資人?
前言:目前,兩條路徑正在同步推進。一些人形機器人公司專注于構(gòu)建硬件,并側(cè)重于訓(xùn)練機器人全身運動的控制能力,而另一些廠商則采取垂直一體化的策略。
同時,還有其他公司致力于構(gòu)建世界模型或通用模型。Physical Intelligence代表了第三種路徑。
作者 | 方文三圖片來源 | 網(wǎng) 絡(luò)
PI成立8個月估值24億美元
據(jù)《紐約時報》報道,美國機器人初創(chuàng)企業(yè)Physical Intelligence近日成功完成了四億美元的融資。
此次融資的主要投資者包括亞馬遜創(chuàng)始人杰夫·貝佐斯、風(fēng)險投資公司Thrive Capital以及Lux Capital,而OpenAI、Redpoint Ventures和Bond亦參與了投資,使得公司在投資前的估值達到了二十億美元。
Physical Intelligence是一家致力于將通用人工智能技術(shù)應(yīng)用于物理世界的新興企業(yè),目前正致力于開發(fā)能夠驅(qū)動當(dāng)前機器人技術(shù)及未來物理設(shè)備的基礎(chǔ)模型和學(xué)習(xí)算法。
該公司于今年三月在美國特拉華州正式注冊成立,總部設(shè)在舊金山。
成立僅一個月后,Physical Intelligence便從Khosla Ventures、Lux Capital、紅杉資本、Thrive Capital和OpenAI等知名投資機構(gòu)成功籌集了七千萬美元的資金,當(dāng)時公司的估值約為四億美元。
Physical Intelligence官網(wǎng)介紹稱,該公司致力于將通用人工智能技術(shù)引入現(xiàn)實世界。
π0模型的訓(xùn)練過程分為兩個階段:預(yù)訓(xùn)練和微調(diào)。
在預(yù)訓(xùn)練階段,模型通過學(xué)習(xí)大量數(shù)據(jù)來掌握廣泛的知識和技能,以便適應(yīng)各種不同的應(yīng)用場景。
隨后,在微調(diào)階段,模型針對特定任務(wù)進行優(yōu)化,以提升在這些任務(wù)上的性能表現(xiàn)。
此外,π0模型采用了流匹配技術(shù),使其能夠處理連續(xù)的動作序列,而不僅僅是單一的、離散的步驟。
結(jié)合其混合專家架構(gòu),這一技術(shù)的應(yīng)用顯著提高了模型在預(yù)測動作時的準(zhǔn)確性。
谷歌斯坦福伯克利大佬領(lǐng)銜的團隊
公司的聯(lián)合創(chuàng)始人兼首席執(zhí)行官Karol Hausman,曾擔(dān)任Google DeepMind的資深研究科學(xué)家,并兼任斯坦福大學(xué)的兼職教授。
Chelsea Finn,斯坦福大學(xué)計算機科學(xué)與電氣工程系的教授,同時也是Google Brain團隊的前成員,其研究興趣集中在如何通過學(xué)習(xí)使機器人和其他智能體變得更加智能。
Sergey Levine,加州大學(xué)伯克利分校電氣工程與計算機科學(xué)系的助理教授,專注于研究自主智能體通過學(xué)習(xí)獲得復(fù)雜行為的通用算法,尤其在機器學(xué)習(xí)決策和控制領(lǐng)域有所建樹。
Brian Ichter,曾是Google Brain的研究科學(xué)家,并在斯坦福大學(xué)獲得博士學(xué)位,其研究方向是通過學(xué)習(xí)提升移動機器人在現(xiàn)實環(huán)境中執(zhí)行任務(wù)的能力。
π0模型具有以下三大優(yōu)勢
①π0模型展現(xiàn)了優(yōu)秀的跨平臺及跨任務(wù)遷移學(xué)習(xí)能力。
該模型通過融合視覺、語言和動作數(shù)據(jù),實現(xiàn)了從物體分類到動態(tài)操控的多樣化技能。
其訓(xùn)練數(shù)據(jù)集涵蓋了來自八種不同機器人的交互數(shù)據(jù),以及開放的圖像和文本數(shù)據(jù)集,這使得π0能夠在不同的機器人和任務(wù)平臺上進行遷移和適應(yīng)。
這種跨平臺的兼容性賦予了π0處理多種不同機器人配置的能力,包括單臂機器人、雙臂機器人和移動機械臂,從而顯著提升了模型的通用性和適應(yīng)性。
②π0模型在任務(wù)處理和指令執(zhí)行方面表現(xiàn)出色。它能夠通過[零樣本]方式執(zhí)行任務(wù),即在沒有特定任務(wù)樣本數(shù)據(jù)的情況下完成指令,這在動態(tài)環(huán)境中尤為適用。
同時,π0還支持[微調(diào)]功能,可根據(jù)具體應(yīng)用場景進行數(shù)據(jù)增強訓(xùn)練,以提升復(fù)雜任務(wù)的執(zhí)行效果。
這種靈活性和適應(yīng)性使得π0能夠應(yīng)對各種復(fù)雜任務(wù),如疊衣服、收拾桌子、組裝盒子等,并在這些任務(wù)中表現(xiàn)出色。
③π0模型采用了獨特的技術(shù)架構(gòu)和方法。它基于視覺-語言模型(VLM)構(gòu)建,通過整合視覺、語言和動作數(shù)據(jù),實現(xiàn)了復(fù)雜任務(wù)的操作。
在動作輸出模塊,π0運用了一種基于擴散模型變體的[流匹配]方法,該方法通過對連續(xù)運動指令的建模,實現(xiàn)了高頻動作控制。
這種高頻控制確保了機器人在動態(tài)任務(wù)中具備靈活的運動調(diào)整能力,從而提高了操作的流暢性和準(zhǔn)確性。
與OpenAI志同道合使其獲得巨額融資
Physical Intelligence與OpenAI一樣,致力于從模型和數(shù)據(jù)層面打破傳統(tǒng)技術(shù)的局限。
①ChatGPT的精確語義理解能力是其核心優(yōu)勢之一,對于π0模型而言,這種能力同樣至關(guān)重要。
π0模型必須具備理解物理世界交互指令和上下文的能力,這涵蓋了視覺、語言和觸覺等多種感官輸入。
②ChatGPT的優(yōu)秀之處在于其能夠?qū)⒑暧^問題拆解為微觀問題,并巧妙地整合答案。
對于π0模型而言,這意味著它需要將復(fù)雜的物理任務(wù)拆解為一系列可操作的步驟,并根據(jù)環(huán)境的實時反饋靈活調(diào)整其行動,以確保實現(xiàn)既定目標(biāo)。
③ChatGPT的通用性體現(xiàn)在其能夠?qū)⑷祟愔R遷移到語言交流中。
相比之下,Physical Intelligence的通用性則體現(xiàn)在其能夠?qū)幕ヂ?lián)網(wǎng)規(guī)模數(shù)據(jù)中學(xué)習(xí)到的深層語義知識,成功應(yīng)用于物理世界的實際操作中。
總體而言,ChatGPT之所以成為一個重要里程碑,是因為其在理解及生成自然語言方面展現(xiàn)出優(yōu)秀的能力;
而Physical Intelligence之所以吸引投資者的關(guān)注,關(guān)鍵在于其對物理世界的深刻理解和操控技巧。
結(jié)尾:
在現(xiàn)實世界中,讓人工智能執(zhí)行諸如洗衣、疊衣、包裝等簡單任務(wù),對于當(dāng)前的人工智能技術(shù)而言,并非易事。
實際上,人工智能要真正理解物理世界的系統(tǒng)性工程,仍面臨諸多挑戰(zhàn)。
然而,要實現(xiàn)所謂的AGI,人工智能必須走出黑盒,進入現(xiàn)實世界。
在這一過程中,機器人,尤其是人形機器人,被視為人工智能在人類設(shè)計的社會環(huán)境中最佳的載體,這使得人工智能能夠具備通才通用性,從而使人形機器人能夠真正服務(wù)于人類。
部分資料參考:雷鋒網(wǎng):《貝索斯領(lǐng)投、OpenAI連續(xù)跟投,這家機器人公司再融4億美金》,AIGC最前線:《Chelsea Finn帶隊的Physical Intelligence成果來了》,機器人前瞻:《28億!又一機器人公司完成巨額融資,OpenAI和貝佐斯都投了》,Robot獵場備忘錄:《估值約150億!具身大模型初創(chuàng)公司最新成果:機器人通用基礎(chǔ)模型[π0]》,人形機器人場景應(yīng)用聯(lián)盟:《4億美元巨額融資!具身智能機器人創(chuàng)企估值飆升至170億》
原文標(biāo)題 : AI芯天下丨分析丨成立8個月估值24億,這家機器人公司拿什么吸引了投資人?

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機器人東風(fēng)翻身?