訂閱
糾錯
加入自媒體

2025 CES 英偉達(dá)發(fā)布洞察:Agentic AI/Physical AI 快速落地,未來已來

每年一度的國際消費電子展(CES)是全球科技界的盛會,被譽為科技發(fā)展的風(fēng)向標(biāo)。它不僅匯聚了全球最前沿的科技產(chǎn)品和創(chuàng)新技術(shù),更是各大科技巨頭展示實力、引領(lǐng)行業(yè)趨勢的重要舞臺。CES 2025 于 1 月 7 日至 10 日在美國拉斯維加斯舉行,吸引了無數(shù)科技愛好者、行業(yè)專家和媒體的目光。

在眾多參展商中,英偉達(dá)(NVIDIA)無疑是本屆 CES 的焦點之一。作為全球領(lǐng)先的 GPU 和 AI 芯片制造商,英偉達(dá)憑借其強大的 GPU 和 AI 計算平臺,推動了生成式 AI 和 Agentic AI 等技術(shù)的爆發(fā),股價和市值也一路飆升超過3萬億,位列美股第二,甚至一度超過蘋果成為第一。在本次 CES 2025 上,英偉達(dá) CEO 黃仁勛發(fā)表了開幕主題演講,展示了公司在 AI、機器人、游戲和自動駕駛領(lǐng)域的多項重磅技術(shù)進(jìn)展。本文將深入探討英偉達(dá)在 CES 2025 上的展示內(nèi)容,分析其在 Agentic AI 和 Physical AI 領(lǐng)域的最新進(jìn)展,以及這些技術(shù)如何改變我們的未來。

AI 應(yīng)用的發(fā)展:從感知AI 到 Physical AI個人新品發(fā)布:一塊顯卡,一個AI超級計算機Agentic AI 開發(fā)套裝:NIM微應(yīng)用,NeMo端到端框架Physical AI 開發(fā)套裝:Cosmos世界模型,GR00T運動生成框架Physical AI 掘金三件套:算法訓(xùn)練,邊緣,虛擬開發(fā)端AI算力希望能幫助理解 AI 發(fā)展的邏輯,以及當(dāng)前 Agentic AI 和以自動駕駛以及人形機器人為代表的 Physical AI 這場 AI 淘金熱,未來已來背后的關(guān)鍵的“鏟子”或者驅(qū)動力量。AI應(yīng)用的發(fā)展,從感知AI 到 Physical AI自從人類互聯(lián)網(wǎng)數(shù)字化以來,人類的內(nèi)容基本通過文字,圖像,視頻等沉淀起來,人類產(chǎn)生數(shù)字化內(nèi)容,人類消化這些數(shù)字化內(nèi)容。這些數(shù)字化的內(nèi)容,萌生了人工智能的發(fā)展四步:

Perception AI 感知AI - 人工智能能夠理解圖像、文字和聲音這些內(nèi)容,主要應(yīng)用于語音識別,醫(yī)學(xué)影像識別,大家去看現(xiàn)在的B超體檢,基本上儀器掃描,儀器自動給出結(jié)論,這就是感知識別,而第一代智能駕駛采用CNN識別是同理。Generative AI 生成式AI,人工智能能夠生成圖像、文本和聲音,用于數(shù)字市場營銷,內(nèi)容生成,這個點就是之前文章《ChatGPT以及其對汽車有什么影響?》講到的ChatGPT以及Midjourney等引發(fā)的,AI可以產(chǎn)生內(nèi)容供人類消費。

Agentic AI AI代理,人工智能能夠感知、推理、自主的規(guī)劃和行動,但主要停留在數(shù)字時代,用于代碼助手,電子客服等,他們可以根據(jù)人類指令自主的推理,生成,搜索等然后反饋給人類數(shù)字世界的內(nèi)容。

Physical AI 物理AI,這個時候AI走出了數(shù)字世界,進(jìn)入與人類交互的物理世界,他們可以感知、推理、自主的規(guī)劃和擬人化的物理行動,主要落地用于自動駕駛,通用機器人。

以上為人工智能應(yīng)用發(fā)展,基于人類產(chǎn)生數(shù)字內(nèi)容,之后人工智能產(chǎn)生數(shù)字內(nèi)容,最后人工智能產(chǎn)生物理行為與人類交互。那英偉達(dá)在人工智能時代,獲得如此高的價值和地位,主要就是抓住了AI的一軟一硬,硬件就是GPU等,軟件就是CUDA算子等。下文我們看看此次CES 2025 英偉達(dá)從哪些方面在AI的淘金熱時代塑造其鏟子。個人新品發(fā)布,一塊顯卡,一個AI超級計算機首先,英偉達(dá)的老底,顯卡,本次CES 2025 英偉達(dá)推出了 GeForce RTX 50 系列臺式機和筆記本電腦 GPU——面向游戲玩家、創(chuàng)作者和開發(fā)者的消費級圖形處理器單元。

黃仁勛表示,這些 GPU 采用該公司下一代人工智能芯片 Blackwell,引入DLSS 4 多幀生成技術(shù),業(yè)內(nèi)首個采用 Transformer 模型實時應(yīng)用,等助力其 GPU 強大的性能:CUDA 核心:RTX 5090 擁有 21,760 個 CUDA 核心,相比前代產(chǎn)品性能提升高達(dá) 70%。顯存:配備 32GB GDDR7 顯存,顯存帶寬高達(dá) 1,792GB/s。AI TOPS:AI 算力達(dá)到 3,400 TOPS,是 RTX 4090 的兩倍。旗艦 RTX 5090 型號將于 1 月上市,售價 1,999 美元。RTX 5070 將于 2 月下旬推出,售價 549 美元。

另外,英偉達(dá)宣布了Project DIGITS,這是一款售價 3,000 美元的臺式電腦,目標(biāo)客戶是想要在家中試驗 AI 模型的開發(fā)人員或 AI 愛好者。性能如下:

AI 性能:采用GB10 超級芯片,可提供高達(dá) 1 PFLOPS(千萬億次浮點運算)的 AI 性能,專為 AI 大模型的原型設(shè)計、微調(diào)和運行而設(shè)計。

內(nèi)存和存儲:每個系統(tǒng)配備了 128GB 的統(tǒng)一高一致性內(nèi)存和 4TB 的 NVMe 存儲,足以運行包含高達(dá) 2000 億參數(shù)的大語言模型,類似于可以在本地跑一個ChatGPT-3(1750億參數(shù))。該機器將于2025年 5 月推出,由新的 Blackwell 芯片驅(qū)動。總而言之,Project DIGITS 將允許用戶運行具有多達(dá) 2000 億個參數(shù)的 AI 模型。這意味著以前需要昂貴的云基礎(chǔ)設(shè)施才能運行的模型可以在您的桌面上運行。開啟私人本地AI模型桌面化,未來極客本地化玩大模型。Agentic AI人工智能代理開發(fā)套裝Agentic AI(代理式人工智能)是一種能夠自主完成任務(wù)的智能體,通過復(fù)雜的推理和迭代規(guī)劃來解決多步驟的復(fù)雜問題。當(dāng)前就是Agentic AI 快速發(fā)展應(yīng)用落地的時候,Agentic AI本質(zhì)上是AI在數(shù)字層面的集成應(yīng)用,他的核心差異有:

多模型協(xié)同工作:該系統(tǒng)包含多個模型,一部分用于理解客戶和用戶互動,另一部分用于從存儲中檢索信息。它可能是一個語義AI系統(tǒng),類似于我們之前文章《LLM大語言模型等AI如何加速汽車行業(yè)變革》分享過的多RAG(Retrieval-Augmented Generation),具備上網(wǎng)、研究PDF文件等多種功能,能夠使用工具如計算器、生成式AI來生成圖表等。

問題分解與迭代:系統(tǒng)將用戶提出的問題分解成多個步驟,并通過不同的模型進(jìn)行迭代處理,以生成更準(zhǔn)確、更全面的回答。這意味著在后臺,多個模型會協(xié)同工作,以提供更好的答案。

可以認(rèn)為數(shù)字 AI 的一站式解決方案,當(dāng)前互聯(lián)網(wǎng)在這一塊如火如荼的淘金,英偉達(dá)在本次CES 2025 上提出他們的淘金鏟子方案 -- 英偉達(dá)的代理AI構(gòu)建塊NIM預(yù)訓(xùn)練模型和NeMo框架讓組織能夠輕松開發(fā)AI代理:英偉達(dá)NIM,本質(zhì)上是AI微服務(wù),全部打包好,它將所有這些真正復(fù)雜的CUDA軟件、DNN、cutless或tensor rtlm或Triton所有這些不同的真正復(fù)雜的軟件和模型本身,英偉達(dá)將其打包,進(jìn)行優(yōu)化,將其放入一個容器中,這樣你可以使用于視覺的模型、用于理解語言的模型、用于語音的模型、用于動畫的模型、用于數(shù)字生物學(xué)的模型等等。

英偉達(dá) NeMo 是一款端到端的云原生框架,專為開發(fā)、定制和部署生成式 AI 模型而設(shè)計,甚至提供了一系列預(yù)訓(xùn)練的AI 模型,例如本次CES 2025上英偉達(dá)表示提供基于Meta 開源大模型 Llama的Llama Nemotron 大語言基礎(chǔ)模型,支持大家微調(diào)構(gòu)建自己的大語言模型。

所以,英偉達(dá)的Agentic AI 開發(fā)套件,將極大降低Agentic AI開發(fā)門檻。

各個行業(yè)的創(chuàng)業(yè)應(yīng)用都可以買它的鏟子去Agentic AI淘金,開發(fā)自己的應(yīng)用。Physical AI 開發(fā)套裝解決了數(shù)字層面的AI,與人類物理交互的Physical AI 要出馬了,要與人類交互,必須能夠理解人類的物理世界,包括幾何空間關(guān)系,重力,摩擦等等我們大學(xué)學(xué)習(xí)的力學(xué)此類。其實,此類正是當(dāng)前自動駕駛在解決和面對的問題,而機器人由于對安全方面的嚴(yán)苛要遠(yuǎn)小于自動駕駛汽車,所以,現(xiàn)在隨physical AI 在自動駕駛上獲取大量的經(jīng)驗,機器人應(yīng)用迅猛發(fā)展。

英偉達(dá)此次CES 2025 拋出了他的一個解決方案 -- Cosmos世界基礎(chǔ)模型,一個旨在理解物理世界的世界基礎(chǔ)模型平臺。它通過大規(guī)模的視頻數(shù)據(jù)訓(xùn)練,生成基于物理的合成數(shù)據(jù),以支持機器人、自動駕駛汽車等在物理世界中運行的 AI 系統(tǒng)。

英偉達(dá)在CES 2025 上宣傳了他的 NVIDIA Isaac GR00T 合成運動生成的框架 ,可以采集運動數(shù)據(jù),通過模仿學(xué)習(xí)(Imitative Learning)幫助開發(fā)者生成海量的合成運動數(shù)據(jù),從而訓(xùn)練人形機器人。以下是 GR00T 的核心組件及其在機器人開發(fā)中的應(yīng)用:

GR00T-Teleop:實時遠(yuǎn)程操作:通過 Apple Vision Pro 等 VR/AR 設(shè)備,操作者可以在數(shù)字孿生環(huán)境中以第一人稱視角控制機器人“化身”。操作者的動作會被精確捕捉,并通過高速網(wǎng)絡(luò)傳輸?shù)綑C器人身上,使機器人能夠?qū)崟r復(fù)現(xiàn)操作者的動作。

GR00T-Mimic:動作模仿和數(shù)據(jù)擴展:GR00T-Mimic 采用先進(jìn)的深度學(xué)習(xí)模型(如循環(huán)神經(jīng)網(wǎng)絡(luò) RNN、長短期記憶網(wǎng)絡(luò) LSTM 和 Transformer)進(jìn)行軌跡建模,通過訓(xùn)練學(xué)習(xí)人類動作的軌跡和規(guī)律,生成新的動作軌跡。此外,圖神經(jīng)網(wǎng)絡(luò)(GNN)被引入用于建模人體骨骼的運動關(guān)系,使生成的動作更加自然和精確。

GR00T-Gen:數(shù)據(jù)集擴增:基于 NVIDIA Omniverse 和 NVIDIA Cosmos 平臺,GR00T-Gen 通過域隨機化(Domain Randomization)技術(shù)和 3D 提升技術(shù),將合成數(shù)據(jù)集擴展到指數(shù)級別。這些數(shù)據(jù)集可以作為機器人策略的輸入,幫助機器人在 NVIDIA Isaac Lab 中學(xué)習(xí)如何高效且安全地移動和互動。通過以上方法,可以快速開發(fā)和部署人形機器人,本次CES 2025上英偉達(dá)將12家人形機器人的產(chǎn)品拉來亮相了,其中一半來自中國,十二家分別是:北美的Apptronik、Boston Dynamics、Agility Robotics、Figure,1X、Sanctuary AI。中國的,Robotera 星動紀(jì)元、Agibot 智元機器人、Fourier 上海傅利葉智能、Galbot 銀河通用機器人、Xpeng小鵬、宇樹Unitree。歐洲德國的NEURA Robotics。以色列,mobileye CEO創(chuàng)立的Mentee。

AI 人形機器人掘金賽道,當(dāng)有了AI 鏟子之后,接下來會更火熱。Physical AI 掘金三件套:算法訓(xùn)練,邊緣,虛擬開發(fā)端AI算力當(dāng)然,目前AI更多的是企業(yè)級的應(yīng)用,畢Physical AI 尚處于產(chǎn)業(yè)化落地的早期階段,英偉達(dá)在此次CES上提出了AI “三臺計算機”的方案:一臺計算機用于訓(xùn)練AI,英偉達(dá)稱之為DGX計算機主要用于訓(xùn)練 AI 算法,目前大家喊的總共有多少算力,主要是指這一塊。另一臺用于部署AI,英偉達(dá)稱之為AGX,它在車內(nèi)、機器人內(nèi)或在其他邊緣端,或者你知道在一個體育場或任何地方,比如蔚來汽車搞的換電站,也采用類似AI計算幫助定位,這些計算機都在邊緣,并且是本地化自主運行。最后一臺,英偉達(dá)表示要連接云端和邊緣端,還需要一個數(shù)字孿生,數(shù)字孿生是AI被訓(xùn)練后去實踐、去完善、去做合成數(shù)據(jù)生成、強化學(xué)習(xí)AI反饋等等的地方。

英偉達(dá)DGX用于訓(xùn)練AI模型,它提供完全集成的硬件和軟件AI平臺。它包括NVIDIA AI Enterprise軟件,能夠加速數(shù)據(jù)科學(xué)流程,簡化生產(chǎn)級AI應(yīng)用的開發(fā)和部署。當(dāng)然美國已經(jīng)限制英偉達(dá)向中國出售高端AI訓(xùn)練芯片,當(dāng)前主要出售A800給國內(nèi),國內(nèi)華為,壁仞以及算能等都盯著這塊市場,但英偉達(dá)提供硬件和軟件整體解決方案,產(chǎn)生壁壘,而且平臺之間很難移植還是有優(yōu)勢。車端,機器等邊緣端的AI計算芯片方案,英偉達(dá)稱為AGX,其中Orin芯片一直是當(dāng)前汽車圈內(nèi)的高性能王者,而英偉達(dá)的Thor芯片號稱比其前身Orin模型強大20倍,也是喊出要推出很久了,原本喊2025年年中量產(chǎn),由于英偉達(dá)產(chǎn)品技術(shù)等原因聽說要推遲到今年年中以后。所以這次CES 2025 英偉達(dá)只是廣告了下他運行在芯片上的系統(tǒng)NVIDIA DRIVE OS,通過ASIL B/D,ISO26262認(rèn)證,芯片平臺也是強調(diào)Blackwell平臺。

目前對于邊緣端AI算力芯片,國內(nèi)新勢力小鵬,理想,蔚來,以及比亞迪都已經(jīng)相繼流片,未來要上自己的AI芯片,國內(nèi)地平線等都摩拳擦掌搶占這塊市場。英偉達(dá)表示要連接云端和邊緣端的計算機,主要是用于虛擬驗證和數(shù)據(jù)泛化的Omniverse和Cosmos。Omniverse就是英偉達(dá)數(shù)字孿生的平臺,它能夠模擬真實世界環(huán)境,用于測試和驗證自動駕駛系統(tǒng)。例如在自動駕駛方面,它通過Omnimap融合地圖和地理空間數(shù)據(jù),構(gòu)建可駕駛的3D環(huán)境。駕駛場景變化可以從重放Drive日志或AI交通生成器中生成。此外,神經(jīng)重建引擎使用自動駕駛汽車傳感器日志創(chuàng)建高保真4D模擬環(huán)境,重放之前的駕駛并生成場景變化以增強訓(xùn)練數(shù)據(jù)。

而本次英偉達(dá)推出的Cosmos可以基于Omniverse場景生成大量逼真的數(shù)據(jù),減少模擬到現(xiàn)實的差距,并通過文本提示生成近乎無限的駕駛場景變化。通過條件化Omniverse中的3D場景來增強訓(xùn)練數(shù)據(jù)集。具體應(yīng)用:Waabi公司正在評估使用Cosmos進(jìn)行視頻數(shù)據(jù)的搜索和整理,用于自動駕駛軟件開發(fā)和模擬。Wayve公司正在評估Cosmos作為工具,用于搜索邊緣和角落駕駛場景,用于安全和驗證。Foretellix公司計劃使用Cosmos和NVIDIA Omniverse Sensor RTX API,大規(guī)模評估和生成高保真測試場景和訓(xùn)練數(shù)據(jù)。通過這些三臺 AI 計算機技術(shù)的協(xié)同工作,英偉達(dá)表示可有為Physical AI的自動駕駛汽車或者人形機器等的開發(fā)提供了一個從訓(xùn)練到測試再到實時決策的完整解決方案。

總結(jié)

人工智能全面落地的時代開啟,數(shù)字世界的Agentic AI,物理世界的Physical AI 將全面改變?nèi)祟惖纳睢?/p>

*未經(jīng)準(zhǔn)許嚴(yán)禁轉(zhuǎn)載和摘錄-參考資料:

英偉達(dá)CES 2025演講ppt 以及視頻ces-2025-keynote-deck.pdf

加入我們的知識星球可以下載包含以上參考資料的公眾號海量參考資料。

       原文標(biāo)題 : 2025 CES 英偉達(dá)發(fā)布洞察:Agentic AI/Physical AI 快速落地,未來已來

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號