馬斯克發(fā)布大模型Grok 3,號(hào)稱(chēng)性能超越DeepSeek和ChatGPT
前言:
2023年11月,xAI發(fā)布了其首款大型模型Grok-1,該模型擁有3140億參數(shù),成為當(dāng)時(shí)參數(shù)量最大的開(kāi)源大型語(yǔ)言模型;
2024年8月發(fā)布的Grok-2,在性能上可與最新的ChatGPT模型相媲美。
該系列大型模型能夠通過(guò)網(wǎng)絡(luò)連接獲取實(shí)時(shí)信息,并利用X平臺(tái)(原推特)上的資訊,從而保持信息獲取的時(shí)效性。
作者 | 方文三
圖片來(lái)源 | 網(wǎng) 絡(luò)
馬斯克發(fā)布AI大模型Grok 3
埃隆·馬斯克提前展示了其強(qiáng)大的AI技術(shù),與OpenAI o1、DeepSeek-V3/R1等模型展開(kāi)競(jìng)爭(zhēng)。
在北京時(shí)間2月18日,馬斯克領(lǐng)導(dǎo)的AI團(tuán)隊(duì)以類(lèi)似發(fā)布會(huì)的形式,與三位技術(shù)負(fù)責(zé)人共同展示了Grok 3基座大模型。
此前,馬斯克曾贊譽(yù)其為[地球上最聰明的AI]。
同時(shí),xAI團(tuán)隊(duì)還公布了推理AI模型Grok3 mini(Reasoning,精簡(jiǎn)版),基于Grok 3的[深度思考](Deep thinking)的Agent智能搜索引擎,以及基于Grok App的獨(dú)立訂閱服務(wù)[Super Grok]。
具體而言,Grok3模型的訓(xùn)練計(jì)算量(能力)比前一代提升了10倍,采用了20萬(wàn)張GPU卡集群進(jìn)行訓(xùn)練。
在第一階段,使用了10萬(wàn)個(gè)GPU進(jìn)行了122天的全面訓(xùn)練同步;在第二階段,又?jǐn)U展到20萬(wàn)張GPU卡,再次進(jìn)行了92天的訓(xùn)練和推理。
在技術(shù)參數(shù)方面,Grok 3模型配備了20萬(wàn)GPU,其計(jì)算能力相較于Grok2提升了10倍,同樣是一個(gè)推理模型,并具備DeepSearch功能;而B(niǎo)ig Brain功能則是通過(guò)更多的計(jì)算資源來(lái)解決問(wèn)題。
依據(jù)xAI所提供的評(píng)估標(biāo)準(zhǔn),Grok 3在科學(xué)、編程及數(shù)學(xué)領(lǐng)域的表現(xiàn)超越了Gemini 2 Pro、Deepseek V3、ChatGPT 4o等競(jìng)爭(zhēng)產(chǎn)品。
此外,在盲測(cè)環(huán)節(jié),xAI的早期版本Grok-3在lmArena排行榜上以1402分的歷史最高成績(jī)榮登榜首,成為首個(gè)突破1400分的AI模型,這一成就超越了Google、OpenAI、DeepSeek等業(yè)界主要競(jìng)爭(zhēng)者。
埃隆·馬斯克強(qiáng)調(diào),Grok-3能夠降低AI的幻覺(jué)效應(yīng),其方法在于反復(fù)核查數(shù)據(jù)并努力實(shí)現(xiàn)邏輯一致性。
他進(jìn)一步透露,相較于先前版本,Grok-3的訓(xùn)練過(guò)程消耗了更多的計(jì)算資源,并且大量應(yīng)用了合成數(shù)據(jù)。
與DeepSeek算法優(yōu)化路徑(DeepSeek-V3使用2048個(gè)H800 GPU,訓(xùn)練耗時(shí)2788千小時(shí))不同。
xAI公司透露,Grok-3的開(kāi)發(fā)得益于一座名為Colossus的超級(jí)計(jì)算機(jī),該計(jì)算機(jī)僅用8個(gè)月時(shí)間建成,由10萬(wàn)個(gè)英偉達(dá)H100 GPU提供動(dòng)力,為訓(xùn)練提供了2億個(gè)GPU小時(shí),這一數(shù)字是Grok-2的十多倍。
馬斯克還透露,Grok 3的語(yǔ)音交互功能即將推出,并承諾每次發(fā)布新版本時(shí)會(huì)開(kāi)源上一個(gè)版本,這體現(xiàn)了xAI對(duì)技術(shù)透明度和共享的重視。
Grok 3發(fā)布后,業(yè)界普遍認(rèn)為,特斯拉的FSD(全自動(dòng)駕駛系統(tǒng))以及特斯拉的人形機(jī)器人擎天柱可能是主要受益者。
有消息稱(chēng),馬斯克已經(jīng)將Grok 3集成到特斯拉汽車(chē)中,利用特斯拉多年積累的車(chē)輛傳感器數(shù)據(jù)和SpaceX的航天技術(shù)資料。
Grok 3能夠?qū)崟r(shí)解析道路積水深度、預(yù)測(cè)相鄰車(chē)輛的行駛軌跡,甚至提前30天預(yù)測(cè)電池故障。
Gork3架構(gòu)中的深度搜索模塊引人關(guān)注
此外,xAI正致力于為Grok打造深度搜索功能(DeepSearch),該功能預(yù)期將成為其AI體的關(guān)鍵能力之一。
DeepSearch是一款具備推理能力的聊天機(jī)器人,它能夠詳細(xì)解釋其對(duì)查詢內(nèi)容的理解過(guò)程以及制定回復(fù)策略的方式。
展示中表明,DeepSearch具備研究、創(chuàng)意發(fā)散和數(shù)據(jù)分析等多項(xiàng)功能。
馬斯克團(tuán)隊(duì)亦透露,他們計(jì)劃[盡快]推出一款基于語(yǔ)音交互的聊天機(jī)器人。
該模塊具備迅速檢索并驗(yàn)證信息的能力,為用戶提供精確的答案。
其設(shè)計(jì)理念借鑒了當(dāng)前最先進(jìn)的搜索引擎技術(shù),并且Gork3在這一基礎(chǔ)上進(jìn)行了顯著的改進(jìn)和優(yōu)化。
深度搜索模塊不僅能夠模擬人類(lèi)的搜索行為,迅速檢索大量信息,而且還能通過(guò)推理和驗(yàn)證確保信息的可靠性。
在搜索過(guò)程中,Gork3會(huì)展示一個(gè)高級(jí)進(jìn)度條,實(shí)時(shí)反映其思考和搜索的進(jìn)度。
搜索任務(wù)完成后,界面的右側(cè)將呈現(xiàn)查詢模型的啟動(dòng)摘要,涵蓋瀏覽的網(wǎng)站、驗(yàn)證的來(lái)源等詳細(xì)信息,并且通常會(huì)進(jìn)行多源交叉驗(yàn)證,以確保答案的精確無(wú)誤。
結(jié)尾:在收購(gòu)OpenAI未果后計(jì)劃融資
在DeepSeek大型模型推出之后,業(yè)界開(kāi)始關(guān)注是否還需要依賴(lài)[大規(guī)模堆疊芯片和計(jì)算資源]這種昂貴方式來(lái)推動(dòng)AI的發(fā)展。
OpenAI的首席執(zhí)行官奧爾特曼此前表示,DeepSeek使得OpenAI的領(lǐng)先優(yōu)勢(shì)不再像前幾年那樣顯著。
他指出,在開(kāi)源模型和研究成果方面,OpenAI已經(jīng)站在了歷史的錯(cuò)誤一邊,因此需要制定不同的開(kāi)源策略。
在馬斯克xAI新模型發(fā)布前數(shù)小時(shí)內(nèi),奧爾特曼通過(guò)推特發(fā)布了幾條信息,試圖轉(zhuǎn)移公眾對(duì)xAI發(fā)布會(huì)的注意力,釋放了GPT-4.5、開(kāi)源等關(guān)鍵信息。
實(shí)際上,馬斯克領(lǐng)導(dǎo)的投資者財(cái)團(tuán)在2月10日提出了以974億美元收購(gòu)OpenAI的提議。
馬斯克的律師馬克·托貝羅夫確認(rèn)了這一消息,并表示已向OpenAI董事會(huì)提交了收購(gòu)要約。
一旦交易完成,OpenAI很可能會(huì)與xAI合并,這將有助于xAI迅速縮小技術(shù)差距,并形成一個(gè)能與谷歌、微軟等巨頭競(jìng)爭(zhēng)的AI企業(yè)。
如果這一收購(gòu)計(jì)劃得以實(shí)現(xiàn),它將成為全球AI領(lǐng)域最大規(guī)模的并購(gòu)交易,為全球AI行業(yè)未來(lái)的發(fā)展帶來(lái)不確定性,并可能加劇馬斯克與奧爾特曼之間的長(zhǎng)期矛盾。
然而,隨著馬斯克提出以974億美元收購(gòu)OpenAI的消息傳出,奧爾特曼并未表示支持。
對(duì)于收購(gòu)要約,他在社交媒體上回應(yīng)稱(chēng):[不,謝謝。但如果你愿意的話,我們可以考慮以97.4億美元收購(gòu)?fù)铺亍
2月16日,OpenAI董事會(huì)正式拒絕了馬斯克的收購(gòu)提議。
這一目標(biāo)未能實(shí)現(xiàn),同時(shí)xAI也面臨著融資挑戰(zhàn)。
據(jù)報(bào)道,xAI計(jì)劃籌集約100億美元資金,目前正在與潛在投資者如紅杉資本、Andreessen Horowitz等進(jìn)行接觸,此輪融資可能使公司估值達(dá)到約750億美元。
部分資料參考:鈦媒體AGI:《馬斯克Grok 3來(lái)襲,性能超DeepSeek,OpenAI加緊圍堵》,華夏時(shí)報(bào):《馬斯克發(fā)布最新一代大模型Grok 3,多模態(tài)AI或改變未來(lái)出行體驗(yàn)》,ITPUB:《大模型戰(zhàn)事再起,馬斯克發(fā)布[史上最聰明AI]Grok 3,稱(chēng)超越DeepSeek》,算力豹:《馬斯克推出Grok-3大模型:算力碾壓、推理能力全球登頂,反擊DeepSeek、OpenAI》,騰訊科技:《馬斯克狂吹的Grok 3,終于發(fā)布了》
原文標(biāo)題 : AI芯天下丨熱點(diǎn)丨馬斯克發(fā)布大模型Grok 3,號(hào)稱(chēng)性能超越DeepSeek和ChatGPT

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
即日-6.16立即報(bào)名>> 【在線會(huì)議】olution Talks |Computex 2025關(guān)鍵趨勢(shì)深讀
-
6月20日立即下載>> 【白皮書(shū)】精準(zhǔn)測(cè)量 安全高效——福祿克光伏行業(yè)解決方案
-
7月3日立即報(bào)名>> 【在線會(huì)議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車(chē)生態(tài)圈峰會(huì)
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身機(jī)器人動(dòng)力電池技術(shù)應(yīng)用大會(huì)
推薦專(zhuān)題
- 1 AI 眼鏡讓百萬(wàn) APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語(yǔ)權(quán)
- 3 深度報(bào)告|中國(guó)AI產(chǎn)業(yè)正在崛起成全球力量,市場(chǎng)潛力和關(guān)鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級(jí)獨(dú)角獸:獲上市公司戰(zhàn)投,干人形機(jī)器人
- 5 國(guó)家數(shù)據(jù)局局長(zhǎng)劉烈宏調(diào)研格創(chuàng)東智
- 6 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 7 百億AI芯片訂單,瘋狂傾銷(xiāo)中東?
- 8 Robotaxi新消息密集釋放,量產(chǎn)元年誰(shuí)在領(lǐng)跑?
- 9 格斗大賽出圈!人形機(jī)器人致命短板曝光:頭腦過(guò)于簡(jiǎn)單
- 10 “搶灘”家用機(jī)器人領(lǐng)域,聯(lián)通、海爾、美的等紛紛入局