英偉達(dá)市值超3.6萬(wàn)億,巨頭開(kāi)囤GPU!
英偉達(dá)超越蘋(píng)果成為全球最值錢(qián)的公司,而市場(chǎng)依舊對(duì)英偉達(dá)保持樂(lè)觀。
與此同時(shí),美國(guó)科技公司的服務(wù)器集群頻頻曝光。年關(guān)將至,巨頭們開(kāi)始展示自己的AI肌肉,試圖在年底給投資者們一點(diǎn)甜頭。
就在埃隆·馬斯克xAI集群首次曝光后,小扎也迫不及待在Meta的業(yè)績(jī)發(fā)布會(huì)上表示,Llama 4背后服務(wù)器集群的實(shí)力“比我見(jiàn)過(guò)的任何報(bào)道中其他人正在做的(規(guī)模)要大”。這番言論無(wú)疑是對(duì)埃隆·馬斯克“地表最強(qiáng)的AI集群”的正面回應(yīng)。
在科技巨頭們開(kāi)啟算力競(jìng)賽時(shí)代,英偉達(dá)的GPU成為巨頭們的“糧草”。本文就來(lái)看看英偉達(dá)的大客戶們AI的囤糧情況。
01 巨頭血拼H100“前”地表最強(qiáng)——xAI
2023年7月14日,馬斯克在個(gè)人推特賬號(hào)宣布新公司定名為xAI,并于同日舉行Twitter空間會(huì)議。新成立的xAI公司會(huì)與Twitter和特斯拉緊密合作 ,其中一個(gè)目標(biāo)是打造能進(jìn)行高階邏輯推理的人工智能模型,并超越市面上其他模型。
四個(gè)月后,xAI宣布推出Grok,稱(chēng)此模型“最大限度地造福全人類(lèi),并將是任何人的強(qiáng)大的研究!
2024年9月xAI推出Colossus 100k H100 訓(xùn)練集群。馬斯克在 X 上稱(chēng),它是“世界上最強(qiáng)大的人工智能訓(xùn)練系統(tǒng)。此外,它的規(guī)模將在幾個(gè)月內(nèi)翻一番,達(dá)到 200k(50k H200x)!
2024年10月,埃隆·馬斯克的新項(xiàng)目 Colossus AI超級(jí)計(jì)算機(jī)第一次被詳細(xì)介紹。一則視頻展示了其包含10萬(wàn)臺(tái)GPU集群的內(nèi)部結(jié)構(gòu)。Colossus 的基本構(gòu)建模塊是 Supermicro 液冷機(jī)架。它由 8 臺(tái) 4U 服務(wù)器組成,每臺(tái)服務(wù)器配備 8 個(gè) NVIDIA H100,每臺(tái)機(jī)架總共有 64 個(gè) GPU。8 臺(tái)這樣的 GPU 服務(wù)器加上一臺(tái)Supermicro 冷卻液分配單元 (CDU)和相關(guān)硬件構(gòu)成了一個(gè) GPU 計(jì)算機(jī)架。每個(gè)HGX H100之間都夾有1U歧管,為服務(wù)器提供所需的液體冷卻。每個(gè)機(jī)架底部還有另一個(gè)Supermicro 4U單元,配備的是冗余泵系統(tǒng)和機(jī)架監(jiān)控系統(tǒng)。
Meta:購(gòu)買(mǎi)35萬(wàn)個(gè)H100
正如前文所說(shuō),在Colossus AI計(jì)算機(jī)視頻流出后,埃隆·馬斯克的“死對(duì)頭”扎克伯格在Meta的業(yè)績(jī)發(fā)布會(huì)上表示自己家的GPU比目前公開(kāi)的數(shù)量都多。
年初,扎克伯格在Instagram上發(fā)表文章稱(chēng),計(jì)劃在今年年底前向芯片設(shè)計(jì)商英偉達(dá)購(gòu)買(mǎi)35萬(wàn)個(gè)H100 GPU芯片。Meta首席科學(xué)家楊立昆(Yann LeCun)上個(gè)月在舊金山舉行的一次活動(dòng)中強(qiáng)調(diào)了GPU對(duì)于構(gòu)建通用人工智能(AGI)的重要性。他說(shuō):“如果你認(rèn)為AGI時(shí)代正在到來(lái),你就必須購(gòu)買(mǎi)更多的GPU。這是一場(chǎng)人工智能戰(zhàn)爭(zhēng),而英偉達(dá)正在提供武器。”
據(jù)業(yè)內(nèi)人士介紹,每個(gè)英偉達(dá)H100芯片售價(jià)為25000至30000美元。那么購(gòu)買(mǎi)35萬(wàn)個(gè)H100的成本在87.5億之間到105億美元之間。如果按照每個(gè)服務(wù)器配備8個(gè)GPU的數(shù)據(jù)估算,Meta將建造超過(guò)4.3萬(wàn)臺(tái)服務(wù)器;目前市場(chǎng)配備一臺(tái)服務(wù)器的價(jià)格在27萬(wàn)美金左右,那么2024年Meta的在服務(wù)器的設(shè)備成本大概是118億美元。此外,還要配備相應(yīng)的存儲(chǔ)、網(wǎng)絡(luò)、供電、廠房等等其他設(shè)施;從成本結(jié)構(gòu)來(lái)看(按服務(wù)器設(shè)備成本占比30%估算),如果Meta在2024年購(gòu)買(mǎi)的35萬(wàn)個(gè)H100全部按時(shí)到貨,且投入使用,那么Meta為H100搭建的數(shù)據(jù)中心投資預(yù)計(jì)超過(guò)350億美元(還不包括后續(xù)運(yùn)營(yíng)成本)。顯然扎克伯格希望用35萬(wàn)個(gè)H100芯片為Meta的Llama 4 帶來(lái)更強(qiáng)的推理能力和更快的速度。
據(jù)估算10萬(wàn)個(gè)H100的算力峰值可以飆升到198/99 FP8/FP16 ExaFLOPS。來(lái)源:semianalysis,半導(dǎo)體產(chǎn)業(yè)縱橫調(diào)研
微軟:2023年最大買(mǎi)主
根據(jù)Omdia Research的分析,2023年英偉達(dá)的H100大多供應(yīng)給了大型云服務(wù)商。該機(jī)構(gòu)估計(jì),2023年H100最大的買(mǎi)家就是微軟和Meta,預(yù)計(jì)為15萬(wàn)個(gè)。
來(lái)到2024年,微軟將AI芯片的囤貨目標(biāo)提到了180 萬(wàn)塊,且將主要來(lái)自英偉達(dá)。business inside表示,到 2027 財(cái)年,微軟預(yù)計(jì)將在 GPU 和數(shù)據(jù)中心上花費(fèi)約 1000 億美元。微軟的AI芯片目標(biāo)顯然不全是H100,但這樣的數(shù)字也足以見(jiàn)得微軟對(duì)英偉達(dá)的“高需求”。
亞馬遜&谷歌:一邊買(mǎi),一邊造
相對(duì)于本文提到的其他三家公司,亞馬遜和谷歌在購(gòu)買(mǎi)GPU采購(gòu)上相對(duì)低調(diào)。
事實(shí)上亞馬遜在2023年7月就已經(jīng)宣布推出基于H100 GPU的虛擬機(jī)實(shí)例EC2 P5。P5 實(shí)例可以組合成稱(chēng)為 UltraScale 的 GPU 集群,提供高達(dá) 20 百億億次浮點(diǎn)運(yùn)算的總體性能。 每個(gè) UltraScale 集群中可擴(kuò)展多達(dá) 20,000 個(gè) H100 GPU。用戶可以部署可擴(kuò)展到數(shù)十億或數(shù)萬(wàn)億個(gè)參數(shù)的 ML 模型。
同樣在2023年,谷歌也推出了承載26,000 個(gè)英偉達(dá)H100 GPU 的 A3 超級(jí)計(jì)算機(jī)。A3 最大可提供 26 ExaFlops 的處理能力,可顯著減少訓(xùn)練大型機(jī)器學(xué)習(xí)模型的所需時(shí)間與成本。若用在 AI 推理,A3 的成效更為顯著,若以 A2 的運(yùn)算效能為基準(zhǔn),A3 領(lǐng)先幅度可達(dá)到 30 倍。
作為云巨頭,亞馬遜和谷歌為何在H100的采購(gòu)上有如此大的數(shù)量差距?
一個(gè)重要原因是,這兩家巨頭都在“悄悄”發(fā)力自研芯片。
亞馬遜開(kāi)發(fā)的AI專(zhuān)用芯片包括Inferentia和Trainium。據(jù)亞馬遜方面表示,在亞馬遜的促銷(xiāo)日期間,該公司部署了80000個(gè)AI芯片實(shí)施云計(jì)算,以應(yīng)對(duì)其平臺(tái)上活動(dòng)的激增。此外,AWS計(jì)算和網(wǎng)絡(luò)副總裁戴維·布朗(David Brown)透露:“在某些情況下,該芯片性能相較英偉達(dá)可提高40%至50%,因此其成本應(yīng)該是使用英偉達(dá)運(yùn)行相同型號(hào)的一半!
谷歌TPU 是定制設(shè)計(jì)的 AI 加速器,針對(duì)大型 AI 模型的訓(xùn)練和推理進(jìn)行了優(yōu)化。它們非常適合各種使用場(chǎng)景,例如聊天機(jī)器人、代碼生成、媒體內(nèi)容生成、合成語(yǔ)音、視覺(jué)服務(wù)、推薦引擎、個(gè)性化模型等等。Cloud TPU 能夠針對(duì)各種 AI 工作負(fù)載(涵蓋訓(xùn)練、微調(diào)和推理)進(jìn)行經(jīng)濟(jì)高效的擴(kuò)縮。Cloud TPU 提供了多種功能,可加速領(lǐng)先 AI 框架(包括 PyTorch、JAX 和 TensorFlow)上的工作負(fù)載。通過(guò) Google Kubernetes Engine (GKE) 中的 Cloud TPU 集成,無(wú)縫編排大規(guī)模 AI 工作負(fù)載。利用動(dòng)態(tài)工作負(fù)載調(diào)度程序同時(shí)安排所有需要的加速器,從而提高工作負(fù)載的可伸縮性。尋求最簡(jiǎn)單的 AI 模型開(kāi)發(fā)方法的客戶還可以在全托管式 AI 平臺(tái) Vertex AI 中利用 Cloud TPU。
02 背后贏家英偉達(dá)
英偉達(dá)在2023年為H100定下的銷(xiāo)售目標(biāo)是2024年出貨150萬(wàn)至200萬(wàn)臺(tái)。
根據(jù)英偉達(dá)財(cái)報(bào),2024年第二季度營(yíng)收實(shí)現(xiàn)翻倍,其中四個(gè)大客戶的采購(gòu)占比占英偉達(dá)300億美元營(yíng)業(yè)額的46%。出于競(jìng)爭(zhēng)原因,對(duì)四家客戶的身份進(jìn)行匿名處理。在英偉達(dá)公布備受期待的季度投資者報(bào)告時(shí)提交的10-Q監(jiān)管申報(bào)文件顯示,四家客戶貢獻(xiàn)的營(yíng)業(yè)額約為138億美元。時(shí)長(zhǎng)猜測(cè)。四家人工智能巨頭可能就在亞馬遜、Meta、微軟、Alphabet、OpenAI或特斯拉+xAI之間產(chǎn)生。
微軟、Alphabet(谷歌母公司)、亞馬遜和Meta,四家公司第三季度在數(shù)據(jù)中心設(shè)備和其他固定資產(chǎn)上總共投入了590億美元,創(chuàng)下了季度紀(jì)錄。這意味著英偉達(dá)有望在本季度也交出一張漂亮的答卷。
除了以上巨頭,蘋(píng)果、OpenAI、中國(guó)互聯(lián)網(wǎng)大廠都是英偉達(dá)的重要買(mǎi)家,基于這樣的背景。華爾街分析師對(duì)英偉達(dá)的看法非常樂(lè)觀,機(jī)構(gòu)追蹤的75位分析師中有67位將該股評(píng)為“買(mǎi)入”。他們還在繼續(xù)提高預(yù)期,根據(jù)匯編的數(shù)據(jù),過(guò)去三個(gè)月,他們對(duì)明年的利潤(rùn)預(yù)測(cè)提高了約10%。
2024年11月8日,英偉達(dá)市值突破3.6萬(wàn)億美元,刷新了美股歷史。在11月份,英偉達(dá)股價(jià)已經(jīng)累計(jì)上漲了12%,2024年年初至今,該公司市值已經(jīng)增長(zhǎng)了兩倍。
2024年11月8日英偉達(dá)市值
03 AI改變芯片市場(chǎng)
11月1日,標(biāo)普道瓊斯指數(shù)公司公布,將英偉達(dá)納入道瓊斯工業(yè)平均指數(shù),取代道指目前的芯片業(yè)成分股英特爾。這次調(diào)整標(biāo)志著人工智能和高性能計(jì)算的重要性日益增強(qiáng)。英偉達(dá)作為AI GPU的領(lǐng)先供應(yīng)商,能夠吸引更多投資者關(guān)注新興技術(shù),傳統(tǒng)的半導(dǎo)體公司則面臨較大壓力,尤其是在數(shù)據(jù)處理、AI模型訓(xùn)練等高增長(zhǎng)領(lǐng)域。
當(dāng)然,這樣的調(diào)整更說(shuō)明AI正在引導(dǎo)市場(chǎng)投資風(fēng)向。
上周巨頭業(yè)績(jī)后,各家投行陸續(xù)上調(diào)了明年整體資本開(kāi)支。大摩從2700億美金上調(diào)到3000億美金。3000億美金,作為對(duì)比先后完成6次登月的阿波羅登月計(jì)劃共花費(fèi)239.15億美元;3000億美金的數(shù)字可以在2023年非洲國(guó)家GDP排名中位列第4,僅低于埃及(3939億美元)、南非(3777億美元)、尼日利亞(3749億美元)。
在人們感慨英偉達(dá)時(shí)代來(lái)臨的時(shí)候,或許應(yīng)該意識(shí)到AI時(shí)代真的來(lái)了。
AI成就了英偉達(dá),AI時(shí)代并不會(huì)只屬于英偉達(dá)。凱文凱利在《5000天后的世界》中預(yù)測(cè):在未來(lái)的50年里,AI將成為可以與自動(dòng)化和產(chǎn)業(yè)革命相提并論的,不,應(yīng)該是影響更為深遠(yuǎn)的趨勢(shì)。
一個(gè)新時(shí)代,將會(huì)由一個(gè)新玩家建造。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車(chē)電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車(chē)】汽車(chē)E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書(shū)】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專(zhuān)題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開(kāi)始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類(lèi)新物種登上歷史舞臺(tái)
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來(lái)商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽(yáng)光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開(kāi)成長(zhǎng)空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?