GPT付費(fèi)訂閱再度開(kāi)放,AI界的「石油危機(jī)」解決了?
北京時(shí)間 12 月 14 日凌晨,OpenAI CEO Sam Altman 在 X(Twitter)上發(fā)布了一則推文,正式宣告重新開(kāi)放 ChatGPT Plus 新用戶(hù)訂閱。按照 Altman 的說(shuō)法,核心原因是 OpenAI 已經(jīng)找到了更多的 GPU,原文是:we found more gpus.
就在 1 個(gè)月前,也是 Altman 宣布暫停 ChatGPT Plus 新用戶(hù)訂閱(20 美元/月,約合人民幣 141 元/月),理由是「開(kāi)發(fā)日后使用量的激增超出了我們的承受能力,我們希望確保每個(gè)人都有良好的體驗(yàn)!
即使對(duì)于風(fēng)頭正盛的 OpenAI 來(lái)說(shuō),這也不是一件易事。
要知道,頂級(jí) GPU,或者是算力早就成為了科技公司的一種戰(zhàn)略資源,甚至是吸引頂級(jí)研究人員的「利器」。公開(kāi)報(bào)道指出,作為全球英偉達(dá) H100 GPU 儲(chǔ)備第二多的公司,Meta 已經(jīng)將大量 H100 作為吸引頂級(jí) AI 人才的招聘策略。
難怪 Altman 新推文下面有網(wǎng)友再次感嘆道:「GPU 是新的石油!
圖/ X(Twitter)
但算力依然受限,核心是大模型訓(xùn)練、推理都嚴(yán)重依賴(lài)于英偉達(dá)高端 GPU,而英偉達(dá)又受限于臺(tái)積電先進(jìn)芯片制造工藝、封裝工藝以及韓國(guó) HBM 內(nèi)存的產(chǎn)能。
說(shuō)到底,還是算力不夠用,「供給」趕不上「需求」。這不僅是 OpenAI 一家公司,也是整個(gè) AI 行業(yè)所面臨的危機(jī)。但現(xiàn)在 OpenAI 重新開(kāi)放了 ChatGPT Plus 訂閱,又是否意味著行業(yè)已經(jīng)走出了算力短缺的危機(jī)?
并不盡然。
自始至終,OpenAI 都沒(méi)有明確指出所謂「找到」,是指從「算力之王」英偉達(dá)購(gòu)買(mǎi)到了更多的英偉達(dá) GPU,還是從「幕后大佬」微軟那里拿到的支持,又或是從「最強(qiáng)備胎」AMD 買(mǎi)到最新一批的 AI 芯片 Instinct MI300X。
但至少可以肯定,算力市場(chǎng)正在經(jīng)歷一輪洗牌。
英偉達(dá)的對(duì)手們
一周前,谷歌 DeepMind CEO Demis Hassabis 代表 Gemini 團(tuán)隊(duì)正式推出了全新一代多模態(tài)大模型 Gemini,擁有「視覺(jué)」和「聽(tīng)覺(jué)」,還有強(qiáng)大的學(xué)習(xí)和推理能力。其中,Gemini Ultra 直接對(duì)標(biāo)公認(rèn)最強(qiáng)大的 GPT-4 模型,行業(yè)推測(cè)參數(shù)超萬(wàn)億。
更耐人尋味的是,在一眾基于英偉達(dá)高端 GPU 訓(xùn)練出的大模型中,Gemini 是唯一一個(gè)完全基于自研 AI 芯片—— TPU 訓(xùn)練出的萬(wàn)億參數(shù)大模型。
TPU v5p 集群,圖/谷歌
從單片性能來(lái)看,不管是 TPU v5e、v4 還是最新發(fā)布的 v5p 其實(shí)都遠(yuǎn)不是英偉達(dá) H200、H100 的對(duì)手。以谷歌最新的 TPU v5p 為例,INT8 下的峰值算力僅為 918 TFLOPs,遠(yuǎn)低于上一代英偉達(dá) H100 的 1979 TFLOPs。
但就像半導(dǎo)體研究機(jī)構(gòu) Semianalys 首席分析師 Dylan Patel 指出的,「對(duì)人工智能基礎(chǔ)設(shè)施來(lái)說(shuō),系統(tǒng)能力比微架構(gòu)更重要。」通俗來(lái)講就是,芯片集群的算力比單塊芯片的算力更重要。
在大模型訓(xùn)練、推理的大規(guī)模計(jì)算之中,單塊芯片計(jì)算完成后需要進(jìn)行通信,但受制于通信效率實(shí)際往往無(wú)法做到全部傳輸,這就意味著部分算力被浪費(fèi)了。行業(yè)搶購(gòu)英偉達(dá) GPU 除了因?yàn)樽畛墒斓?CUDA 生態(tài),在于單塊更強(qiáng) GPU 提供的效率提升,更在于英偉達(dá) NVLink、NVSwitch 等通信技術(shù)可以實(shí)現(xiàn)芯片集群的算力最大。
圖/英偉達(dá)
而谷歌自研 TPU 一開(kāi)始的目的就是用在全球數(shù)據(jù)中心,不可能不重視多芯片互連技術(shù)。事實(shí)上,谷歌也沒(méi)有公布訓(xùn)練 Gemini 使用的 TPU 數(shù)目,而是強(qiáng)調(diào)動(dòng)用了不只一個(gè)集群,甚至不只一個(gè)數(shù)據(jù)中心。
不僅如此,谷歌還宣稱(chēng),包括 Salesforce 和 Lightrick 等客戶(hù)已經(jīng)在使用谷歌云的 TPU v5p 超級(jí)計(jì)算機(jī)來(lái)訓(xùn)練大模型。
谷歌之外,微軟在 11 月舉辦的 Ignite 大會(huì)發(fā)布了自研 AI 芯片——Maia,亞馬遜也于同月舉辦的 re:Invent 大會(huì)上推出自研 AI 芯片——AWS Trainium2。不過(guò),目前亞馬遜、微軟都還沒(méi)有推出基于自研 AI 芯片訓(xùn)練的大模型,更多還是用于大模型的推理,但也有 AI 獨(dú)角獸 Anthropic 宣布了基于 Trainium2 構(gòu)建模型的計(jì)劃。
圖/亞馬遜
不同于云計(jì)算三巨頭的競(jìng)爭(zhēng),英偉達(dá)老對(duì)手、芯片巨頭 AMD 則在本月初的 Advancing AI 發(fā)布會(huì)上,正式推出了高端 GPU Instinct MI300X(以下簡(jiǎn)稱(chēng) MI300X),谷歌、亞馬遜、微軟、OpenAI、甲骨文、Meta、戴爾、惠普、聯(lián)想等公司紛紛為其站臺(tái)。
生態(tài)上,AMD ROCm 雖然相比英偉達(dá) CUDA 生態(tài)還有不小的差距,但 AMD 也借助整個(gè)行業(yè)加注「?jìng)涮ァ沟娘L(fēng)向緊趕慢趕,而且 AMD CEO 蘇姿豐今年早些時(shí)候就表示,她不相信在 AI 芯片市場(chǎng)發(fā)展如此之快的情況下還會(huì)有什么「護(hù)城河」一說(shuō)。
與此同時(shí),微軟、Meta 也都承諾購(gòu)買(mǎi) MI300X 用于 AI 計(jì)算需求,甲骨文甚至提前先采購(gòu)了一批。另?yè)?jù)供應(yīng)鏈傳聞,微軟為此還提前一步砍掉了英偉達(dá)的部分訂單。
王權(quán)沒(méi)有永恒
眾所周知,GPU 最初的目的就是為游戲和視頻進(jìn)行圖像渲染。但前英偉達(dá)首席科學(xué)家戴維·柯克(David Kirk)一直有個(gè)夢(mèng)想——將主要服務(wù)于圖像渲染的 GPU 算力「通用化」,使之轉(zhuǎn)變?yōu)橥ㄓ盟懔χ行摹?/p>
2006 年,戴維·柯克說(shuō)服了英偉達(dá)創(chuàng)始人兼 CEO 黃仁勛推出了 CUDA(Compute Unified Device Architecture,統(tǒng)一計(jì)算架構(gòu))。
CUDA 的今天從來(lái)不是一蹴而就的,而是老黃連續(xù)十多年堅(jiān)定的投入才實(shí)現(xiàn)的。從游戲、科學(xué)研究到區(qū)塊鏈、挖礦,再到元宇宙以及今天的生成式 AI,老黃不斷為 CUDA 和 GPU 算力尋找計(jì)算的出口和未來(lái),包括在 2016 向剛剛成立的 OpenAI 捐出英偉達(dá)的第一臺(tái) AI 超級(jí)計(jì)算機(jī)——DGX-1。
黃仁勛,圖/英偉達(dá)
正如多年前老黃給俄勒岡州立大學(xué)畢業(yè)生的寄語(yǔ):「當(dāng)有人全力以赴時(shí),他們就能做你做不到的事情。全力以赴,不留后手!
而很多人并不知道,早在去年 ChatGPT 推出之前,英偉達(dá)的數(shù)據(jù)中心收入就超過(guò)了游戲業(yè)務(wù),在 ChatGPT 引爆全球科技行業(yè)之后,數(shù)據(jù)中心業(yè)務(wù)更是如同開(kāi)掛般持續(xù)增長(zhǎng),完全壓過(guò)了來(lái)自游戲玩家的收入。
但王權(quán)沒(méi)有永恒。
大模型的興起創(chuàng)造了海量的算力需求,英偉達(dá)的高端 GPU 幾乎成為了全球科技公司的首選目標(biāo)。但首先,英偉達(dá)一家公司難以滿(mǎn)足全球市場(chǎng)(以中美為主)對(duì)于 AI 算力的需求;其次,不管從風(fēng)險(xiǎn)控制還是成本角度考慮,大公司在長(zhǎng)期來(lái)看都不會(huì)接受「把雞蛋放在一個(gè)籃子」。
最后,算力市場(chǎng)從來(lái)不缺競(jìng)爭(zhēng)者,也并非贏家通吃,至少蘇媽就認(rèn)為,「這個(gè)市場(chǎng)將會(huì)有多個(gè)贏家。」
蘇姿豐,圖/ AMD
事實(shí)上除了英偉達(dá),另一家芯片巨頭博通也是大模型浪潮的幕后贏家。更遑論,還有以谷歌為代表的云計(jì)算巨頭,正在試圖垂直整合,實(shí)現(xiàn)從底層芯片到訓(xùn)練框架的自研。
同時(shí)就像前文所述,英偉達(dá)一家公司難以滿(mǎn)足全球持續(xù)增長(zhǎng)又不斷變化的算力需求,而 AMD、谷歌、微軟、亞馬遜以及更多公司的加入,將會(huì)徹底改變算力的供給,提供更強(qiáng)大、更便宜的算力,才可能真正讓大模型成為「社會(huì)基礎(chǔ)設(shè)施」。
老黃會(huì)樂(lè)見(jiàn)這樣的變化嗎?很難講,但至少在送出那臺(tái)贈(zèng)送給 OpenAI 的超級(jí)計(jì)算機(jī)時(shí),他還在上面寫(xiě)了一句話(huà):
「為了計(jì)算和人類(lèi)的未來(lái),我向你們獻(xiàn)上世界上第一臺(tái) DGX-1。」
圖/英偉達(dá)
來(lái)源:雷科技
原文標(biāo)題 : GPT付費(fèi)訂閱再度開(kāi)放,AI界的「石油危機(jī)」解決了?

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車(chē)電子技術(shù)在線(xiàn)大會(huì)
-
4月30日立即下載>> 【村田汽車(chē)】汽車(chē)E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線(xiàn)下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線(xiàn)會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書(shū)】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專(zhuān)題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開(kāi)始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類(lèi)新物種登上歷史舞臺(tái)
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來(lái)商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽(yáng)光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開(kāi)成長(zhǎng)空間
- 8 地平線(xiàn)自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?