訂閱
糾錯(cuò)
加入自媒體

國(guó)產(chǎn)超節(jié)點(diǎn)擂臺(tái)賽,華為、阿里、曙光上演三強(qiáng)爭(zhēng)霸

2025年,國(guó)產(chǎn)超節(jié)點(diǎn)玩家開(kāi)場(chǎng)即沸騰,華為、阿里、中科曙光等廠商拾階而上,儼然把中國(guó)智算集群玩出國(guó)際新高度。

近日,繼昇騰384、磐久AL128連續(xù)刷新行業(yè)紀(jì)錄,曙光最新操刀的全球首個(gè)單機(jī)柜級(jí)640卡超節(jié)點(diǎn)——scaleX640粉墨登場(chǎng),一舉將算力集成度抬升至384超節(jié)點(diǎn)的20倍,順利接棒磐久AL128開(kāi)啟守擂環(huán)節(jié)。

本文謹(jǐn)遵照發(fā)布時(shí)間排序及各家廠商披露信息,逐一對(duì)三大超節(jié)點(diǎn)產(chǎn)品展開(kāi)盤(pán)點(diǎn)(由于產(chǎn)品迭進(jìn)節(jié)奏差異,部分產(chǎn)品或已更新性能指標(biāo),以下盤(pán)點(diǎn)不分高下只論異同)。

華為昇騰384,垂直路線一枝獨(dú)秀

昇騰384超節(jié)點(diǎn)Atlas 900 A3 SuperPoD基于分布式多框集群設(shè)計(jì)與靈衢(LingQu)光互聯(lián)為架構(gòu)核心,彼時(shí)堪稱(chēng)業(yè)界最大規(guī)模高速總線互聯(lián)超節(jié)點(diǎn),創(chuàng)新性集成384顆昇騰NPU和192顆鯤鵬CPU,成功打破AI算力互聯(lián)瓶頸,并同時(shí)滿足了AI計(jì)算和通用計(jì)算需求。

其優(yōu)勢(shì)在于“以網(wǎng)聯(lián)算”的技術(shù)路徑出神入化,基于高速互聯(lián)總線讓超節(jié)點(diǎn)像一臺(tái)計(jì)算機(jī)一樣工作,實(shí)現(xiàn)“一卡一專(zhuān)家”并行推理,追求極致的是互聯(lián)性能。不過(guò)在加速卡選擇上,384超節(jié)點(diǎn)僅支持昇騰910C加速卡,并完全圍繞CANN進(jìn)行生態(tài)建設(shè),適配范圍相對(duì)狹窄。

目前,384開(kāi)始側(cè)重于“硬件聚焦,軟件開(kāi)放”策略。硬件層面從昇騰NPU、鯤鵬CPU到靈衢總線,構(gòu)建完整的國(guó)產(chǎn)技術(shù)體系。軟件層面,華為將核心的CANN計(jì)算架構(gòu)、MindSpore深度學(xué)習(xí)框架等開(kāi)放給社區(qū),以號(hào)召更好開(kāi)發(fā)者補(bǔ)全生態(tài)短板。

阿里磐久AL128,軟硬協(xié)同全棧優(yōu)化專(zhuān)家

磐久AL128超節(jié)點(diǎn)在云棲大會(huì)上展示了其極致密度集成能力的突破。如傳統(tǒng)服務(wù)器機(jī)柜通常支持?jǐn)?shù)十個(gè)AI計(jì)算芯片,而磐久128彼時(shí)刷新了單柜支持128個(gè)加速卡的紀(jì)錄,算力集成度可換算為384超節(jié)點(diǎn)的4倍。

高密度集成背后是散熱技術(shù)的突破。據(jù)悉,該產(chǎn)品采用單相浸沒(méi)式液冷技術(shù),散熱效率比傳統(tǒng)風(fēng)冷提升3倍,使數(shù)據(jù)中心PUE可低至 1.09,同時(shí)冷卻系統(tǒng)節(jié)能 30%,占地面積減少 50%。

這一技術(shù)解決了高密度計(jì)算帶來(lái)的熱量積聚問(wèn)題,確保芯片在最佳溫度下持續(xù)高性能運(yùn)行。

不過(guò),最讓同行服氣的還是阿里的軟硬件協(xié)同優(yōu)化能力。磐久AL128超節(jié)點(diǎn)與阿里云自研的 HPN 8.0 高性能網(wǎng)絡(luò)、CPFS 并行文件存儲(chǔ)以及人工智能平臺(tái) PAI 深度集成,形成了從底層硬件到上層應(yīng)用的垂直優(yōu)化體系,通義千問(wèn)模型基于此實(shí)現(xiàn)訓(xùn)練端到端加速比3倍提升。

曙光scaleX640,開(kāi)放式架構(gòu)的巔峰之作

曙光scaleX640超節(jié)點(diǎn)幾乎代表了現(xiàn)階段計(jì)算集群規(guī)模極限。該產(chǎn)品作為世界首個(gè)單機(jī)柜級(jí)640卡超節(jié)點(diǎn),是面向萬(wàn)億參數(shù)大模型,基于AI計(jì)算開(kāi)放架構(gòu)設(shè)計(jì)的新一代大規(guī)模、高效率智算基礎(chǔ)設(shè)施,具有“超強(qiáng)性能、極致效率、全面開(kāi)放、超高可靠”等領(lǐng)先特性。

scaleX640采用“一拖二”高密架構(gòu)設(shè)計(jì),構(gòu)建大規(guī)模、高帶寬、低時(shí)延超節(jié)點(diǎn)通信域,雙機(jī)柜合體可組成1280卡計(jì)算單元,柜間通過(guò)高速網(wǎng)絡(luò)互連,液體冷凝換熱裝置CDM為千卡級(jí)計(jì)算單元提供高達(dá)1.72MW的超級(jí)散熱能力,PUE值低至1.04,算力密度最大增幅達(dá)20倍。

更關(guān)鍵之處在于,曙光采用了復(fù)雜度最高的全棧開(kāi)放式架構(gòu)集成路線,整合算、存、網(wǎng)、電、冷、管等諸多子系統(tǒng),并基于超高速正交架構(gòu)、超高密度刀片、浸沒(méi)相變液冷、高壓直流供電等多技術(shù)融合創(chuàng)新設(shè)計(jì),MOE大模型訓(xùn)練效率與高通量推理吞吐性能大幅提升30-40%。

結(jié)語(yǔ):

三大超節(jié)點(diǎn)產(chǎn)品除了在性能指標(biāo)上實(shí)現(xiàn)代代更新意外,更值得關(guān)注的是其路線差異展現(xiàn)出的發(fā)展特征。

其中,以單一巨頭為主導(dǎo)的垂直一體路線,表現(xiàn)出開(kāi)發(fā)周期短、協(xié)同難度低、前期起步快等優(yōu)勢(shì),但在全棧資源整合量級(jí)上遜于開(kāi)放式架構(gòu)路線,存在一定的擴(kuò)展性局限。

另外,以阿里、中科曙光為代表的技術(shù)路線,在底層硬件選擇上支持多種AI芯片,具有開(kāi)放架構(gòu)和兼容性設(shè)計(jì),具有產(chǎn)業(yè)活性足、內(nèi)生潛力強(qiáng)、算力能效高等優(yōu)勢(shì)特征,但在產(chǎn)業(yè)鏈協(xié)作難度上存在一定的生態(tài)壁壘,需要投入大量資源和精力統(tǒng)一技術(shù)接口和協(xié)同規(guī)范。

總體而言,垂直式路線側(cè)重于單槍匹馬打天下,產(chǎn)業(yè)鏈風(fēng)險(xiǎn)可控、鏈主收益較大,特別適用于行業(yè)發(fā)展前期培育細(xì)分領(lǐng)域龍頭;開(kāi)放式路線強(qiáng)調(diào)上下游組團(tuán)結(jié)成命運(yùn)共同體,風(fēng)險(xiǎn)與收益共擔(dān)共負(fù),鏈上參與者積極性更強(qiáng),尤其有利于行業(yè)發(fā)展中后期構(gòu)筑可持續(xù)發(fā)展底座。

       原文標(biāo)題 : 國(guó)產(chǎn)超節(jié)點(diǎn)擂臺(tái)賽,華為、阿里、曙光上演三強(qiáng)爭(zhēng)霸

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)