UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開(kāi)始
芝能智芯出品
Ultra Accelerator Link(UALink)1.0規(guī)范正式發(fā)布,人工智能(AI)和高性能計(jì)算(HPC)領(lǐng)域開(kāi)始有新的競(jìng)爭(zhēng)。
由AMD、Broadcom、Google、Intel等行業(yè)巨頭聯(lián)合推動(dòng)的UALink,打造一個(gè)開(kāi)放、高速、低延遲的互連標(biāo)準(zhǔn),直接挑戰(zhàn)英偉達(dá)的NVLink技術(shù)霸主地位。UALink 1.0支持每通道200 GT/s的帶寬,連接多達(dá)1024個(gè)加速器,具備低成本、可擴(kuò)展和高安全性的特性,為AI加速器生態(tài)系統(tǒng)注入新的競(jìng)爭(zhēng)活力。
我們將從技術(shù)創(chuàng)新和市場(chǎng)競(jìng)爭(zhēng)兩個(gè)維度深入分析UALink的意義,探討其對(duì)AI產(chǎn)業(yè)格局的潛在影響。
Part 1
UALink的技術(shù)創(chuàng)新與優(yōu)勢(shì)
UALink的誕生源于AMD、Broadcom、Intel等公司對(duì)英偉達(dá)NVLink專(zhuān)有技術(shù)的集體應(yīng)對(duì)。
英偉達(dá)通過(guò)NVLink和NVSwitch構(gòu)建了高效的GPU互聯(lián)生態(tài),尤其在Blackwell NVL72等機(jī)架級(jí)解決方案中展現(xiàn)了強(qiáng)大的性能。然而,NVLink的封閉性限制了其他廠商的參與,抬高了系統(tǒng)集成成本。
UALink通過(guò)開(kāi)放標(biāo)準(zhǔn)打破這一壁壘,允許不同廠商的加速器(如AMD Instinct GPU、Intel Gaudi)無(wú)縫協(xié)作,降低了數(shù)據(jù)中心部署的復(fù)雜性和成本。
這種開(kāi)放生態(tài)的構(gòu)建,不僅為系統(tǒng)集成商和數(shù)據(jù)中心運(yùn)營(yíng)商提供了靈活性,也為中小型AI硬件廠商創(chuàng)造了參與競(jìng)爭(zhēng)的機(jī)會(huì)。
UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開(kāi)始
● UALink 1.0的協(xié)議棧由物理層、數(shù)據(jù)鏈路層、事務(wù)層和協(xié)議層組成,針對(duì)AI和HPC負(fù)載進(jìn)行了深度優(yōu)化。
◎ 物理層:基于標(biāo)準(zhǔn)以太網(wǎng)組件(如200GBASE-KR1/CR1),通過(guò)改進(jìn)前向糾錯(cuò)(FEC)和碼字交織技術(shù),顯著降低延遲,同時(shí)保持與現(xiàn)有以太網(wǎng)生態(tài)的兼容性。
◎ 數(shù)據(jù)鏈路層:采用64字節(jié)到640字節(jié)的flit打包機(jī)制,結(jié)合循環(huán)冗余校驗(yàn)(CRC)和可選重試邏輯,確保數(shù)據(jù)傳輸?shù)目煽啃院透咝浴?/strong>◎ 事務(wù)層:通過(guò)壓縮尋址和直接內(nèi)存操作(讀、寫(xiě)、原子事務(wù)),實(shí)現(xiàn)高達(dá)95%的協(xié)議效率,優(yōu)化了跨加速器的內(nèi)存訪問(wèn),特別適合AI訓(xùn)練和推理中對(duì)低延遲的嚴(yán)苛要求。◎ 協(xié)議層:支持UALinkSec硬件級(jí)加密和可信執(zhí)行環(huán)境(如AMD SEV、Intel TDX),為多租戶(hù)數(shù)據(jù)中心提供安全隔離和機(jī)密計(jì)算能力。
這種分層設(shè)計(jì)在保持高性能的同時(shí),簡(jiǎn)化了協(xié)議復(fù)雜度,相較于PCI-Express(PCIe)或CXL,UALink在帶寬和延遲上更具優(yōu)勢(shì),尤其適合大規(guī)模AI計(jì)算集群。
UALink支持連接多達(dá)1024個(gè)加速器,覆蓋1到4個(gè)機(jī)架,單通道雙向帶寬達(dá)200 GT/s,四通道配置下可達(dá)800 GT/s。
這種規(guī)模化能力使其能夠應(yīng)對(duì)日益增長(zhǎng)的AI模型需求,例如大型語(yǔ)言模型(LLM)的訓(xùn)練和推理任務(wù)。
此外,UALink的往返延遲在64B/640B負(fù)載下低于1微秒,端口到端口跳變延遲約為100-150納秒,接近PCIe交換機(jī)的性能,遠(yuǎn)優(yōu)于傳統(tǒng)以太網(wǎng)。這種低延遲特性對(duì)于構(gòu)建確定性性能的AI計(jì)算Pod至關(guān)重要。
UALink的設(shè)計(jì)注重能效,其交換機(jī)的功耗僅為同等以太網(wǎng)ASIC的1/3到1/2,每個(gè)加速器可節(jié)省150-200瓦的功耗。更小的芯片面積和更低的功耗不僅降低了硬件成本,還減少了數(shù)據(jù)中心的電力和冷卻開(kāi)支,從而優(yōu)化了總體擁有成本(TCO)。
這對(duì)于超大規(guī)模云服務(wù)提供商(如Google、Microsoft)尤為重要,他們需要平衡性能與運(yùn)營(yíng)成本。
Part 2
UALink挑戰(zhàn)英偉達(dá)的生態(tài)壁壘
英偉達(dá)在AI加速器市場(chǎng)的統(tǒng)治地位不僅源于其強(qiáng)大的GPU硬件,還得益于NVLink、NVSwitch和CUDA軟件生態(tài)的協(xié)同作用。
例如,Blackwell NVL72機(jī)架通過(guò)NVLink連接72個(gè)GPU,Pod級(jí)擴(kuò)展支持576個(gè)GPU,而即將推出的Vera Rubin平臺(tái)將進(jìn)一步提升單機(jī)架GPU數(shù)量至144個(gè)。
相比之下,UALink 1.0理論上支持1024個(gè)加速器的Pod規(guī)模,展現(xiàn)了更大的擴(kuò)展?jié)摿Α?/p>
然而,英偉達(dá)的生態(tài)壁壘并非僅靠硬件互連,CUDA的廣泛采用和優(yōu)化工具鏈?zhǔn)蛊湓陂_(kāi)發(fā)者社區(qū)中根深蒂固。
UALink聯(lián)盟需要不僅在硬件層面競(jìng)爭(zhēng),還需推動(dòng)軟件生態(tài)(如ROCm、oneAPI)的成熟,以吸引開(kāi)發(fā)者從英偉達(dá)平臺(tái)遷移。
UALink聯(lián)盟的成員涵蓋了芯片設(shè)計(jì)(AMD、Intel、Broadcom)、云服務(wù)(Google、Microsoft、Meta)、網(wǎng)絡(luò)設(shè)備(Cisco)和系統(tǒng)集成(HPE)等多個(gè)領(lǐng)域。
這種廣泛的行業(yè)支持為UALink的快速落地提供了基礎(chǔ)。例如,Synopsys已推出UALink IP控制器和驗(yàn)證IP,Astera Labs和Broadcom也計(jì)劃生產(chǎn)UALink交換機(jī)。
然而,聯(lián)盟內(nèi)部的利益協(xié)調(diào)可能是一大挑戰(zhàn)。例如,Google和Meta專(zhuān)注于定制加速器(如TPU),而AMD和Intel則希望推廣通用GPU,成員之間的優(yōu)先級(jí)差異可能導(dǎo)致標(biāo)準(zhǔn)演進(jìn)的復(fù)雜性。
此外,英偉達(dá)的缺席使得UALink短期內(nèi)難以撼動(dòng)其市場(chǎng)主導(dǎo)地位,尤其是在高端AI訓(xùn)練市場(chǎng)。
UALink 1.0規(guī)范的發(fā)布標(biāo)志著技術(shù)開(kāi)發(fā)的重大進(jìn)展,但從規(guī)范到商用產(chǎn)品通常需要12-18個(gè)月。聯(lián)盟預(yù)計(jì)首批UALink設(shè)備將于2026年面世,而英偉達(dá)的NVLink 6.0和Rubin Ultra平臺(tái)可能在2027年進(jìn)一步提升性能。
這意味著UALink需要在有限的時(shí)間窗口內(nèi)證明其性能和成本優(yōu)勢(shì),以搶占市場(chǎng)份額。
市場(chǎng)接受度將取決于實(shí)際部署中的表現(xiàn),例如是否能無(wú)縫集成現(xiàn)有數(shù)據(jù)中心基礎(chǔ)設(shè)施,以及是否能顯著降低AI訓(xùn)練和推理的總體成本。
此外,中小型企業(yè)對(duì)開(kāi)放標(biāo)準(zhǔn)的接受度可能高于依賴(lài)英偉達(dá)生態(tài)的大型客戶(hù),這為UALink提供了切入市場(chǎng)的機(jī)會(huì)。
UALink與Ultra Ethernet Consortium(UEC)的合作是其戰(zhàn)略的重要組成部分。
UEC致力于優(yōu)化以太網(wǎng)以滿(mǎn)足AI和高性能計(jì)算的規(guī);枨螅鳸ALink專(zhuān)注于Pod內(nèi)加速器的高速互連。兩者結(jié)合有望形成“規(guī)模內(nèi)+規(guī)模外”的完整解決方案。例如,UALink可用于連接8-128臺(tái)服務(wù)器的Pod,而Ultra Ethernet可實(shí)現(xiàn)跨Pod的擴(kuò)展。
這種協(xié)同效應(yīng)增強(qiáng)了UALink的生態(tài)競(jìng)爭(zhēng)力,但也增加了技術(shù)整合的復(fù)雜性,需要聯(lián)盟在標(biāo)準(zhǔn)制定和產(chǎn)品開(kāi)發(fā)中保持高效協(xié)作。
小結(jié)
UALink 1.0規(guī)范的發(fā)布是AI產(chǎn)業(yè)競(jìng)爭(zhēng)格局演變的象征。作為一個(gè)開(kāi)放標(biāo)準(zhǔn),UALink通過(guò)高速、低延遲和低成本的互連技術(shù),為AMD、Intel、Google等公司挑戰(zhàn)英偉達(dá)的AI統(tǒng)治提供了關(guān)鍵武器。
協(xié)議棧的優(yōu)化設(shè)計(jì)、可擴(kuò)展性和安全性為構(gòu)建下一代AI計(jì)算Pod奠定了基礎(chǔ),同時(shí)與Ultra Ethernet的協(xié)同潛力進(jìn)一步增強(qiáng)了其市場(chǎng)前景。聯(lián)盟需要在軟件生態(tài)、產(chǎn)品落地和市場(chǎng)推廣上持續(xù)發(fā)力,尤其是在2026年的關(guān)鍵時(shí)間窗口內(nèi)證明其價(jià)值。
從更廣義的角度看,UALink的出現(xiàn)反映了AI產(chǎn)業(yè)對(duì)開(kāi)放性和多樣化的需求,AI訓(xùn)練和推理需求的持續(xù)增長(zhǎng),UALink與NVLink的競(jìng)爭(zhēng)會(huì)立即打響。
原文標(biāo)題 : UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開(kāi)始

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
即日-6.16立即報(bào)名>> 【在線會(huì)議】olution Talks |Computex 2025關(guān)鍵趨勢(shì)深讀
-
6月20日立即下載>> 【白皮書(shū)】精準(zhǔn)測(cè)量 安全高效——福祿克光伏行業(yè)解決方案
-
7月3日立即報(bào)名>> 【在線會(huì)議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車(chē)生態(tài)圈峰會(huì)
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身機(jī)器人動(dòng)力電池技術(shù)應(yīng)用大會(huì)
推薦專(zhuān)題
- 1 AI 眼鏡讓百萬(wàn) APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語(yǔ)權(quán)
- 3 深度報(bào)告|中國(guó)AI產(chǎn)業(yè)正在崛起成全球力量,市場(chǎng)潛力和關(guān)鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級(jí)獨(dú)角獸:獲上市公司戰(zhàn)投,干人形機(jī)器人
- 5 國(guó)家數(shù)據(jù)局局長(zhǎng)劉烈宏調(diào)研格創(chuàng)東智
- 6 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 7 百億AI芯片訂單,瘋狂傾銷(xiāo)中東?
- 8 Robotaxi新消息密集釋放,量產(chǎn)元年誰(shuí)在領(lǐng)跑?
- 9 格斗大賽出圈!人形機(jī)器人致命短板曝光:頭腦過(guò)于簡(jiǎn)單
- 10 “搶灘”家用機(jī)器人領(lǐng)域,聯(lián)通、海爾、美的等紛紛入局