国产一国产一级毛片视频国,91亚洲女同在线,国产永久91精品

UALink規(guī)范發(fā)布：挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始

2025-04-14 14:09

芝能智芯出品

Ultra Accelerator Link（UALink）1.0規(guī)范正式發(fā)布，人工智能（AI）和高性能計算（HPC）領(lǐng)域開始有新的競爭。

由AMD、Broadcom、Google、Intel等行業(yè)巨頭聯(lián)合推動的UALink，打造一個開放、高速、低延遲的互連標(biāo)準(zhǔn)，直接挑戰(zhàn)英偉達(dá)的NVLink技術(shù)霸主地位。UALink 1.0支持每通道200 GT/s的帶寬，連接多達(dá)1024個加速器，具備低成本、可擴(kuò)展和高安全性的特性，為AI加速器生態(tài)系統(tǒng)注入新的競爭活力。

我們將從技術(shù)創(chuàng)新和市場競爭兩個維度深入分析UALink的意義，探討其對AI產(chǎn)業(yè)格局的潛在影響。

Part 1

UALink的技術(shù)創(chuàng)新與優(yōu)勢

UALink的誕生源于AMD、Broadcom、Intel等公司對英偉達(dá)NVLink專有技術(shù)的集體應(yīng)對。

英偉達(dá)通過NVLink和NVSwitch構(gòu)建了高效的GPU互聯(lián)生態(tài)，尤其在Blackwell NVL72等機(jī)架級解決方案中展現(xiàn)了強(qiáng)大的性能。然而，NVLink的封閉性限制了其他廠商的參與，抬高了系統(tǒng)集成成本。

UALink通過開放標(biāo)準(zhǔn)打破這一壁壘，允許不同廠商的加速器（如AMD Instinct GPU、Intel Gaudi）無縫協(xié)作，降低了數(shù)據(jù)中心部署的復(fù)雜性和成本。

這種開放生態(tài)的構(gòu)建，不僅為系統(tǒng)集成商和數(shù)據(jù)中心運營商提供了靈活性，也為中小型AI硬件廠商創(chuàng)造了參與競爭的機(jī)會。

UALink規(guī)范發(fā)布：挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始

● UALink 1.0的協(xié)議棧由物理層、數(shù)據(jù)鏈路層、事務(wù)層和協(xié)議層組成，針對AI和HPC負(fù)載進(jìn)行了深度優(yōu)化。

◎ 物理層：基于標(biāo)準(zhǔn)以太網(wǎng)組件（如200GBASE-KR1/CR1），通過改進(jìn)前向糾錯（FEC）和碼字交織技術(shù)，顯著降低延遲，同時保持與現(xiàn)有以太網(wǎng)生態(tài)的兼容性。

◎ 數(shù)據(jù)鏈路層：采用64字節(jié)到640字節(jié)的flit打包機(jī)制，結(jié)合循環(huán)冗余校驗（CRC）和可選重試邏輯，確保數(shù)據(jù)傳輸?shù)目煽啃院透咝浴?/strong>◎ 事務(wù)層：通過壓縮尋址和直接內(nèi)存操作（讀、寫、原子事務(wù)），實現(xiàn)高達(dá)95%的協(xié)議效率，優(yōu)化了跨加速器的內(nèi)存訪問，特別適合AI訓(xùn)練和推理中對低延遲的嚴(yán)苛要求。◎ 協(xié)議層：支持UALinkSec硬件級加密和可信執(zhí)行環(huán)境（如AMD SEV、Intel TDX），為多租戶數(shù)據(jù)中心提供安全隔離和機(jī)密計算能力。

這種分層設(shè)計在保持高性能的同時，簡化了協(xié)議復(fù)雜度，相較于PCI-Express（PCIe）或CXL，UALink在帶寬和延遲上更具優(yōu)勢，尤其適合大規(guī)模AI計算集群。

UALink支持連接多達(dá)1024個加速器，覆蓋1到4個機(jī)架，單通道雙向帶寬達(dá)200 GT/s，四通道配置下可達(dá)800 GT/s。

這種規(guī)�；芰κ蛊淠軌驊�(yīng)對日益增長的AI模型需求，例如大型語言模型（LLM）的訓(xùn)練和推理任務(wù)。

此外，UALink的往返延遲在64B/640B負(fù)載下低于1微秒，端口到端口跳變延遲約為100-150納秒，接近PCIe交換機(jī)的性能，遠(yuǎn)優(yōu)于傳統(tǒng)以太網(wǎng)。這種低延遲特性對于構(gòu)建確定性性能的AI計算Pod至關(guān)重要。

UALink的設(shè)計注重能效，其交換機(jī)的功耗僅為同等以太網(wǎng)ASIC的1/3到1/2，每個加速器可節(jié)省150-200瓦的功耗。更小的芯片面積和更低的功耗不僅降低了硬件成本，還減少了數(shù)據(jù)中心的電力和冷卻開支，從而優(yōu)化了總體擁有成本（TCO）。

這對于超大規(guī)模云服務(wù)提供商（如Google、Microsoft）尤為重要，他們需要平衡性能與運營成本。

Part 2

UALink挑戰(zhàn)英偉達(dá)的生態(tài)壁壘

英偉達(dá)在AI加速器市場的統(tǒng)治地位不僅源于其強(qiáng)大的GPU硬件，還得益于NVLink、NVSwitch和CUDA軟件生態(tài)的協(xié)同作用。

例如，Blackwell NVL72機(jī)架通過NVLink連接72個GPU，Pod級擴(kuò)展支持576個GPU，而即將推出的Vera Rubin平臺將進(jìn)一步提升單機(jī)架GPU數(shù)量至144個。

相比之下，UALink 1.0理論上支持1024個加速器的Pod規(guī)模，展現(xiàn)了更大的擴(kuò)展?jié)摿Α?/p>

然而，英偉達(dá)的生態(tài)壁壘并非僅靠硬件互連，CUDA的廣泛采用和優(yōu)化工具鏈?zhǔn)蛊湓陂_發(fā)者社區(qū)中根深蒂固。

UALink聯(lián)盟需要不僅在硬件層面競爭，還需推動軟件生態(tài)（如ROCm、oneAPI）的成熟，以吸引開發(fā)者從英偉達(dá)平臺遷移。

UALink聯(lián)盟的成員涵蓋了芯片設(shè)計（AMD、Intel、Broadcom）、云服務(wù)（Google、Microsoft、Meta）、網(wǎng)絡(luò)設(shè)備（Cisco）和系統(tǒng)集成（HPE）等多個領(lǐng)域。

這種廣泛的行業(yè)支持為UALink的快速落地提供了基礎(chǔ)。例如，Synopsys已推出UALink IP控制器和驗證IP，Astera Labs和Broadcom也計劃生產(chǎn)UALink交換機(jī)。

然而，聯(lián)盟內(nèi)部的利益協(xié)調(diào)可能是一大挑戰(zhàn)。例如，Google和Meta專注于定制加速器（如TPU），而AMD和Intel則希望推廣通用GPU，成員之間的優(yōu)先級差異可能導(dǎo)致標(biāo)準(zhǔn)演進(jìn)的復(fù)雜性。

此外，英偉達(dá)的缺席使得UALink短期內(nèi)難以撼動其市場主導(dǎo)地位，尤其是在高端AI訓(xùn)練市場。

UALink 1.0規(guī)范的發(fā)布標(biāo)志著技術(shù)開發(fā)的重大進(jìn)展，但從規(guī)范到商用產(chǎn)品通常需要12-18個月。聯(lián)盟預(yù)計首批UALink設(shè)備將于2026年面世，而英偉達(dá)的NVLink 6.0和Rubin Ultra平臺可能在2027年進(jìn)一步提升性能。

這意味著UALink需要在有限的時間窗口內(nèi)證明其性能和成本優(yōu)勢，以搶占市場份額。

市場接受度將取決于實際部署中的表現(xiàn)，例如是否能無縫集成現(xiàn)有數(shù)據(jù)中心基礎(chǔ)設(shè)施，以及是否能顯著降低AI訓(xùn)練和推理的總體成本。

此外，中小型企業(yè)對開放標(biāo)準(zhǔn)的接受度可能高于依賴英偉達(dá)生態(tài)的大型客戶，這為UALink提供了切入市場的機(jī)會。

UALink與Ultra Ethernet Consortium（UEC）的合作是其戰(zhàn)略的重要組成部分。

UEC致力于優(yōu)化以太網(wǎng)以滿足AI和高性能計算的規(guī)�；枨螅鳸ALink專注于Pod內(nèi)加速器的高速互連。兩者結(jié)合有望形成“規(guī)模內(nèi)+規(guī)模外”的完整解決方案。例如，UALink可用于連接8-128臺服務(wù)器的Pod，而Ultra Ethernet可實現(xiàn)跨Pod的擴(kuò)展。

這種協(xié)同效應(yīng)增強(qiáng)了UALink的生態(tài)競爭力，但也增加了技術(shù)整合的復(fù)雜性，需要聯(lián)盟在標(biāo)準(zhǔn)制定和產(chǎn)品開發(fā)中保持高效協(xié)作。

小結(jié)

UALink 1.0規(guī)范的發(fā)布是AI產(chǎn)業(yè)競爭格局演變的象征。作為一個開放標(biāo)準(zhǔn)，UALink通過高速、低延遲和低成本的互連技術(shù)，為AMD、Intel、Google等公司挑戰(zhàn)英偉達(dá)的AI統(tǒng)治提供了關(guān)鍵武器。

協(xié)議棧的優(yōu)化設(shè)計、可擴(kuò)展性和安全性為構(gòu)建下一代AI計算Pod奠定了基礎(chǔ)，同時與Ultra Ethernet的協(xié)同潛力進(jìn)一步增強(qiáng)了其市場前景。聯(lián)盟需要在軟件生態(tài)、產(chǎn)品落地和市場推廣上持續(xù)發(fā)力，尤其是在2026年的關(guān)鍵時間窗口內(nèi)證明其價值。

從更廣義的角度看，UALink的出現(xiàn)反映了AI產(chǎn)業(yè)對開放性和多樣化的需求，AI訓(xùn)練和推理需求的持續(xù)增長，UALink與NVLink的競爭會立即打響。

原文標(biāo)題 : UALink規(guī)范發(fā)布：挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始