AI計算的未來,GPU上岸,IPU崛起
前言:
AI近些年的大火,直接促進了CPU和GPU的發(fā)展,而英偉達的GPU真正借此迅速成為AI市場的主流產(chǎn)品之一,其勢頭甚至蓋過了CPU。
而AI應用需要專門的處理器,而IPU正是這樣的處理器。目前,AI在各行各業(yè)均得到廣泛應用,IPU可以基于自身優(yōu)勢為世界的智能化進程增添不竭動力。
英偉達專注的GPU優(yōu)勢逐漸縮小
從專注圖像渲染崛起的英偉達的GPU,走的也是相當于ASIC的技術路線,但隨著游戲、視頻渲染以及AI加速需要的出現(xiàn),英偉達的GPU也在向著GPGPU的方向演進。
當硬件更多的需要與軟件生態(tài)掛鉤時,市場大多數(shù)參與者便會倒下。在競爭清理過后,GPU形成了如今的雙寡頭市場,并且步入相當成熟的階段。
ASIC本身的成本、靈活性缺失,以及應用范圍很窄的特點,都導致它無法采用最先進制程: 即便它們具備性能和能效優(yōu)勢,一旦無法采用最先進制程,則這一優(yōu)勢也將不再明顯!
為保持其在GPU領域的寡頭地位,使得英偉達必須一直保持先進的制程工藝,保持其通用性,但是要犧牲一定的效能優(yōu)勢。
相比于來自類GPU的競爭,英偉達不應該忽視Graphcore的IPU,特別是Graphcore一直都在強調(diào)其是為AI而生,面向的應用也是CPU、GPU不那么擅長的AI應用。
利用AI計算打側面競爭戰(zhàn)
不管CPU還是GPU都無法從根本上解決AI問題,因為AI是一個面向計算圖的任務、與CPU的標量計算和GPU的矢量計算區(qū)別很大。
而另一邊的IPU,則為AI計算提供了全新的技術架構,同時將訓練和推理合二為一,兼具處理二者工作的能力。
作為標準的神經(jīng)網(wǎng)絡處理芯片,IPU可以支持多種神經(jīng)網(wǎng)絡模型,因其具備數(shù)以千計到數(shù)百萬計的頂點數(shù)量,遠遠超過GPU的頂點規(guī)模,可以進行更高潛力的并行計算工作。
計算加上數(shù)據(jù)的突破可以讓IPU在原生稀疏計算中展現(xiàn)出領先IPU 10-50倍的性能優(yōu)勢,到了數(shù)據(jù)稀疏以及動態(tài)稀疏時,IPU就有了比GPU越來越顯著的優(yōu)勢。
此外,如果是在IPU更擅長的分組卷積內(nèi)核中,組維度越少,IPU的性能優(yōu)勢越明顯,總體而言,有4-100倍的吞吐量提升。
在5G網(wǎng)絡切片和資源管理中需要用到的強化學習,用IPU訓練吞吐量也能夠提升最多13倍。
兩種芯片勢能英偉達與Graphcore的較量
Graphcore成立于2016年,是一家專注于機器智能、同時也代表著全新計算負載的芯片制造公司,其包括IPU在內(nèi)的產(chǎn)品研發(fā)擅長大規(guī)模并行計算、稀疏的數(shù)據(jù)結構、低精度計算、數(shù)據(jù)參數(shù)復用以及靜態(tài)圖結構。
英偉達的潛在競爭對手Graphcore的第二代IPU在多個主流模型上的表現(xiàn)優(yōu)于A100 GPU,兩者將在超大規(guī)模數(shù)據(jù)中心正面競爭。
未來,IPU可能在一些新興的AI應用中展現(xiàn)出更大的優(yōu)勢。
第二代IPU相比第一代IPU有兩倍峰值算力的提升,在典型的CV還有NLP的模型中,第二代IPU相比第一代IPU則展現(xiàn)出了平均8倍的性能提升。
如果對比英偉達基于8個最新A100 GPU的DGX-A100,Graphcore 8個M2000組成的系統(tǒng)的FP32算力是DGX-A100的12倍,AI計算是3倍,AI存儲是10倍。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語權
- 3 深度報告|中國AI產(chǎn)業(yè)正在崛起成全球力量,市場潛力和關鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級獨角獸:獲上市公司戰(zhàn)投,干人形機器人
- 5 國家數(shù)據(jù)局局長劉烈宏調(diào)研格創(chuàng)東智
- 6 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 7 百億AI芯片訂單,瘋狂傾銷中東?
- 8 Robotaxi新消息密集釋放,量產(chǎn)元年誰在領跑?
- 9 格斗大賽出圈!人形機器人致命短板曝光:頭腦過于簡單
- 10 “搶灘”家用機器人領域,聯(lián)通、海爾、美的等紛紛入局