國(guó)產(chǎn)GPU“挑戰(zhàn)”美國(guó)禁令,創(chuàng)全球通用GPU最高算力
上個(gè)月,美國(guó)以維護(hù)國(guó)家安全為由,禁止英偉達(dá)、AMD向中國(guó)銷售AI芯片,引發(fā)市場(chǎng)熱議。但同時(shí)有專家指出,此舉給予中國(guó)廠商與相關(guān)產(chǎn)業(yè)崛起的機(jī)會(huì),如同2015年美國(guó)政府發(fā)出禁令要求英特爾停止向中國(guó)超級(jí)計(jì)算機(jī)制造商出售高端芯片,因擔(dān)心中國(guó)用于核武研究,但僅僅一年后,中國(guó)便成功研發(fā)出用于超算的自主知識(shí)產(chǎn)權(quán)的國(guó)產(chǎn)芯片。
業(yè)內(nèi)人士認(rèn)為,美國(guó)禁止AI芯片銷往中國(guó),是打擊超級(jí)計(jì)算機(jī)、高效能運(yùn)算以及AI等領(lǐng)域的措施之一,去年美國(guó)將7家超算企業(yè)及研發(fā)機(jī)構(gòu)列入“貿(mào)易黑名單”,如今又禁止英偉達(dá)、AMD向中國(guó)銷售AI芯片,未來(lái)不排除會(huì)擴(kuò)大制裁范圍。
然而,近日,非盈利性機(jī)器學(xué)習(xí)開(kāi)放組織MLCommons聯(lián)盟發(fā)布報(bào)告指出,國(guó)產(chǎn)高端GPU芯片企業(yè)——壁仞科技的AI芯片擁有出色的效率,甚至超越其中一款被美國(guó)政府限制出售的AI芯片。
有專家認(rèn)為,這是里程碑的代表,國(guó)內(nèi)廠商獲得了額外的機(jī)會(huì),因?yàn)樵S多客戶無(wú)法取得國(guó)外的芯片,而國(guó)內(nèi)廠商正在生產(chǎn)類似的產(chǎn)品。
【國(guó)產(chǎn)GPU賽道的“種子選手”】
據(jù)了解,壁仞科技創(chuàng)立于2019年,是國(guó)內(nèi)一家通用智能芯片的初創(chuàng)企業(yè),也是國(guó)產(chǎn)圖形GPU賽道的“種子選手”。截至目前,壁仞科技已完成B輪融資,總?cè)谫Y額超50億元人民幣。
今年4月,公司公布首款通用GPU芯片BR100系列,是首款面向云端AI訓(xùn)練集推理的通用GPU算力產(chǎn)品。
該系列芯片架構(gòu)完全由壁仞科技自主原創(chuàng)研發(fā),核心性能能夠直接對(duì)標(biāo)國(guó)際廠商近期發(fā)布的旗艦產(chǎn)品。消息稱,其峰值算力超過(guò)了英偉達(dá)目前在售的旗艦A100。
據(jù)了解,BR100芯片采用7nm制程、壁仞原創(chuàng)“壁立仞”芯片架構(gòu),容納近800億顆晶體管,配備超300MB片上高速SRAM,并應(yīng)用Chiplet與2.5D CoWoS封裝技術(shù),突破了大尺寸芯片制造與封裝中的光罩尺寸限制問(wèn)題,做到高良率與高性能的兼顧。
總體而言,壁仞科技BR100最大的爆點(diǎn)在于單芯片1000TFLOPs,以及這是在550W功耗約束下的算力。在發(fā)布會(huì)上,壁仞科技創(chuàng)始人、董事長(zhǎng)、CEO張文稱,中國(guó)通用GPU芯片進(jìn)入每秒1,000,000,000,0000,000次計(jì)算新時(shí)代。
BR100系列芯片將主要用于AI訓(xùn)練推理、通運(yùn)用算等場(chǎng)景,在智慧城市、云游戲、自動(dòng)駕駛等領(lǐng)域都有很大的發(fā)揮空間。
據(jù)消息稱,壁仞的CTO是華為海思出身的洪洲,當(dāng)年海思推GPU,進(jìn)展很好,但是被美國(guó)制裁了,壁仞的技術(shù)團(tuán)隊(duì)還有不少技術(shù)才俊,包括曾創(chuàng)建高通公司驍龍GPU團(tuán)隊(duì)、領(lǐng)導(dǎo)了5代Adreno GPU架構(gòu)開(kāi)發(fā)的首席架構(gòu)師焦國(guó)方,前阿里云AI基礎(chǔ)架構(gòu)負(fù)責(zé)人徐凌杰,海光前海外GPU部門副總裁張凌嵐,EDA軟件巨頭Synopsys(新思科技)前AI Lab負(fù)責(zé)人唐杉,AMD前全球副總裁、中國(guó)研發(fā)中心總經(jīng)理李新榮,英偉達(dá)前上?偨(jīng)理?xiàng)畛吹取?/p>
【BR104創(chuàng)造全球通用GPU最高算力】
近日,全球權(quán)威AI基準(zhǔn)評(píng)測(cè)MLPerf公布了最新AI基準(zhǔn)測(cè)試結(jié)果(MLPerf Inference v2.1)。壁仞科技以最新發(fā)布的通用GPU芯片BR104,拿下數(shù)據(jù)中心推理評(píng)測(cè)中自然語(yǔ)言理解(BERT模型)和圖像分類(ResNet50模型)兩類基準(zhǔn)評(píng)測(cè)“available”(可售產(chǎn)品類別)單卡性能全球第一的成績(jī),其中BR104在BERT模型下達(dá)到了英偉達(dá)A100單卡性能的1.58倍。
據(jù)了解,MLPerf由圖靈獎(jiǎng)得主大衛(wèi)·帕特森(David?Patterson)聯(lián)合谷歌、斯坦福大學(xué)、哈佛大學(xué)等共同成立,是國(guó)際上最權(quán)威、最有影響力的基準(zhǔn)測(cè)試之一。為及時(shí)跟蹤和評(píng)測(cè)迅速發(fā)展的AI計(jì)算需求與性能,MLPerf每年組織2次AI測(cè)試。其數(shù)據(jù)中心場(chǎng)景的評(píng)測(cè),綜合考察參與廠商的硬件系統(tǒng)和軟件優(yōu)化能力,而此次BR104參加的“Closed Division”(固定任務(wù))類別,則要求參評(píng)者在完全一致的模型和環(huán)境下進(jìn)行性能結(jié)果的提交,因此這一類別下的結(jié)果被認(rèn)為是全球數(shù)據(jù)中心產(chǎn)業(yè)最具參考價(jià)值的AI性能基準(zhǔn)測(cè)試結(jié)果。
與此同時(shí),在BERT模型下,BR104還拿下了4卡整機(jī)、8卡整機(jī)性能全球第一的成績(jī),算力能效比也遠(yuǎn)遠(yuǎn)領(lǐng)先于其他廠商,達(dá)到英偉達(dá)A100算力能效比的2.11倍。BERT模型是目前自然語(yǔ)言理解領(lǐng)域應(yīng)用最廣泛的模型之一,也是相關(guān)產(chǎn)業(yè)應(yīng)用中最重要的模型。
壁仞科技董事長(zhǎng)、創(chuàng)始人、CEO張文表示,ResNet50模型和BERT模型是目前產(chǎn)業(yè)客戶最重視的AI模型,此次MLPerf最新發(fā)布的評(píng)測(cè)結(jié)果,直接證明了BR100系列通用GPU芯片的落地應(yīng)用能力。目前,BR104已經(jīng)開(kāi)始了大規(guī)模的客戶送測(cè)和適配,性能更強(qiáng)大的BR100也已啟動(dòng)落地應(yīng)用,我們對(duì)BR100系列未來(lái)的應(yīng)用前景充滿信心。
【硝煙開(kāi)始彌漫】
長(zhǎng)期以來(lái),全球GPU產(chǎn)業(yè)都被英偉達(dá)和AMD等美國(guó)企業(yè)所壟斷,在美國(guó)禁令的背景下,中國(guó)在技術(shù)領(lǐng)域“自給自足”的重要性愈發(fā)凸顯。
當(dāng)下,看到機(jī)會(huì)的不止是壁仞科技,除了早先入局的寒武紀(jì)、比特大陸、燧原科技等云端芯片創(chuàng)企外,過(guò)去一年間,陸續(xù)有新玩家現(xiàn)身,大量資本也正積極地涌入這一賽道。
分析機(jī)構(gòu)CCS Insight的分析師表示,壁仞科技已經(jīng)展現(xiàn)出實(shí)力,商機(jī)已經(jīng)落在他們身上,可能會(huì)因此獲得成功。此外,有分析師認(rèn)為,要在人工智能領(lǐng)域獲得成功,不僅是生產(chǎn)芯片,還需要一套與英偉達(dá)CUDA平臺(tái)競(jìng)爭(zhēng)的完整的人工智能軟件生態(tài)系統(tǒng),而這挑戰(zhàn)難度極大。
眾所周知,英偉達(dá)的一個(gè)關(guān)鍵優(yōu)勢(shì)在于2006年發(fā)表的CUDA通用并行計(jì)算平臺(tái)和編程模型,讓GPU成為并行運(yùn)算的首選,如今已被開(kāi)發(fā)者們大量使用。
壁仞科技CTO洪洲曾表示,新的GPU板卡要無(wú)縫地支持CUDA生態(tài),這比更高的算力,更好的能效比更重要。目前階段必須保證用CUDA寫的程序能無(wú)縫運(yùn)行在壁仞科技的異構(gòu)計(jì)算開(kāi)發(fā)平臺(tái)上,不應(yīng)當(dāng)為了追求所謂的極致能效,而打破對(duì)通用編程模型的兼容性。
當(dāng)前壁仞科技的第一要?jiǎng)?wù)是在打造自有編程模型的同時(shí),兼容CUDA當(dāng)前版本,而壁仞科技的終極目標(biāo),是提供比CUDA更好的自研編程模型。
國(guó)內(nèi)云端AI芯片及GPU賽道的硝煙正開(kāi)始彌漫,入局者將越來(lái)越多。
畢竟,GPU, CPU, NPU, XPU國(guó)產(chǎn)化是這一代國(guó)人工程師的歷史使命,也是中國(guó)拿下電車,自動(dòng)駕駛,物聯(lián)網(wǎng)這些蛋糕的前置條件。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車】汽車E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開(kāi)始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺(tái)
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來(lái)商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽(yáng)光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開(kāi)成長(zhǎng)空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?