黃氏定律再次生效,AI算力版圖正越來(lái)越大
相比售賣顯卡,英偉達(dá)(NVIDIA)著力點(diǎn)毫無(wú)疑問是AI算力。
1965年,得力于對(duì)行業(yè)的洞察,戈登·摩爾提出經(jīng)典的摩爾定律,集成電路飛速發(fā)展,人類在信息時(shí)代中飛速發(fā)展,隨后誕生了互聯(lián)網(wǎng)浪潮,間接催生了微軟、蘋果、亞馬遜、阿里巴巴、百度等科技公司,也加速了IBM、甲骨文等老牌科技公司的轉(zhuǎn)型。
千禧年后,學(xué)界進(jìn)入“算力解放”世代,集成電路的智慧結(jié)晶“CPU”算力無(wú)法完全滿足學(xué)者需要,人工智能算法對(duì)算力的支持更強(qiáng)勁、更多元,隨后英偉達(dá)在2006年推出Tesla架構(gòu),借助CUDA系列編程環(huán)境,開啟了AI算力次世代,黃氏定律持續(xù)發(fā)揮作用。
在12月15日開始的2020 GTC中國(guó)大會(huì)上,英偉達(dá)帶著2020新品NVIDIA A100,繼續(xù)詮釋著“加速計(jì)算”的定位。
AI算力與商業(yè)世界的未來(lái)
主導(dǎo)未來(lái)科技發(fā)展的關(guān)鍵已經(jīng)落在人工智能,場(chǎng)景、數(shù)據(jù)、模型、算力缺一不可。
根據(jù)OpenAI數(shù)據(jù),自2012年以來(lái),AI訓(xùn)練任務(wù)使用的算力呈指數(shù)級(jí)增長(zhǎng),每3.5個(gè)月翻一倍?萍脊菊粩噙\(yùn)用AI算法與新商業(yè)模式,推動(dòng)AI能力滲透?jìng)(gè)人消費(fèi)市場(chǎng),底層代表則是算力服務(wù)者英偉達(dá)。
在2020 GTC中國(guó)上,英偉達(dá)展示了阿里巴巴淘寶在使用NVIDIA GPU計(jì)算平臺(tái)下為直播和AI推薦提供加速服務(wù);快手也利用GPU超分辨率處理技術(shù),將視頻分辨率提升至720p或1080p;英偉達(dá)與京東物流基于Jetson平臺(tái)打造的智能機(jī)器。
在廣袤的新能源汽車領(lǐng)域,芯片市場(chǎng)更是大有可為。僅在中國(guó)市場(chǎng),中國(guó)汽車工程學(xué)會(huì)副秘書長(zhǎng)葉盛基就預(yù)測(cè)2020年中國(guó)將銷售130萬(wàn)輛新能源汽車,其背后涉足的是182.5億美元的AI芯片市場(chǎng)。
相比消費(fèi)級(jí)市場(chǎng),投資者也將目光轉(zhuǎn)向更具成長(zhǎng)力、前景更好、更注重運(yùn)用AI技術(shù)的公司身上,其中汽車、大健康與基礎(chǔ)元件是最受關(guān)注的領(lǐng)域。2012-2017年間,中國(guó)AI私募投資頻數(shù)以68%的復(fù)合增長(zhǎng)率快速增長(zhǎng),其中視覺類、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、語(yǔ)音等技術(shù)應(yīng)用為企業(yè)首選。
盡管在2020年行業(yè)周期變化下,一級(jí)市場(chǎng)投資頻數(shù)有所下降,但明顯單筆投資金額在加大,一級(jí)市場(chǎng)的投資窗口期即將結(jié)束,同時(shí)AI商業(yè)應(yīng)用落地更多,企業(yè)對(duì)AI算力的需求也更加渴望。
這一現(xiàn)象同樣體現(xiàn)在二級(jí)市場(chǎng),根據(jù)億歐智庫(kù)數(shù)據(jù),截至2020年4月,共有91家從事人工智能技術(shù)開發(fā)與應(yīng)用的中國(guó)企業(yè)完成上市。
持續(xù)成長(zhǎng)的中國(guó)AI市場(chǎng),讓英偉達(dá)看到比顯卡更大的商業(yè)機(jī)會(huì)。
黃氏定律再次生效
在12月15日的GTC大會(huì)上,億歐受邀參與了主論壇報(bào)道與中國(guó)區(qū)媒體溝通會(huì)。主論壇上,英偉達(dá)首席科學(xué)家Bill Dally圍繞新架構(gòu)產(chǎn)品A100,分享了AI推理、光追技術(shù)、集群加速以及各個(gè)落地產(chǎn)業(yè)的最新支持與應(yīng)用。
作為世界上最大7nm芯片,GPU A100基于Ampere架構(gòu),利用第三代Tensor Core,A100增加了對(duì)TF32的支持,可以獲得156 TeraFLOPS(萬(wàn)億次浮點(diǎn)運(yùn)算每秒)性能,同時(shí)MIG技術(shù)可以將A100分解為7個(gè)獨(dú)立GPU,而A100本身也支持第三代NVLink與NVSwitch,以集群形式產(chǎn)生更大算力。
英偉達(dá)中國(guó)工程和解決方案高級(jí)總監(jiān)賴俊杰表示,TF 32是介于FP 16與FP 32之間的中間態(tài),滿足研發(fā)人員與工程師在計(jì)算精度與速度的折中,一方面它有足夠的動(dòng)態(tài)范圍與精度,保證網(wǎng)絡(luò)在訓(xùn)練時(shí)沒有任何精度損失,另一方面,利用Tensor Core架構(gòu)提升神經(jīng)網(wǎng)絡(luò)計(jì)算性能。
圍繞這款新品,Bill Dally也提到,根據(jù)研究,大多數(shù)神經(jīng)網(wǎng)絡(luò)是可以修剪的,在切斷神經(jīng)元之間70%到90%連接后,精度并不發(fā)生太大變化。
借助結(jié)構(gòu)稀疏,Ampere在神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中允許4個(gè)權(quán)重中的兩個(gè)為0,而在矩陣乘法中,一旦權(quán)重達(dá)成2/4模式,就能額外獲得雙倍性能提升,賴俊杰也表示,在實(shí)測(cè)中,神經(jīng)網(wǎng)絡(luò)計(jì)算效果也能獲得1.5倍性能提升。
英偉達(dá)GPU算力持續(xù)大幅提升/英偉達(dá)
借助架構(gòu)優(yōu)勢(shì),英偉達(dá)集群高性能算力也表現(xiàn)突出。在11月超算TOP 500中,前十名中有8位采用了英偉達(dá)技術(shù),英偉達(dá)Selene在TOP 500和Green 500中都名列第五,而中美歐的頂級(jí)超算中都采用了英偉達(dá)的技術(shù)。
Bill Dally認(rèn)為,黃氏定律揭示了推理性能持續(xù)提升的秘密。
從28nm的Kepler、16nm到7nm的Ampere架構(gòu),英偉達(dá)持續(xù)對(duì)Tensor Core改進(jìn),不斷優(yōu)化電路設(shè)計(jì)與架構(gòu),拋棄傳統(tǒng)集成電路對(duì)制程的依賴。在Bill Dally展示中,Ampere架構(gòu)下數(shù)據(jù)中心的推理能力遠(yuǎn)高于競(jìng)爭(zhēng)對(duì)手Intel以及Xilinx,邊緣推理更是遠(yuǎn)超競(jìng)爭(zhēng)對(duì)手。
RTXDI效果對(duì)比圖/英偉達(dá)
在光追技術(shù)展示中,英偉達(dá)展示了直接照明技術(shù)RTXDI。利用這項(xiàng)技術(shù),圖形界面上每個(gè)光源都會(huì)將光線投射到相鄰表面上,其支持?jǐn)?shù)百萬(wàn)個(gè)光線,光線在物體表面會(huì)發(fā)生多次反射再回到眼睛,借助這項(xiàng)技術(shù),光線效果將更加逼真。
此外,Bill Dally還帶來(lái)了DLSS(深度學(xué)習(xí)超級(jí)采樣)2.0版本,相比1.0版本,2.0支持圖像更加精確升級(jí),圖像升級(jí)后將與更高分辨率實(shí)際渲染的數(shù)據(jù)比較,其中誤差部分會(huì)進(jìn)入DGX SuperPODs訓(xùn)練神經(jīng)網(wǎng)絡(luò)loss函數(shù),經(jīng)過(guò)數(shù)據(jù)集的特定迭代,準(zhǔn)確展示升級(jí)后的圖像。
這一技術(shù)也被用到視頻的升級(jí),利用神經(jīng)網(wǎng)絡(luò),游戲畫面可以顯著提升動(dòng)態(tài)幀率,同時(shí)電影在特效制作中也能基于物理性質(zhì)實(shí)現(xiàn)路徑追蹤,鏡面反射、折射與再折射都可以得到多光線采樣。
相比GPU產(chǎn)品性能展示,英偉達(dá)此次也更加強(qiáng)調(diào)集群計(jì)算的支持。
Bill Dally在會(huì)上展示了英偉達(dá)MAGNet工具AI推理加速器模擬結(jié)果,其推理能力可以達(dá)到每瓦100 teraops,眾所周知,運(yùn)算中數(shù)據(jù)傳輸帶來(lái)的能量損耗最大,MAGNet通過(guò)協(xié)調(diào)并控制信息流,最大限度減少數(shù)據(jù)傳輸來(lái)達(dá)到節(jié)能效果。
傳統(tǒng)電氣鏈路與設(shè)計(jì)的光鏈路DGX/英偉達(dá)
此外Bill Dally也與技術(shù)團(tuán)隊(duì)研究光鏈路取代電氣鏈路的新技術(shù),采用“密集波分復(fù)用”技術(shù),就有可能在1毫米大小的芯片實(shí)現(xiàn)Tb/s級(jí)傳輸,將是現(xiàn)在互連密度的10倍以上。
借助這一吞吐量和NVSwitch技術(shù),Bill Dally和英偉達(dá)計(jì)劃未來(lái)開發(fā)出依托光鏈路、搭載9排共160個(gè)GPU的DGX,這將大幅提升數(shù)據(jù)中心算力。
在軟件方面,全新編程系統(tǒng)原型Legate可以運(yùn)行針對(duì)單一GPU編寫的程序,其適用于Jetson Nano、A100以及超算,但目前Legate還無(wú)法對(duì)大量GPU進(jìn)行理想的并行處理,Bill Dally與技術(shù)團(tuán)隊(duì)仍在優(yōu)化。
英偉達(dá)與中國(guó)公司的“!迸c“機(jī)”
在媒體溝通會(huì)上,英偉達(dá)GPU計(jì)算專家團(tuán)隊(duì)亞太區(qū)總監(jiān)李曦鵬,強(qiáng)調(diào)英偉達(dá)25年來(lái)持續(xù)在進(jìn)行“加速計(jì)算”。消費(fèi)級(jí)市場(chǎng)對(duì)英偉達(dá)一直是“顯卡廠商”定位,但從AI算力進(jìn)入主流產(chǎn)學(xué)界后,加速計(jì)算這一定位開始充分體現(xiàn)。
NVIDIA數(shù)據(jù)中心平臺(tái)/英偉達(dá)
除了顯卡產(chǎn)品與新技術(shù)外,英偉達(dá)在大會(huì)上用了更多筆墨展示其在數(shù)據(jù)中心以及產(chǎn)業(yè)端的支持,包括第三代的NVLink和NVSwitch等技術(shù)的展望,其中還包括對(duì)中小企業(yè)、創(chuàng)業(yè)公司乃至傳統(tǒng)公司的支持。
例如圍繞軟件支持,李曦鵬提到,借助CUDA統(tǒng)一架構(gòu),英偉達(dá)保證了新的應(yīng)用能持續(xù)滿足市場(chǎng)需求,做到了算法、軟件、硬件的相互配合,在本代Ampere架構(gòu)下,TensorFlow有了專門的配套,TensorRT也提供更好的矩陣乘法支撐,甚至還有加速SDK,同時(shí)英偉達(dá)也積極投身到應(yīng)用的開發(fā)上,滿足更多企業(yè)或機(jī)構(gòu)“開箱即用”,進(jìn)一步服務(wù)更多B端。
企業(yè)端的表現(xiàn)吸引了眾多中國(guó)公司參與,包括阿里巴巴、字節(jié)跳動(dòng)、中國(guó)電信、浪潮、快手等,中國(guó)的OEM廠商、云廠商、互聯(lián)網(wǎng)企業(yè)都在利用英偉達(dá)相關(guān)產(chǎn)品與技術(shù)進(jìn)行開發(fā)。
英偉達(dá)醫(yī)療業(yè)務(wù)全球副總裁Kimberly Powell,在15日主論壇圓桌環(huán)節(jié)提到,中國(guó)平安、聯(lián)影智能、推想科技和數(shù)坤科技在新冠疫情期間,利用英偉達(dá)GPU產(chǎn)品與技術(shù),加快了影像診斷,為影像診斷提供巨大幫助。
英偉達(dá)亞太區(qū)戰(zhàn)略運(yùn)營(yíng)與合作伙伴副總裁Ashok Pandey,在圓桌中直接用中文表示,英偉達(dá)與中國(guó)云服務(wù)廠商合作已7年,目前頂級(jí)的中國(guó)云服務(wù)商已經(jīng)推出或即將推出基于A100的新產(chǎn)品,更多AI應(yīng)用也將面向更多云服務(wù)開發(fā)者和使用者。
同時(shí)在超算中大放異彩的ARM也將在中國(guó)的云、數(shù)據(jù)中心、邊緣計(jì)算場(chǎng)景市場(chǎng)中出現(xiàn),英偉達(dá)宣稱,未來(lái)ARM的開放度不會(huì)受到貿(mào)易管制影響。
英偉達(dá)工程與解決方案高級(jí)總監(jiān)李浩南表示,GPU加速的ARM服務(wù)器正在各個(gè)場(chǎng)景中夯實(shí),目前在HPC、AI以及游戲中已有表現(xiàn),更多中國(guó)公司將加入到ARM陣營(yíng)。
2013-2020英偉達(dá)投資布局版圖/億歐商業(yè)分析師趙寧
除了產(chǎn)品與技術(shù)市場(chǎng)的合作外,英偉達(dá)過(guò)去在全球范圍內(nèi)布局了眾多AI初創(chuàng)公司,本次大會(huì)上,12家中國(guó)初創(chuàng)公司得到了英偉達(dá)幫助。
在本次GTC大會(huì)上,100家初創(chuàng)公司通過(guò)“英偉達(dá)初創(chuàng)加速計(jì)劃”,在40家投資機(jī)構(gòu)及產(chǎn)業(yè)代表投票中,12家企業(yè)參與了線上展示,涉及領(lǐng)域包括醫(yī)療、零售、消費(fèi)互聯(lián)網(wǎng)、深度學(xué)習(xí)、IoT、工業(yè)制造等領(lǐng)域。
相比過(guò)去,英偉達(dá)對(duì)于中國(guó)市場(chǎng)的重視程度不斷加強(qiáng)。中國(guó)是全球AI算力最富集的地區(qū)之一,大量AI與數(shù)字化公司需要更多算力支持,同時(shí)中國(guó)也是自動(dòng)駕駛成長(zhǎng)最快的市場(chǎng),以百度Apollo、地平線、馭勢(shì)科技、四維圖新等為代表,AI芯片必將是核心需要。
另一方面,目前中國(guó)市場(chǎng)占到英偉達(dá)收入一半左右,通過(guò)在ARM、Mellanox的布局,英偉達(dá)有了更強(qiáng)的數(shù)據(jù)中心建設(shè)能力,但同時(shí)也讓中國(guó)客戶不得不購(gòu)買英偉達(dá)的產(chǎn)品。
超算采購(gòu)已經(jīng)成為英偉達(dá)核心收入之一,通過(guò)外延并購(gòu),其完成了對(duì)超算產(chǎn)品的嚴(yán)密布局,中國(guó)公司進(jìn)入的門檻被大大提高。
換句話說(shuō),在服務(wù)器與底層技術(shù)上,中國(guó)公司與海外巨頭的競(jìng)爭(zhēng)差距被資本拉大,知名的OEM廠商看似在生產(chǎn)高附加值的服務(wù)器,但仍處于利潤(rùn)的微笑曲線底部。
面對(duì)英偉達(dá)的橄欖枝,中國(guó)公司與市場(chǎng)充滿了機(jī)遇與挑戰(zhàn),下游企業(yè)可以充分享受產(chǎn)品技術(shù)、乃至生態(tài)紅利;英偉達(dá)、AMD、英特爾等半導(dǎo)體巨頭仍占有巨大優(yōu)勢(shì)。
這對(duì)國(guó)產(chǎn)自研的刺激并不低,寒武紀(jì)為代表的中國(guó)上市公司會(huì)越來(lái)越多,從另一個(gè)角度而言,這也不失為另一種機(jī)會(huì)。
參考資料:
《WIA2020 | 2020全球半導(dǎo)體芯片科技創(chuàng)新TOP50》,億歐智庫(kù),何少佳,2020年12月9日
《2020年中國(guó)人工智能商業(yè)落地研究報(bào)告》,億歐智庫(kù),張一豪,2020年7月10日
作者:黃志磊

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車】汽車E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺(tái)
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來(lái)商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽(yáng)光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長(zhǎng)空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?