訂閱
糾錯(cuò)
加入自媒體

黃氏定律再次生效,AI算力版圖正越來(lái)越大

相比售賣顯卡,英偉達(dá)(NVIDIA)著力點(diǎn)毫無(wú)疑問是AI算力。

1965年,得力于對(duì)行業(yè)的洞察,戈登·摩爾提出經(jīng)典的摩爾定律,集成電路飛速發(fā)展,人類在信息時(shí)代中飛速發(fā)展,隨后誕生了互聯(lián)網(wǎng)浪潮,間接催生了微軟、蘋果、亞馬遜、阿里巴巴、百度等科技公司,也加速了IBM、甲骨文等老牌科技公司的轉(zhuǎn)型。

千禧年后,學(xué)界進(jìn)入“算力解放”世代,集成電路的智慧結(jié)晶“CPU”算力無(wú)法完全滿足學(xué)者需要,人工智能算法對(duì)算力的支持更強(qiáng)勁、更多元,隨后英偉達(dá)在2006年推出Tesla架構(gòu),借助CUDA系列編程環(huán)境,開啟了AI算力次世代,黃氏定律持續(xù)發(fā)揮作用。

在12月15日開始的2020 GTC中國(guó)大會(huì)上,英偉達(dá)帶著2020新品NVIDIA A100,繼續(xù)詮釋著“加速計(jì)算”的定位。

AI算力與商業(yè)世界的未來(lái)

主導(dǎo)未來(lái)科技發(fā)展的關(guān)鍵已經(jīng)落在人工智能,場(chǎng)景、數(shù)據(jù)、模型、算力缺一不可。

根據(jù)OpenAI數(shù)據(jù),自2012年以來(lái),AI訓(xùn)練任務(wù)使用的算力呈指數(shù)級(jí)增長(zhǎng),每3.5個(gè)月翻一倍?萍脊菊粩噙\(yùn)用AI算法與新商業(yè)模式,推動(dòng)AI能力滲透?jìng)(gè)人消費(fèi)市場(chǎng),底層代表則是算力服務(wù)者英偉達(dá)。

在2020 GTC中國(guó)上,英偉達(dá)展示了阿里巴巴淘寶在使用NVIDIA GPU計(jì)算平臺(tái)下為直播和AI推薦提供加速服務(wù);快手也利用GPU超分辨率處理技術(shù),將視頻分辨率提升至720p或1080p;英偉達(dá)與京東物流基于Jetson平臺(tái)打造的智能機(jī)器。

在廣袤的新能源汽車領(lǐng)域,芯片市場(chǎng)更是大有可為。僅在中國(guó)市場(chǎng),中國(guó)汽車工程學(xué)會(huì)副秘書長(zhǎng)葉盛基就預(yù)測(cè)2020年中國(guó)將銷售130萬(wàn)輛新能源汽車,其背后涉足的是182.5億美元的AI芯片市場(chǎng)。

相比消費(fèi)級(jí)市場(chǎng),投資者也將目光轉(zhuǎn)向更具成長(zhǎng)力、前景更好、更注重運(yùn)用AI技術(shù)的公司身上,其中汽車、大健康與基礎(chǔ)元件是最受關(guān)注的領(lǐng)域。2012-2017年間,中國(guó)AI私募投資頻數(shù)以68%的復(fù)合增長(zhǎng)率快速增長(zhǎng),其中視覺類、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、語(yǔ)音等技術(shù)應(yīng)用為企業(yè)首選。

盡管在2020年行業(yè)周期變化下,一級(jí)市場(chǎng)投資頻數(shù)有所下降,但明顯單筆投資金額在加大,一級(jí)市場(chǎng)的投資窗口期即將結(jié)束,同時(shí)AI商業(yè)應(yīng)用落地更多,企業(yè)對(duì)AI算力的需求也更加渴望。

這一現(xiàn)象同樣體現(xiàn)在二級(jí)市場(chǎng),根據(jù)億歐智庫(kù)數(shù)據(jù),截至2020年4月,共有91家從事人工智能技術(shù)開發(fā)與應(yīng)用的中國(guó)企業(yè)完成上市。

持續(xù)成長(zhǎng)的中國(guó)AI市場(chǎng),讓英偉達(dá)看到比顯卡更大的商業(yè)機(jī)會(huì)。

黃氏定律再次生效

在12月15日的GTC大會(huì)上,億歐受邀參與了主論壇報(bào)道與中國(guó)區(qū)媒體溝通會(huì)。主論壇上,英偉達(dá)首席科學(xué)家Bill Dally圍繞新架構(gòu)產(chǎn)品A100,分享了AI推理、光追技術(shù)、集群加速以及各個(gè)落地產(chǎn)業(yè)的最新支持與應(yīng)用。

作為世界上最大7nm芯片,GPU A100基于Ampere架構(gòu),利用第三代Tensor Core,A100增加了對(duì)TF32的支持,可以獲得156 TeraFLOPS(萬(wàn)億次浮點(diǎn)運(yùn)算每秒)性能,同時(shí)MIG技術(shù)可以將A100分解為7個(gè)獨(dú)立GPU,而A100本身也支持第三代NVLink與NVSwitch,以集群形式產(chǎn)生更大算力。

英偉達(dá)中國(guó)工程和解決方案高級(jí)總監(jiān)賴俊杰表示,TF 32是介于FP 16與FP 32之間的中間態(tài),滿足研發(fā)人員與工程師在計(jì)算精度與速度的折中,一方面它有足夠的動(dòng)態(tài)范圍與精度,保證網(wǎng)絡(luò)在訓(xùn)練時(shí)沒有任何精度損失,另一方面,利用Tensor Core架構(gòu)提升神經(jīng)網(wǎng)絡(luò)計(jì)算性能。

圍繞這款新品,Bill Dally也提到,根據(jù)研究,大多數(shù)神經(jīng)網(wǎng)絡(luò)是可以修剪的,在切斷神經(jīng)元之間70%到90%連接后,精度并不發(fā)生太大變化。

借助結(jié)構(gòu)稀疏,Ampere在神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中允許4個(gè)權(quán)重中的兩個(gè)為0,而在矩陣乘法中,一旦權(quán)重達(dá)成2/4模式,就能額外獲得雙倍性能提升,賴俊杰也表示,在實(shí)測(cè)中,神經(jīng)網(wǎng)絡(luò)計(jì)算效果也能獲得1.5倍性能提升。

億歐:英偉達(dá)GPU算力持續(xù)大幅提升/英偉達(dá)

英偉達(dá)GPU算力持續(xù)大幅提升/英偉達(dá)

借助架構(gòu)優(yōu)勢(shì),英偉達(dá)集群高性能算力也表現(xiàn)突出。在11月超算TOP 500中,前十名中有8位采用了英偉達(dá)技術(shù),英偉達(dá)Selene在TOP 500和Green 500中都名列第五,而中美歐的頂級(jí)超算中都采用了英偉達(dá)的技術(shù)。

Bill Dally認(rèn)為,黃氏定律揭示了推理性能持續(xù)提升的秘密。

從28nm的Kepler、16nm到7nm的Ampere架構(gòu),英偉達(dá)持續(xù)對(duì)Tensor Core改進(jìn),不斷優(yōu)化電路設(shè)計(jì)與架構(gòu),拋棄傳統(tǒng)集成電路對(duì)制程的依賴。在Bill Dally展示中,Ampere架構(gòu)下數(shù)據(jù)中心的推理能力遠(yuǎn)高于競(jìng)爭(zhēng)對(duì)手Intel以及Xilinx,邊緣推理更是遠(yuǎn)超競(jìng)爭(zhēng)對(duì)手。

v2-39982bcd3de937cde223d706c32e2880_1440w.jpg.jpg

v2-06f9713315e4d5cbeed0bb3dcf8b29af_1440w.jpg.jpg

RTXDI效果對(duì)比圖/英偉達(dá)

在光追技術(shù)展示中,英偉達(dá)展示了直接照明技術(shù)RTXDI。利用這項(xiàng)技術(shù),圖形界面上每個(gè)光源都會(huì)將光線投射到相鄰表面上,其支持?jǐn)?shù)百萬(wàn)個(gè)光線,光線在物體表面會(huì)發(fā)生多次反射再回到眼睛,借助這項(xiàng)技術(shù),光線效果將更加逼真。

此外,Bill Dally還帶來(lái)了DLSS(深度學(xué)習(xí)超級(jí)采樣)2.0版本,相比1.0版本,2.0支持圖像更加精確升級(jí),圖像升級(jí)后將與更高分辨率實(shí)際渲染的數(shù)據(jù)比較,其中誤差部分會(huì)進(jìn)入DGX SuperPODs訓(xùn)練神經(jīng)網(wǎng)絡(luò)loss函數(shù),經(jīng)過(guò)數(shù)據(jù)集的特定迭代,準(zhǔn)確展示升級(jí)后的圖像。

這一技術(shù)也被用到視頻的升級(jí),利用神經(jīng)網(wǎng)絡(luò),游戲畫面可以顯著提升動(dòng)態(tài)幀率,同時(shí)電影在特效制作中也能基于物理性質(zhì)實(shí)現(xiàn)路徑追蹤,鏡面反射、折射與再折射都可以得到多光線采樣。

相比GPU產(chǎn)品性能展示,英偉達(dá)此次也更加強(qiáng)調(diào)集群計(jì)算的支持。

Bill Dally在會(huì)上展示了英偉達(dá)MAGNet工具AI推理加速器模擬結(jié)果,其推理能力可以達(dá)到每瓦100 teraops,眾所周知,運(yùn)算中數(shù)據(jù)傳輸帶來(lái)的能量損耗最大,MAGNet通過(guò)協(xié)調(diào)并控制信息流,最大限度減少數(shù)據(jù)傳輸來(lái)達(dá)到節(jié)能效果。

億歐:傳統(tǒng)電氣鏈路與設(shè)計(jì)的光鏈路DGX/英偉達(dá)

傳統(tǒng)電氣鏈路與設(shè)計(jì)的光鏈路DGX/英偉達(dá)

此外Bill Dally也與技術(shù)團(tuán)隊(duì)研究光鏈路取代電氣鏈路的新技術(shù),采用“密集波分復(fù)用”技術(shù),就有可能在1毫米大小的芯片實(shí)現(xiàn)Tb/s級(jí)傳輸,將是現(xiàn)在互連密度的10倍以上。

借助這一吞吐量和NVSwitch技術(shù),Bill Dally和英偉達(dá)計(jì)劃未來(lái)開發(fā)出依托光鏈路、搭載9排共160個(gè)GPU的DGX,這將大幅提升數(shù)據(jù)中心算力。

在軟件方面,全新編程系統(tǒng)原型Legate可以運(yùn)行針對(duì)單一GPU編寫的程序,其適用于Jetson Nano、A100以及超算,但目前Legate還無(wú)法對(duì)大量GPU進(jìn)行理想的并行處理,Bill Dally與技術(shù)團(tuán)隊(duì)仍在優(yōu)化。

英偉達(dá)與中國(guó)公司的“!迸c“機(jī)”

在媒體溝通會(huì)上,英偉達(dá)GPU計(jì)算專家團(tuán)隊(duì)亞太區(qū)總監(jiān)李曦鵬,強(qiáng)調(diào)英偉達(dá)25年來(lái)持續(xù)在進(jìn)行“加速計(jì)算”。消費(fèi)級(jí)市場(chǎng)對(duì)英偉達(dá)一直是“顯卡廠商”定位,但從AI算力進(jìn)入主流產(chǎn)學(xué)界后,加速計(jì)算這一定位開始充分體現(xiàn)。

億歐:NVIDIA數(shù)據(jù)中心平臺(tái)/英偉達(dá)

NVIDIA數(shù)據(jù)中心平臺(tái)/英偉達(dá)

除了顯卡產(chǎn)品與新技術(shù)外,英偉達(dá)在大會(huì)上用了更多筆墨展示其在數(shù)據(jù)中心以及產(chǎn)業(yè)端的支持,包括第三代的NVLink和NVSwitch等技術(shù)的展望,其中還包括對(duì)中小企業(yè)、創(chuàng)業(yè)公司乃至傳統(tǒng)公司的支持。

例如圍繞軟件支持,李曦鵬提到,借助CUDA統(tǒng)一架構(gòu),英偉達(dá)保證了新的應(yīng)用能持續(xù)滿足市場(chǎng)需求,做到了算法、軟件、硬件的相互配合,在本代Ampere架構(gòu)下,TensorFlow有了專門的配套,TensorRT也提供更好的矩陣乘法支撐,甚至還有加速SDK,同時(shí)英偉達(dá)也積極投身到應(yīng)用的開發(fā)上,滿足更多企業(yè)或機(jī)構(gòu)“開箱即用”,進(jìn)一步服務(wù)更多B端。

企業(yè)端的表現(xiàn)吸引了眾多中國(guó)公司參與,包括阿里巴巴、字節(jié)跳動(dòng)、中國(guó)電信、浪潮、快手等,中國(guó)的OEM廠商、云廠商、互聯(lián)網(wǎng)企業(yè)都在利用英偉達(dá)相關(guān)產(chǎn)品與技術(shù)進(jìn)行開發(fā)。

英偉達(dá)醫(yī)療業(yè)務(wù)全球副總裁Kimberly Powell,在15日主論壇圓桌環(huán)節(jié)提到,中國(guó)平安、聯(lián)影智能、推想科技和數(shù)坤科技在新冠疫情期間,利用英偉達(dá)GPU產(chǎn)品與技術(shù),加快了影像診斷,為影像診斷提供巨大幫助。

英偉達(dá)亞太區(qū)戰(zhàn)略運(yùn)營(yíng)與合作伙伴副總裁Ashok Pandey,在圓桌中直接用中文表示,英偉達(dá)與中國(guó)云服務(wù)廠商合作已7年,目前頂級(jí)的中國(guó)云服務(wù)商已經(jīng)推出或即將推出基于A100的新產(chǎn)品,更多AI應(yīng)用也將面向更多云服務(wù)開發(fā)者和使用者。

同時(shí)在超算中大放異彩的ARM也將在中國(guó)的云、數(shù)據(jù)中心、邊緣計(jì)算場(chǎng)景市場(chǎng)中出現(xiàn),英偉達(dá)宣稱,未來(lái)ARM的開放度不會(huì)受到貿(mào)易管制影響。

英偉達(dá)工程與解決方案高級(jí)總監(jiān)李浩南表示,GPU加速的ARM服務(wù)器正在各個(gè)場(chǎng)景中夯實(shí),目前在HPC、AI以及游戲中已有表現(xiàn),更多中國(guó)公司將加入到ARM陣營(yíng)。

億歐:2013-2020英偉達(dá)投資布局版圖/億歐商業(yè)分析師趙寧

2013-2020英偉達(dá)投資布局版圖/億歐商業(yè)分析師趙寧

除了產(chǎn)品與技術(shù)市場(chǎng)的合作外,英偉達(dá)過(guò)去在全球范圍內(nèi)布局了眾多AI初創(chuàng)公司,本次大會(huì)上,12家中國(guó)初創(chuàng)公司得到了英偉達(dá)幫助。

在本次GTC大會(huì)上,100家初創(chuàng)公司通過(guò)“英偉達(dá)初創(chuàng)加速計(jì)劃”,在40家投資機(jī)構(gòu)及產(chǎn)業(yè)代表投票中,12家企業(yè)參與了線上展示,涉及領(lǐng)域包括醫(yī)療、零售、消費(fèi)互聯(lián)網(wǎng)、深度學(xué)習(xí)、IoT、工業(yè)制造等領(lǐng)域。

相比過(guò)去,英偉達(dá)對(duì)于中國(guó)市場(chǎng)的重視程度不斷加強(qiáng)。中國(guó)是全球AI算力最富集的地區(qū)之一,大量AI與數(shù)字化公司需要更多算力支持,同時(shí)中國(guó)也是自動(dòng)駕駛成長(zhǎng)最快的市場(chǎng),以百度Apollo、地平線、馭勢(shì)科技、四維圖新等為代表,AI芯片必將是核心需要。

另一方面,目前中國(guó)市場(chǎng)占到英偉達(dá)收入一半左右,通過(guò)在ARM、Mellanox的布局,英偉達(dá)有了更強(qiáng)的數(shù)據(jù)中心建設(shè)能力,但同時(shí)也讓中國(guó)客戶不得不購(gòu)買英偉達(dá)的產(chǎn)品。

超算采購(gòu)已經(jīng)成為英偉達(dá)核心收入之一,通過(guò)外延并購(gòu),其完成了對(duì)超算產(chǎn)品的嚴(yán)密布局,中國(guó)公司進(jìn)入的門檻被大大提高。

換句話說(shuō),在服務(wù)器與底層技術(shù)上,中國(guó)公司與海外巨頭的競(jìng)爭(zhēng)差距被資本拉大,知名的OEM廠商看似在生產(chǎn)高附加值的服務(wù)器,但仍處于利潤(rùn)的微笑曲線底部。

面對(duì)英偉達(dá)的橄欖枝,中國(guó)公司與市場(chǎng)充滿了機(jī)遇與挑戰(zhàn),下游企業(yè)可以充分享受產(chǎn)品技術(shù)、乃至生態(tài)紅利;英偉達(dá)、AMD、英特爾等半導(dǎo)體巨頭仍占有巨大優(yōu)勢(shì)。

這對(duì)國(guó)產(chǎn)自研的刺激并不低,寒武紀(jì)為代表的中國(guó)上市公司會(huì)越來(lái)越多,從另一個(gè)角度而言,這也不失為另一種機(jī)會(huì)。

參考資料:

《WIA2020 | 2020全球半導(dǎo)體芯片科技創(chuàng)新TOP50》,億歐智庫(kù),何少佳,2020年12月9日

《2020年中國(guó)人工智能商業(yè)落地研究報(bào)告》,億歐智庫(kù),張一豪,2020年7月10日

作者:黃志磊    

聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問題的,請(qǐng)聯(lián)系我們。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)