訂閱
糾錯(cuò)
加入自媒體

人工智能急需變革?互聯(lián)網(wǎng)企業(yè)比英特爾更想蹚這一池芯片水

新年剛過,人工智能界先后有兩次理論上的新知公諸于世:一是圖靈獎(jiǎng)獲得者David Patterson與John Hennessy發(fā)布論文稱計(jì)算機(jī)體系結(jié)構(gòu)的新黃金時(shí)代將到來,二是計(jì)算機(jī)視覺奠基者之一Alan Yuille公開懟了一波深度學(xué)習(xí),他認(rèn)為神經(jīng)網(wǎng)絡(luò)已進(jìn)入瓶頸期,現(xiàn)在科研人員一股腦兒涌入深度學(xué)習(xí)不利于軟件算法的發(fā)展。

透過兩則消息,不難察覺到人工智能產(chǎn)業(yè)急需變革的呼聲已經(jīng)十分強(qiáng)烈,無論是硬件端還是軟件算法,而它確實(shí)要迎來了新的發(fā)展階段。事實(shí)上,隨著市場需求變化和技術(shù)迭代,一直以來軟件算法和硬件芯片雖各自發(fā)展卻也如兩股互相“博弈”的力量般糾纏不休。而當(dāng)深度學(xué)習(xí)發(fā)展步入模式時(shí),一邊是專家對(duì)創(chuàng)新衰退的憂慮,另一邊則預(yù)示著深度學(xué)習(xí)架構(gòu)的發(fā)展已經(jīng)邁入一定的成熟階段,此時(shí)將部分功能下沉到硬件端的需求則順勢(shì)衍生。

圖 |《計(jì)算機(jī)體系結(jié)構(gòu)的新黃金時(shí)代》

在《計(jì)算機(jī)體系結(jié)構(gòu)的新黃金時(shí)代》中,Patterson和Hennessy這樣寫道,“計(jì)算機(jī)體系結(jié)構(gòu)領(lǐng)域?qū)⒂瓉碛忠粋(gè)黃金十年,就像20世紀(jì)80年代我們做研究那時(shí)一樣,新的架構(gòu)設(shè)計(jì)將會(huì)帶來更低的成本,更優(yōu)的能耗、安全和性能。”如所言,在深度學(xué)習(xí)算法熱潮過后,2019年的硬件產(chǎn)業(yè)也開始了新的蠢蠢欲動(dòng),而在AI賦能應(yīng)用的大背景下,它具體表現(xiàn)為推理芯片市場的崛起。

英特爾沉不住氣了,推理芯片市場開啟群雄爭霸

回到2019年年初前后這一期間,迎來了歷史轉(zhuǎn)型期的芯片市場可以說動(dòng)蕩不安,一邊存儲(chǔ)芯片價(jià)格在漲一波跌一波的云雨之中起伏;另一邊為了滿足人工智能催生的產(chǎn)能需求,英特爾、美光等老牌IDM廠商開始大肆興建起工廠。而不同于已有的成熟市場,有一部分新興的AI芯片市場也逐漸有了蓬勃生長的態(tài)勢(shì),產(chǎn)業(yè)化發(fā)展向好。

“苗頭”就出現(xiàn)在CES 2019上,英特爾高調(diào)宣布與Facebook合作開發(fā)一款A(yù)I推理芯片,并宣稱將于2019年下半年完成。

在曝光度極高的CES上,提前半年大肆宣傳并隆重預(yù)告這一款公眾并不熟知的推理芯片,作為x86架構(gòu)締造者,占據(jù)數(shù)據(jù)中心服務(wù)器市場90%份額的英特爾,顯然有些沉不住氣了。

圖 | 英特爾宣布與Facebook合作推出推理芯片

無獨(dú)有偶,在研發(fā)推理芯片這件事情上,各家有能力爭一塊蛋糕的廠商也都開始摩拳擦掌,不出意外得集中在2019年前后幾個(gè)月推出自家產(chǎn)品。2018年9月,英偉達(dá)推出自己的推理預(yù)測(cè)芯片;11月,亞馬遜召開re:Invent大會(huì),在會(huì)議上隆重發(fā)布了一款專用推理芯片AWS Inferentia,以用于自己的服務(wù)器推理任務(wù)處理;而阿里也透露了自己首款推理芯片Ali-NPU的發(fā)布時(shí)間,同F(xiàn)acebook相近,定在了2019年中。

在2019年前后巨頭們不約而同得帶起了一波“節(jié)奏”,這樣的集群效應(yīng)或多或少說明了專用推理芯片系統(tǒng)市場已經(jīng)開始要“變天”。

數(shù)據(jù)統(tǒng)計(jì)顯示,到2021年,訓(xùn)練市場規(guī)模將增長到82億美元,而推理市場規(guī)模將達(dá)到118億美元,超出前者近四十億美元。時(shí)間緊迫,機(jī)會(huì)轉(zhuǎn)瞬即逝,在沒有巨頭的大片“藍(lán)!笔袌雒媲,換作誰都是要坐不住的。

一場由互聯(lián)網(wǎng)企業(yè)引發(fā)的芯片之戰(zhàn)

既知是藍(lán)海,早些年亦有許多科研院所在積極研究,巨頭們卻都到今年才遲遲動(dòng)手,是為何?

Facebook公開道出了其中的緣由。

去年四月份,F(xiàn)acebook暗地里組建芯片團(tuán)隊(duì)的事情被彭博社報(bào)道,稱它想擺脫對(duì)英特爾和高通的依賴,隨后成為熱議的焦點(diǎn)。后沒有多久,在一年一度的大會(huì)上,F(xiàn)acebook的高管大大方方承認(rèn)了。

作為一家互聯(lián)網(wǎng)公司,F(xiàn)acebook坦言它的初衷不是為造芯片而造芯片,實(shí)則是深受成本成倍增加之苦但同時(shí)又尋不到更優(yōu)硬件方案,無奈使然。2018年末的大會(huì)上,對(duì)于這一點(diǎn),F(xiàn)acebook高管Jason Taylor就直接毫不留情的懟了當(dāng)時(shí)市面上的推理芯片:“市面上是有很多加速器芯片,但是我們發(fā)現(xiàn)他們?cè)O(shè)計(jì)的芯片在完成關(guān)鍵工作負(fù)載任務(wù)的能力上,值得考量!

言下之意,Taylor認(rèn)為很多公司在沒有弄清楚深度學(xué)習(xí)應(yīng)用端需要處理的推理任務(wù)有哪些就開始造芯片,頗有亂打亂撞的嫌疑。而在深度學(xué)習(xí)算法的應(yīng)用上,以精準(zhǔn)營銷著長的Facebook似乎也更有發(fā)言權(quán)。

圖 | 精準(zhǔn)營銷

據(jù)公司工程師Kim Hazelwood介紹,每天Facebook的AI應(yīng)用程序產(chǎn)生超過200萬億個(gè)推送,翻譯超過50億個(gè)文本,并自動(dòng)刪除超過一百萬個(gè)假賬戶,在推理功能上,F(xiàn)acebook的任務(wù)計(jì)算量是其他任務(wù)的100倍。官方透露的數(shù)據(jù)顯示,2018年,F(xiàn)acebook的資本支出大約在140億美元,2019年,這個(gè)數(shù)字預(yù)計(jì)將增長到200億美元,其中很大一部分支出都在數(shù)據(jù)中心服務(wù)器上。

但苦于沒有合適替代方案,今天Facebook還不得不采用“CPU+GPU”的服務(wù)器。

和Facebook類似,最接近應(yīng)用,需求也是最為強(qiáng)烈,因而谷歌、亞馬遜、阿里等將人工智能與互聯(lián)網(wǎng)應(yīng)用融合密切的企業(yè)都不可避免的遇到了這個(gè)問題,因而也陸續(xù)開啟了自研芯片之路。

不可不知的“鼻祖”

在這組互聯(lián)網(wǎng)梯隊(duì)中,谷歌是第一位吃螃蟹的“人”,同時(shí)它用這個(gè)秘密武器助力AlphaGo戰(zhàn)勝李世石,引起轟動(dòng)。而這里的秘密武器就是谷歌TPU(張量處理單元)。

圖 | 谷歌TPU

其實(shí)2017年,當(dāng)谷歌重磅推出TPU時(shí),很多人都好奇作為一家成功的互聯(lián)網(wǎng)公司,谷歌怎么突然有興趣做起了芯片,還做出了這樣一款“腦洞大開”的芯片?

在后來的公開論文中,谷歌提到其實(shí)自己的軟件服務(wù)背后需要龐大的服務(wù)器網(wǎng)絡(luò)在支持,即需要難以計(jì)數(shù)的硬件服務(wù)器日夜運(yùn)行。提供的數(shù)據(jù)顯示,為了支持各類大量的數(shù)據(jù)應(yīng)用,谷歌當(dāng)時(shí)已經(jīng)在全球四個(gè)洲建有15個(gè)倉庫般大小的數(shù)據(jù)中心。

但是隨著深度學(xué)習(xí)算法的出現(xiàn),令谷歌自己驚奇的事情發(fā)生了。在后來計(jì)算機(jī)架構(gòu)專家David Patterson和Norm Jouppi合著的論文中,他們提到這樣一個(gè)細(xì)節(jié):六年前,谷歌開始為安卓操作系統(tǒng)添加語音識(shí)別功能之后,原來相對(duì)充裕的計(jì)算能力突然間捉襟見肘,根據(jù)當(dāng)時(shí)谷歌工程師的推算——如果世界上每一臺(tái)安卓手機(jī)每天都使用3分鐘的語音搜索功能,且識(shí)別率百分之百正確,即一次搜索成功,那么谷歌的數(shù)據(jù)中心的規(guī)模就起碼要翻倍。

這樣的解釋,與Facebook后提到的境況幾近相同。

意識(shí)到這樣的問題,谷歌為這樣的大規(guī)模擴(kuò)張需求而背后生寒,更何況當(dāng)時(shí)還只是深度學(xué)習(xí)算法應(yīng)用剛剛開始的階段。因此在慎重考慮了語音識(shí)別技術(shù)的迅速發(fā)展和推理運(yùn)算需求的激增等情況之后,谷歌決定開發(fā)專屬推理芯片以替代性能不足的CPU,即后來的TPU。

不過當(dāng)時(shí)外界只知谷歌街景、AlphaGo等應(yīng)用中用到了TPU,對(duì)于“蒙上一層面紗”的TPU到底為何物,眾說紛紜。后來直到看見谷歌公開發(fā)表的TPU論文并眼見AlphaGo的成功,眾人才意識(shí)到谷歌TPU劃時(shí)代的意義。

寒武紀(jì)陳天石毫不吝嗇得用了“濃墨重彩”一詞盛贊其對(duì)于整個(gè)產(chǎn)業(yè)發(fā)展的意義;而英偉達(dá)黃仁勛也不惜親自撰寫長文來回應(yīng)谷歌TPU與自己產(chǎn)品的對(duì)比,雖然言語之中難掩對(duì)英偉達(dá)技術(shù)的偏袒,但也只有勢(shì)均力敵的對(duì)手值得“老黃”如此重視。

后來Jouppi在一篇論文中這樣評(píng)價(jià)這款芯片,“這并不意味著TPU有多復(fù)雜,它看起來更像雷達(dá)的信號(hào)處理引擎,而不是標(biāo)準(zhǔn)X86架構(gòu)。而且它與浮點(diǎn)單元協(xié)處理器更為神似,跟GPU倒不太一樣!

所謂創(chuàng)新,大概如此。

1  2  下一頁>  
聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問題的,請(qǐng)聯(lián)系我們。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)