MLPerf公布首輪AI推理基準測試結果,平頭哥含光800單芯片推理性能第一
11月7日報道
北京時間11月7日,MLPerf基準聯(lián)盟公布首輪AI推理基準測試結果,阿里巴巴平頭哥的AI芯片含光800在Resnet50基準測試中獲得單芯片性能第一。
MLPerf 推理基準測試設有五個基準,每個對應四種場景,重點面向圖像分類、對象檢測和機器翻譯等常見機器學習任務。測試者可以選擇提交任何基準及相應場景的結果。
含光800參加了適用于圖像分類任務的Resnet50v1.5基準測試,在離線模式(Offline mode)、服務模式(Servermode)、多路模式(Multi stream mode)和單路模式(Single stream mode)四個場景都取得了單芯片第一的成績。
離線模式測試的是芯片推理的最大吞吐量,最能考驗芯片的計算、存儲、通信等基本功。含光800的成績?yōu)?9306.60IPS,單芯片性能是谷歌TPUv3的8.5倍、Nvidia T4的12倍。
MLPerf是業(yè)內首套衡量機器學習軟硬件性能的通用基準,由圖靈獎得主David?Patterson聯(lián)合谷歌和幾所著名高校于2018年發(fā)起。
MLPerf基準聯(lián)盟現有50多家成員,包括谷歌、微軟、Facebook、阿里巴巴等企業(yè)和斯坦福、哈佛、多倫多大學等高校。
繼AI訓練基準v0.5、v0.6之后,MLPerf在今年6月推出AI推理基準v0.5。參加本輪推理基準測試并提交結果的公司共14家,谷歌(TPUv3)、英偉達(T4、RTX、Xavier)、英特爾(CLX 9282、NNPI-1000)、Habana(Goya)等呈現了當前AI推理系統(tǒng)最高水平的競逐。
今年9月問世的含光800是阿里巴巴第一款正式流片的AI芯片,基于臺積電12nm工藝生產,其性能突破得益于軟硬件的協(xié)同設計:采用平頭哥自研架構,有效降低內存訪問延時;集成達摩院的創(chuàng)新算法,深度優(yōu)化CNN及視覺類算法,大幅提升視覺計算效率。
含光800主要用于云端視覺場景,現已大規(guī)模應用于阿里巴巴集團內多個場景,如視頻圖像識別/分類/搜索、城市大腦等,未來還可應用于醫(yī)療影像、自動駕駛等領域。
今后,含光800的算力將通過阿里云對外輸出。
作者:郭亞鑫來源:獵云網

請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 北電數智主辦酒仙橋論壇,探索AI產業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關稅,能否乘機器人東風翻身?