鯤云科技新一代星空X9加速卡量產,性能提升最高4.47倍,為AI服務器提供高性能算力支持
2021年4月17日,鯤云科技在第八屆中國(上海)國際技術進出口交易會(上交會)上推出了新一代的星空X9加速卡,峰值性能52.4TOPS,實測算力最高可達到英偉達T4的4.47倍,面向高性能AI服務器提供高性能、低延時、高算力性價比的人工智能計算加速解決方案,助力智算中心、云計算中心、高性能計算等典型場景的應用和建設。目前該產品已經完成了量產,將于近期同浪潮完成產品適配,推出搭載星空X9加速卡的智算中心AI服務器。
鯤云創(chuàng)始人兼CEO牛昕宇博士展示星空X9加速卡
星空X9加速卡
星空X9加速卡
星空X9加速卡搭載4顆CAISA 芯片,全高全長,采用無風扇的被動散熱設計。CAISA芯片為鯤云科技去年6月發(fā)布的全球首款定制數(shù)據流AI芯片,較同類產品在芯片利用率上有較大的技術突破,最高提升11.05倍,在實際應用中可以提供更高的有效算力。
鯤云創(chuàng)始人兼CEO牛昕宇博士展示CAISA芯片
得益于技術團隊對底層架構的持續(xù)優(yōu)化,最新的實測數(shù)據顯示,X9加速卡僅用不到1/2的峰值算力,可以實現(xiàn)英偉達T4最高4.47倍的實測性能提升,算力性價比、芯片利用率、實測性能和處理延時等指標實現(xiàn)了業(yè)界領先,表現(xiàn)優(yōu)異。
星空X9加速卡產品規(guī)格
同英偉達旗艦產品T4相比,星空X9加速卡在運行ResNet50, YOLO v3等算法模型時的芯片利用率提升了2.76-11.05倍,最高可以實現(xiàn)94.4%的芯片利用率。在性能方面,X9在運行ResNet50網絡時性能可以達到6037.73FPS,相較T4性能提升1.12倍,運行YOLO v3、U-Net Industrial檢測分割網絡性能有1.99-4.47倍提升。在達到最優(yōu)性能時,X9處理延時最低可達到2.65ms,處理速度相比T4提升35.73倍,適用于智算中心、云計算中心、高性能計算等對低延時有要求的高性能AI計算加速場景。
X9 vs T4 芯片利用率
X9 vs T4 性能(FPS)
X9 vs T4 延時(ms)
X9 vs T4 benchmark
隨著智能化和智慧化的發(fā)展,智算中心、云計算中心等日益成為智慧時代社會運行的重要基礎設施,對AI算力的需求也日益增長,星空X9加速卡的量產為底層的AI算力支撐提供了新的選擇。鯤云科技還在現(xiàn)場展出了星空X3加速卡、星空X6A智能小站等AI硬件產品及智慧油田、智能安監(jiān)、智能電網、智能制造等行業(yè)解決方案。
星空X9加速卡應用于浪潮4U服務器NF5468M5
星空X9加速卡

請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語權
- 3 深度報告|中國AI產業(yè)正在崛起成全球力量,市場潛力和關鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級獨角獸:獲上市公司戰(zhàn)投,干人形機器人
- 5 國家數(shù)據局局長劉烈宏調研格創(chuàng)東智
- 6 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 7 百億AI芯片訂單,瘋狂傾銷中東?
- 8 Robotaxi新消息密集釋放,量產元年誰在領跑?
- 9 格斗大賽出圈!人形機器人致命短板曝光:頭腦過于簡單
- 10 一文看懂視覺語言動作模型(VLA)及其應用