北電數(shù)智助推國產(chǎn)算力與國產(chǎn)大模型融合 迸發(fā)信創(chuàng)之光
近日,北京電子數(shù)智科技有限責任公司(以下簡稱“北電數(shù)智”)基于其“寶塔·模型適配平臺”成功完成了DeepSeek-V3/R1全尺寸模型與海光DCU、華為、壁仞科技、沐曦等國產(chǎn)芯片的混元算力適配,這將為開發(fā)者在使用DeepSeek模型過程中帶來更多算力選擇,且用戶在使用國產(chǎn)算力時可忽略底層硬件差異,實現(xiàn)快速開發(fā)部署和模型調用。
DeepSeek-V3/R1是深度求索公司(DeepSeek)開發(fā)的一款先進的人工智能模型,擁有強大的數(shù)據(jù)處理和分析能力,可廣泛應用于自然語言處理、圖像識別、語音識別等領域。DeepSeek采用創(chuàng)新的混合專家系統(tǒng)(DeepSeekMoE)、多頭潛在注意力機制(MLA)、自研訓練框架等多項工程化創(chuàng)新,基于較少GPU訓練資源和時間消耗實現(xiàn)R1與OpenAI o1?相當、V3與OpenAI 4o相當?shù)哪P托阅,模型具有高推理效率和低訓練成本的?yōu)勢。
北電數(shù)智“寶塔·模型適配平臺”與各大主流開發(fā)框架保持高度兼容性,當前已完成24款基座大模型適配,可進一步幫助降低企業(yè)和開發(fā)者的使用門檻。其能夠抹平芯片架構層的差異,快速實現(xiàn)對模型的優(yōu)化支持和硬件適配。比如在處理推理任務時,北電數(shù)智的混元推理技術路線與DeepSeek技術路線高度匹配,可進一步優(yōu)化推理效果、加速推理速度、降低推理成本,解決算力不夠用等問題。在北電數(shù)智“寶塔·模型適配平臺”的加持下,DeepSeek-V3/R1可在混元芯片上高效、穩(wěn)定運行支撐各類應用場景。此外,為全面挖掘國產(chǎn)芯片性能潛力與模型適配能力,北電數(shù)智還推出“星火·國產(chǎn)算力AI原生適配認證”,加強國產(chǎn)模型與國產(chǎn)算力間適配協(xié)同能力,推動國產(chǎn)芯片更好支撐AI原生應用場景。
國產(chǎn)芯片和如DeepSeek等優(yōu)秀的國產(chǎn)大模型產(chǎn)生的緊密聯(lián)動與化學反應中,我們已經(jīng)看到了全棧AI國產(chǎn)化路上的光芒...

請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關稅,能否乘機器人東風翻身?