訂閱
糾錯
加入自媒體

北電數(shù)智助推國產(chǎn)算力與國產(chǎn)大模型融合 迸發(fā)信創(chuàng)之光

近日,北京電子數(shù)智科技有限責任公司(以下簡稱“北電數(shù)智”)基于其“寶塔·模型適配平臺”成功完成了DeepSeek-V3/R1全尺寸模型與海光DCU、華為、壁仞科技、沐曦等國產(chǎn)芯片的混元算力適配,這將為開發(fā)者在使用DeepSeek模型過程中帶來更多算力選擇,且用戶在使用國產(chǎn)算力時可忽略底層硬件差異,實現(xiàn)快速開發(fā)部署和模型調用。

image.png

DeepSeek-V3/R1是深度求索公司(DeepSeek)開發(fā)的一款先進的人工智能模型,擁有強大的數(shù)據(jù)處理和分析能力,可廣泛應用于自然語言處理、圖像識別、語音識別等領域。DeepSeek采用創(chuàng)新的混合專家系統(tǒng)(DeepSeekMoE)、多頭潛在注意力機制(MLA)、自研訓練框架等多項工程化創(chuàng)新,基于較少GPU訓練資源和時間消耗實現(xiàn)R1與OpenAI o1?相當、V3與OpenAI 4o相當?shù)哪P托阅,模型具有高推理效率和低訓練成本的?yōu)勢。

image.png

北電數(shù)智“寶塔·模型適配平臺”與各大主流開發(fā)框架保持高度兼容性,當前已完成24款基座大模型適配,可進一步幫助降低企業(yè)和開發(fā)者的使用門檻。其能夠抹平芯片架構層的差異,快速實現(xiàn)對模型的優(yōu)化支持和硬件適配。比如在處理推理任務時,北電數(shù)智的混元推理技術路線與DeepSeek技術路線高度匹配,可進一步優(yōu)化推理效果、加速推理速度、降低推理成本,解決算力不夠用等問題。在北電數(shù)智“寶塔·模型適配平臺”的加持下,DeepSeek-V3/R1可在混元芯片上高效、穩(wěn)定運行支撐各類應用場景。此外,為全面挖掘國產(chǎn)芯片性能潛力與模型適配能力,北電數(shù)智還推出“星火·國產(chǎn)算力AI原生適配認證”,加強國產(chǎn)模型與國產(chǎn)算力間適配協(xié)同能力,推動國產(chǎn)芯片更好支撐AI原生應用場景。

國產(chǎn)芯片和如DeepSeek等優(yōu)秀的國產(chǎn)大模型產(chǎn)生的緊密聯(lián)動與化學反應中,我們已經(jīng)看到了全棧AI國產(chǎn)化路上的光芒...

聲明: 本網(wǎng)站所刊載信息,不代表OFweek觀點。刊用本站稿件,務經(jīng)書面授權。未經(jīng)授權禁止轉載、摘編、復制、翻譯及建立鏡像,違者將依法追究法律責任。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號