訂閱
糾錯
加入自媒體

美團(tuán)最新推理模型來了:專注 Thinking,具備 SOTA 水準(zhǔn)

今日,美團(tuán)發(fā)布了最新推理模型 LongCat-Flash-Thinking。

該模型是國內(nèi)首個同時具備「深度思考 + 工具調(diào)用」「非形式化 + 形式化」推理能力相結(jié)合的大語言模型。模型總參數(shù)達(dá) 5600 億個,采用創(chuàng)新的混合專家 (MoE) 架構(gòu),可根據(jù)上下文需求激活 18.6B~31.3B 個參數(shù)(平均 ~27B),優(yōu)化計算效率和性能。

聲明: 本網(wǎng)站所刊載信息,不代表OFweek觀點。刊用本站稿件,務(wù)經(jīng)書面授權(quán)。未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復(fù)制、翻譯及建立鏡像,違者將依法追究法律責(zé)任。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號