訂閱
糾錯
加入自媒體

Cursor 2.0 發(fā)布:首個編程大模型來了!30 秒完成復(fù)雜任務(wù)

昨日,Cursor 發(fā)布兩項重大更新:

  1. 首個編碼模型 Composer

  2. 用于并行協(xié)作多個代理的新界面

官方表示,Composer 是一種前沿的編碼模型,可在 30 秒內(nèi)完成任務(wù)。它可以在不同模型上運行相同的提示,以實現(xiàn)最大程度的智能。

借助內(nèi)置瀏覽器,代理商現(xiàn)在可以運行和測試代碼,并可以使用語音模式將語音轉(zhuǎn)換為代碼。

全新 Composer

Composer 是一款前沿模型,速度是同等智能模型的 4 倍

該模型專為在 Cursor 中進(jìn)行低延遲的代理式編碼而打造,大多數(shù)回合在 30 秒內(nèi)完成。

Composer 通過一組強大的工具進(jìn)行訓(xùn)練,包括覆蓋整個代碼庫的語義搜索,因此在理解與處理大型代碼庫方面顯著更強。

Cursor 沿用了在開發(fā) Cursor Tab 時的經(jīng)驗。在研發(fā)過程中,研究人員試驗了一個代號為 Cheetah 的原型代理模型,Composer 是該模型的更智能升級版,憑借足夠的速度支撐交互式體驗,讓編碼更順暢。

Composer 是一種專家混合(MoE)語言模型,支持長上下文的生成與理解。它通過在多樣化的開發(fā)環(huán)境中進(jìn)行強化學(xué)習(xí)(RL),對軟件工程進(jìn)行了專項優(yōu)化。

在 RL 過程中,模型會自發(fā)習(xí)得一些有用的能力,例如執(zhí)行復(fù)雜搜索、修復(fù)錯誤,以及編寫并運行單元測試。

通過將 MXFP8 MoE kernels 與專家并行和混合分片數(shù)據(jù)并行相結(jié)合,在原生低精度下訓(xùn)練模型,模型能夠以極低的通信開銷將訓(xùn)練擴展到數(shù)千張 NVIDIA GPU。

為了承載強化學(xué)習(xí)工作負(fù)載,研究人員對既有的 Background Agents 基礎(chǔ)設(shè)施進(jìn)行了改造,重寫了虛擬機調(diào)度器,以適配訓(xùn)練運行的突發(fā)性與規(guī)模。

為衡量進(jìn)展,研究團隊還構(gòu)建了一套盡可能貼近軟件開發(fā)者實際使用價值的評測。該評測不僅考察代理的正確性,還評估其對代碼庫既有抽象與軟件工程實踐的遵循程度。

多代理界面

新的界面更聚焦,是 Cursor 團隊自下而上圍繞代理而非文件進(jìn)行設(shè)計的。細(xì)節(jié)由代理處理,需要深入代碼時,仍可在新布局中輕松打開文件,或切換回經(jīng)典 IDE。

底層由 git worktree 或遠(yuǎn)程機器提供支持,Cursor 2.0 能夠并行運行多個代理,且彼此互不干擾。多個模型甚至可以同時嘗試同一問題并擇優(yōu)采用,能顯著提升最終結(jié)果,尤其是在更難的任務(wù)上。

但同時,兩個新的瓶頸也相繼出現(xiàn):代碼評審與變更測試。

為解決這兩個瓶頸,團隊構(gòu)建了原生瀏覽器工具,使 Cursor 可以測試其工作并持續(xù)迭代,直到產(chǎn)出正確的最終結(jié)果。

官方表示,推動 Composer 開發(fā)的初衷之一是打造一個在日常工作中也會主動依賴的智能體,F(xiàn)在 Composer 已被多次在日常軟件開發(fā)中使用。

參考資料:

https://cursor.com/cn/blog/2-0

https://cursor.com/cn/blog/composer

聲明: 本網(wǎng)站所刊載信息,不代表OFweek觀點?帽菊靖寮,務(wù)經(jīng)書面授權(quán)。未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復(fù)制、翻譯及建立鏡像,違者將依法追究法律責(zé)任。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號