久久精品摸下面吃上面,成人黄色毛片免费观看,yjizz国产在线视频网

官宣開源新模型！OpenAI終于要摸著DeepSeek過河了

2025-04-02 09:11

比起新模型本身，開源的意義更大。

在暗示推出一款開源模型的一個多月后，OpenAI 似乎準備好「兌現(xiàn)」承諾了。

4 月 1 日，OpenAI CEO 山姆·奧特曼（Sam Altman）在社交平臺 X（原 Twitter）上公開宣布：OpenAI 計劃在接下來的幾個月內(nèi)，發(fā)布一個強大的、具備推理能力的開放權重（Open-Weight）大模型。

截屏2025-04-01 下午7.03.00.png

圖/ X

是 DeepSeek-R1 一樣的推理模型？還是集成推理能力的對話模型？這一點還有待揭秘。但至少，如果一切按照計劃推進，這款全新的大模型將是自 GPT-2 以來，OpenAI 首款重新開放權重的大模型。

消息一出，海內(nèi)外科技媒體迅速跟進，不少中文媒體就以「OpenAI 預告/即將發(fā)布開源模型」作為標題，一些行業(yè)觀察者也將其視為 OpenAI「重新走向開源」的標志性一步。

截屏2025-04-01 下午3.16.56.png

圖/ Google

畢竟，在 DeepSeek-V3/R1 發(fā)布之后開源模型社區(qū)變得越發(fā)活躍，而 OpenAI 的封閉也顯得越來越格格不入。

但如果你仔細看山姆·奧特曼的原話，會發(fā)現(xiàn)他并沒有說「open-source」（開源），而是用了一個更謹慎的表述——「open-weight」（開放權重）來作為新模型的「前綴」。

「開放權重」和「開源」可以劃等號嗎？這也引發(fā)了不少網(wǎng)友的討論乃至爭論。需要指出的是，所謂「開放權重」，是指模型訓練完成后所得到的參數(shù)對外開放，開發(fā)者可以基于這些權重進行部署、測試，甚至微調。但它不包含訓練數(shù)據(jù)、不附帶完整訓練代碼，也不保證無門檻使用。

這與很多人認知中的「開源」——即代碼、數(shù)據(jù)、方法全面透明、自由使用——明顯還有一段距離。

從這個意義上說，「開放權重」其實更像是一種妥協(xié)：保留核心技術壁壘的同時，釋放一些能力給開發(fā)者社區(qū)。它可以降低模型的使用門檻，但難以滿足真正的可驗證性與可重現(xiàn)性需求。

所以 OpenAI 究竟是重新?lián)肀ч_源，還是在用模糊語言重新定義「開放」？某種程度上，這場關于「真開源」還是「假開源」的爭議，可能遠比一次模型發(fā)布本身更值得關注。

從阿里 Qwen 到 DeepSeek：「開放權重」模型，就是開源模型？

公允地講，OpenAI 新模型「開放權重」的做法其實并不意外。

事實上，包括 DeepSeek、Qwen（阿里）、LLaMA（Meta）三家被視為開源模型社區(qū)的「主力」，在開源策略上雖然各有側重，但核心共同點也都是——開放權重，允許外部開發(fā)者直接部署，提供用于推理代碼、微調腳本和評估工具等。

截屏2025-04-01 下午7.05.10.png

DeepSeek 新聞稿，圖/ DeepSeek

這意味著，開發(fā)者可以直接下載模型進行本地部署、微調、做推理服務，而這樣也可以說是大模型「開源」的最低門檻。

從這個角度看，OpenAI 預告發(fā)布的新模型采用「開放權重」的做法，正是目前開源模型社區(qū)的主流方式。甚至可以說，它在定義上，與今天市面上大多數(shù)被稱為「開源」的大模型并無二致。

不過盡管都是開放權重，但實際的開放程度還是各有不同。

以 DeepSeek 為例，它發(fā)布的 V2、V3、R1 等模型均開放了權重，還有相應的技術報告。同時，DeepSeek 還采用了限制極少的 MIT 開源協(xié)議，允許任何人自由地使用、修改、分發(fā)和商業(yè)化軟件或模型。這也是很多開發(fā)者、廠商喜歡采用 DeepSeek 模型的關鍵之一。

截屏2025-04-01 下午7.06.22.png

阿里稍早前推出的 QVQ-Max 也采用了 Apache 2.0 協(xié)議，圖/ Github

相比之下，Meta 的 LLaMA 雖然也開放了模型參數(shù)和推理腳本，但其使用協(xié)議限制更多。從 LLaMA 2 開始，Meta 采用了更寬松的許可證（LLaMA 3.1 又更開放了一點），但還是需要開發(fā)者申請使用，且不能直接用于某些商業(yè)應用或發(fā)布服務，這也導致其在開源社區(qū)的熱度雖高，但落地場景有所受限。

總的來說，三者雖然都自稱「開源模型」，但如果把「開源」拆解為幾個維度來看——開放權重、開放代碼、開放數(shù)據(jù)、開放訓練過程、開放使用權限——你會發(fā)現(xiàn)，沒有一家是「全開」的。沒有公開完整的訓練數(shù)據(jù)，也沒有提供可復現(xiàn)的訓練代碼——換句話說，你可以用它的模型，但你無法從零重建它。

從這個角度看，OpenAI 即將發(fā)布的模型雖然尚未公布開源的具體策略，但如果也開放模型權重和推理代碼，支持開發(fā)本地部署。那么從行業(yè)實踐標準來看，它完全可以被歸入今天「開源模型」的范疇之中。

OpenAI 重回開源，新模型將是 o3-mini 水平的推理模型

盡管很多人以為 OpenAI 是以開源起家，但實際上至少在 GPT-2 時期，OpenAI 就有了「閉源路線」的打算。

2019 年初 GPT-2 發(fā)布，OpenAI 開始以「惡意使用風險」的名義拒絕公開的代碼，但在外界一致認為 OpenAI「夸大風險」的輿論下，他們才在 2019 年底公開滿血版 15 億參數(shù)的 GPT-2。但不論如何，從 GPT-3 開始，OpenAI 徹底走上閉源路線，不再公開權重、代碼或訓練數(shù)據(jù)。

因此，這一次「重新開放」，也可以視為 OpenAI 對社區(qū)釋放出的一個信號。但需要明確的是，從山姆·奧特曼采用「open-weight」的字眼來看，OpenAI 新模型大概率將和今天的 DeepSeek、Qwen、LLaMA 一樣：開放模型權重與推理代碼，但不包括訓練數(shù)據(jù)或完整的訓練代碼。

圖/ OpenAI

不過還是要考慮 OpenAI 采用的開源許可類型。如果 OpenAI 的新模型和 Qwen 系列一樣采用較為主流的 Apache 2.0 開源許可，對于大部分開發(fā)者來說可能就沒有影響，開發(fā)者同樣可以基于權重進行本地部署、推理服務，甚至進行微調適配，只是模型本身的訓練依舊是個「黑盒」。

另外值得期待的是，山姆·奧特曼在今年 2 月就暗示過 OpenAI 開源模型的方向將是「o3-mini 級別」與「手機端側級別」其中之一。結合最新推文中提到的「powerful new open-weight model with reasoning」，基本可以推斷出 OpenAI 在開源路線上最終選擇了一個「o3-mini 級別」模型來打開局面。