日韩大片在线观看,国产欧美另类久久久

3分鐘看懂大模型開閉源戰(zhàn)爭，誰將主宰未來？

2025-02-17 10:41

2月14日，百度宣布開源！百度稱將在未來幾個月中陸續(xù)推出文心大模型4.5系列，并于6月30日起正式開源。

自DeepSeek開源之風席卷全球后，開源閉源路徑選擇一直是AI領域熱議焦點。連此前堅持閉源的百度都轉投開源陣營，足見開源之勢已占據上風。今天我們就來聊聊開源和閉源的優(yōu)劣勢，到底大模型開源和軟件開源有什么區(qū)別？開閉源的商業(yè)化應用到底如何選擇？文末可免費獲取30份大模型行業(yè)研究報告

01開源和閉源的優(yōu)劣勢

“開源”一詞源自軟件領域，指在軟件開發(fā)過程中公開其源代碼，允許任何人查看、修改和分發(fā)。開源軟件的開發(fā)通常遵循互惠合作和同儕生產的原則，促進了生產模塊、通信管道和交互社區(qū)的改進，典型代表包括Linux，Mozilla Firefox，安卓。

閉源軟件（專有軟件）由于商業(yè)模式等其他原因，不公開源代碼，只提供計算機可讀的程序（如二進制格式）。源代碼僅由開發(fā)者掌握和控制。典型代表包括Windows，IOS。

開源是一種軟件開發(fā)模式，基于開放、共享和協作，鼓勵大家共同參與軟件的開發(fā)和改進，推動技術的不斷進步和廣泛應用。也是開源派倡導的技術平權，不應該讓少數人壟斷技術。

選擇閉源開發(fā)的軟件更有可能成為一個穩(wěn)定、專注的產品，但是閉源軟件通常需要花錢，且如果它有任何錯誤或缺少功能，只能等待開發(fā)商來解決問題。

開源與閉源既是技術策略，更是商業(yè)策略。表面上是發(fā)展路線之爭，實則是利益之爭。

開源與閉源確實各有利弊。

開源在推進技術平權，讓更多人享受技術的同時，也會讓大家“拿來主義”，不會再考慮底層的創(chuàng)新了。TrainiCEO孫鄰家認為，“技術過度平權不一定是好事，會失去創(chuàng)新的驅動力。”

閉源因為技術壟斷，商業(yè)化上能賺取更大利潤，在技術底層創(chuàng)新能投入更大資源。而且閉源更能成為一個穩(wěn)定、安全、專注的產品。

我們想想當年的以蘋果為代表的IOS系統，和谷歌為代表的安卓系統，就深有體會。大眾消費者直觀體會，就是蘋果系統不卡，安卓卡的要死。當年小米MIUI大受歡迎，就是在安卓開源底層做的優(yōu)化，讓廣大手機用戶體驗大幅提升。不是美國的封鎖，華為也沒有動力大力投入鴻蒙系統的研發(fā)上，經濟賬算不過來。只是被逼的沒辦法了，才逼出了鴻蒙系統。

開源和閉源是一個硬幣的兩面。

開源、閉源其實都存在透明性、合規(guī)性、安全性的問題，也涉及治理問題。開源可能促進我們更多的探索性和基礎性工作；閉源更多促進產品化和商業(yè)化，推動技術走進每個人的生活。這兩件事其實不應該是之爭，而是和諧共存。

02開源大模型與開源軟件有三大區(qū)別

大模型開源和傳統軟件開源不是一回事。

軟件開源是指源代碼開源，拿到源代碼，我們就知其然也知其所以然，也可以在源代碼基礎上，去修改或增加新功能。

但大模型是一個黑盒子，里面有很多至今無法解釋的現象，所以對大模型的開源，業(yè)界提出了更多維度，有的說需要四部分——權重、數據集、代碼和訓練過程；也有的說需要五部分，還包括了框架。即使是這些定義，業(yè)界也有不同意見：為什么會有這樣的定義？這更像是從傳統開源軟件的思路來考慮的。

有趣的是，只有極少數公司或機構的大模型，同時開源了上述四部分或五部分，比如IBM剛剛開源出來的Granite大語言模型；也有像智源研究院、馬斯克旗下大模型公司xAI ，開源了權重和數據集。比如，根據智源人工智能研究院副院長兼總工程師林詠華的介紹，智源最新開源數據集分為兩類，一類是通用開源指令微調數據集，一類是行業(yè)垂類數據集，涵蓋18個行業(yè)。

“現在業(yè)界的共識是，至少將權重再加上一些推理代碼開源。”零一萬物林旅強說，只有這兩部分開源，其他人才可以將開源大模型使用起來。由此，開源大模型現在的定義，有點像微軟提過的“免費軟件”。所以，谷歌等公司在其官網上稱是開源權重（open weight），而不是開源大模型。

為什么在開源大模型中，權重如此重要？有業(yè)界人士將權重打比方為“一大堆數字”，一個13B的模型，就有130億個數。這些數字與模型如何處理輸入的數據、如何做出預測和生成文本等相關，代表了一個大模型的智慧。

而在大模型中，代碼分為預訓練代碼、微調代碼和推理代碼。預訓練代碼是大模型公司的核心；對于微調代碼，市場上已有很多公開方法，而大模型要被用起來，需要推理代碼。至于訓練過程和數據集，往往也是大模型廠商的核心所在。

與傳統軟件不同，在大模型開源上，企業(yè)的態(tài)度有了微妙的變化�，F在大模型的成本太過高昂，訓練一個千億級參數模型，要幾千萬甚至上億，因此，很多公司在開源問題上變得保守。這是一個現實問題，每家公司的開源，必然服務于自己的商業(yè)戰(zhàn)略。而且，即便將這些核心都開源出來，大多數工程師和企業(yè)也沒有那么多資源去復現。

業(yè)內人士認為，開源大模型和開源軟件有三個核心區(qū)別：

一是透明度完全不一樣。開源軟件的代碼能說明一切，從而可以形成一套治理體系；大模型當下還是一個黑盒子，內部機理還是未知的。

二是大模型社區(qū)的性質發(fā)生了變化。之前開源社區(qū)講求全球工程師來貢獻；但因為算力等資源限制，在大模型社區(qū)里，或許90%以上的工程師，無法直接為大模型貢獻，因此很多社區(qū)變成了單向模式，大家只是使用大模型。在HuggingFace上，Meta的Llmma開源大模型，已經有幾千個變種，但彼此之間沒有太多交互，也很難將創(chuàng)新合并。

其三是大模型企業(yè)開源策略發(fā)生變化。中國信通院知識產權與創(chuàng)新發(fā)展中心產業(yè)發(fā)展研究部主任張俊霞說，因為大模型的訓練投入特別大，這導致企業(yè)在開源策略的選擇上，特別是在一些許可或信息披露上，都有很大不同。“這個問題現在不管是國內還是國際社區(qū)，都在非常激烈地討論。”

開源的目的不是一定要超越閉源。

單純把開源模型和閉源模型放在一起來比較，可能有失公允。因為閉源大模型可能是一套體系，比如包含了檢索增強等技術，而開源模型是一個單體模型，拿“多對一”，肯定不合理。

開源的價值是更加公開透明，技術上更加平權，不會讓其成為少數人牟利的手段。“更為關鍵的是，對于人工智能來說，如果未來走向AGI，開源讓AI的發(fā)展走向，更符合全人類的利益，這一點的價值要遠高于在某一方面去超越閉源。”

而開源和閉源大模型誰更安全，業(yè)界也有著爭議。開源派認為，在閉源環(huán)境當中，大家不知道有沒有人監(jiān)督它。開源的好處是一旦出現一些安全問題，整個社區(qū)會來共同檢查。

但也有人士認為“開源也會帶來各種意想不到的問題”。比如，開源可能將大模型交到了“恐怖分子”手里。“舉個例子，開源大模型的數據集，如果別人加了一些數據，訓練出大模型去干了違法的事。”一家大模型企業(yè)開源負責人說。另外，現在各國都強調數據主權，數據開源后怎么追蹤也是問題。所以國家鼓勵開源，但不是無限制的開源。

開閉源，商業(yè)化如何選擇？

在開閉源的選擇上，智譜張鵬認為，如果只是想做一些實驗和嘗試，可以選擇開源模型，但如果想要在上面做商業(yè)化應用，大部分人還是會選擇商業(yè)化版本，因為有保障，能夠提供更好的服務。

這代表了業(yè)界、尤其是ToB行業(yè)很多人士的觀點。

無論是開源、閉源，需要優(yōu)先考慮客戶是否需要本地部署大模型。無論國內外，不少客戶都有自主可控的需求。如果采用公有云上的模型，比如OpenAI，客戶要考慮數據暴露信息的問題。

值得注意的是，閉源大模型是否能部署到本地，需要獲得允許。開源大模型同樣需要依據一些協議以及合規(guī)性。從技術角度來講，很多開源部署到本地是可行的。而開源可以方便地進行微調，打造行業(yè)大模型，這是其優(yōu)勢。

大模型的需求一定是開放混合的。具體要結合行業(yè)和場景，比如政務領域，客戶對數據安全要求極高，不能觸碰紅線，需要私有化部署，開源模型在這方面更為靈活方便。

結語

DeepSeek的開源促使百度宣布開源策略不僅僅是鯰魚效應，而是徹底地改變了大模型行業(yè)的玩法。

就像剛剛過去的阿聯酋迪拜World Governments Summit 2025峰會上，百度創(chuàng)始人李彥宏所說：“我認為，創(chuàng)新是不能被計劃的。你不知道創(chuàng)新何時何地到來，你所能做的是，營造一個有利于創(chuàng)新的環(huán)境。”