亚洲男同gay在线观看,国产av网站一区二区三区,亚洲欧美卡通动漫日韩一区

DeepSeek式創(chuàng)新無(wú)法計(jì)劃，但對(duì)“下一代模型”該有準(zhǔn)備

2025-02-13 11:32

文 | 佘宗明

作家大衛(wèi)·弗羅斯特曾說(shuō)過(guò)：想要成功，反而不要以成功為目標(biāo)，只需要做你喜歡和相信的事情，成功就會(huì)自然而然地到來(lái)。

DeepSeek的火爆出圈，儼然成了對(duì)《為什么偉大不能被計(jì)劃》中引用的這句話的詮釋。

身為AI布道者的李彥宏，則跟它打了個(gè)共鳴的響指。

2月11日，在第12屆世界政府峰會(huì)（WGS 2025）上，被阿聯(lián)酋AI部長(zhǎng)奧馬爾·蘇丹·奧拉馬問(wèn)到如何看待DeepSeek的崛起后，李彥宏就回答道：創(chuàng)新是無(wú)法計(jì)劃的，你無(wú)法知道創(chuàng)新何時(shí)何地會(huì)出現(xiàn)，你所能做的就是營(yíng)造一個(gè)有利于創(chuàng)新的環(huán)境。

創(chuàng)新無(wú)法被計(jì)劃，但創(chuàng)新不能沒(méi)準(zhǔn)備。一如巴斯德所說(shuō)：“在觀察的領(lǐng)域里，機(jī)會(huì)只青睞有準(zhǔn)備的頭腦。”

DeepSeek在Scaling Law的大路旁開(kāi)辟出“小力出奇跡”的分岔來(lái)，也是“有準(zhǔn)備”的回報(bào)�；梅搅炕贕PU儲(chǔ)備上的先知先覺(jué)，就是“有準(zhǔn)備”的直觀注解。

“有準(zhǔn)備”的同義詞是“肯投入”。李彥宏在峰會(huì)上就表示，盡管技術(shù)進(jìn)步、成本降低，但仍需持續(xù)投入AI基礎(chǔ)設(shè)施，以確保處于技術(shù)創(chuàng)新的最前沿。“我們?nèi)孕鑼?duì)芯片、數(shù)據(jù)中心和云基礎(chǔ)設(shè)施持續(xù)投入，以打造下一代模型。”CNBC的最新報(bào)道也顯示，百度將于今年發(fā)布新版本大模型“文心5.0”。

在DeepSeek讓那些對(duì)中美AI實(shí)力差距倍感灰心之人重燃信心的背景下，李彥宏說(shuō)的“下一代模型”不無(wú)所指：AI角力終究是長(zhǎng)跑賽，只有面向次世代技術(shù)持續(xù)投入，才能跑得更遠(yuǎn)。

李彥宏跟DeepSeek“同框”，當(dāng)然不是偶然。“中國(guó)”“AI”等關(guān)鍵詞，串聯(lián)起了二者。

作為這屆世界政府峰會(huì)主論壇首位對(duì)談嘉賓，李彥宏“AI先生”的聲名在外。被《時(shí)代》周刊評(píng)為“Foremost Futurist”的他，是《時(shí)代》周刊首次評(píng)選的全球AI百大人物榜單中唯一的中國(guó)企業(yè)家。

這么看，他成為阿聯(lián)酋AI部長(zhǎng)的對(duì)談嘉賓，也就難言奇怪了——此次峰會(huì)上，阿聯(lián)酋AI部長(zhǎng)只主持了兩場(chǎng)對(duì)談，嘉賓分別是李彥宏跟谷歌CEO桑達(dá)爾·皮查伊，去年則是黃仁勛。

作為當(dāng)下全球科技圈的當(dāng)紅炸子雞，DeepSeek的熱度延伸至世界性高端峰會(huì)上，也很正常——這本就是AI發(fā)展的標(biāo)志性事件。

中國(guó)AI“代言人”就中國(guó)AI“神秘力量”發(fā)表觀點(diǎn)，自然極具看點(diǎn)。

在技術(shù)大爆炸到來(lái)的今天，務(wù)實(shí)派總是會(huì)因時(shí)而變地迭代自身認(rèn)知�？梢钥吹�，李彥宏在峰會(huì)上對(duì)DeepSeek發(fā)表的諸多看法，如創(chuàng)新無(wú)法被計(jì)劃，還有關(guān)于大模型訓(xùn)練、AI應(yīng)用的觀點(diǎn)，都彰顯了認(rèn)知視野的開(kāi)放性。

認(rèn)同的背面是理解。從推動(dòng)AI技術(shù)進(jìn)步的角度講，李彥宏跟DeepSeek創(chuàng)始人梁文鋒本是同路人。

“卷技術(shù)是美國(guó)大模型的天命，卷價(jià)格是中國(guó)大模型的宿命”，是許多人（包括我）此前對(duì)于中美大模型對(duì)比的直接觀感。

但DeepSeek無(wú)疑刷新了不少人的認(rèn)知：它卷價(jià)格，更卷技術(shù)。憑著多頭潛在注意力（MLA）和群組相對(duì)策略優(yōu)化（GRPO）技術(shù)，DeepSeek實(shí)現(xiàn)了對(duì)硅谷算力能效比的代際碾壓。

拋開(kāi)頻域遮蔽效應(yīng)看會(huì)發(fā)現(xiàn)，DeepSeek技術(shù)突破的背后是中國(guó)大模型技術(shù)的整體進(jìn)步：百度研發(fā)的“理解-檢索-生成”協(xié)同優(yōu)化的檢索增強(qiáng)技術(shù)（RAG）強(qiáng)過(guò)OpenAI的，豆包的端到端對(duì)話能力不遜于OpenAI版“Her”，可靈的視頻生成質(zhì)量不輸Sora……即為印證。

就拿百度結(jié)合搜索技術(shù)積累形成的模型特色RAG來(lái)說(shuō)，依靠RAG帶來(lái)的中文深度理解、多模態(tài)檢索、垂直領(lǐng)域定制化及實(shí)時(shí)數(shù)據(jù)整合能力等優(yōu)勢(shì)，文心一言在咨詢機(jī)構(gòu)沙利文的《2024年中國(guó)大模型能力評(píng)測(cè)》中拿下了五大評(píng)測(cè)維度的四項(xiàng)第一。

隨之而來(lái)的，是文心大模型調(diào)用量快速增長(zhǎng)：截止去年11月，其日調(diào)用量已超15億，相比一年前大幅增長(zhǎng)30倍，成了中國(guó)大模型落地應(yīng)用爆發(fā)的佐證。

到頭來(lái)，從文心一言到DeepSeek-R1，都奠定了外界對(duì)中國(guó)大模型技術(shù)能力的基礎(chǔ)認(rèn)知。

去年7月，在率先打響國(guó)產(chǎn)大模型價(jià)格戰(zhàn)第一槍后，梁文鋒在接受媒體專訪時(shí)曾解釋，“我們認(rèn)為，AI和API服務(wù)應(yīng)該是人人都能負(fù)擔(dān)得起、隨時(shí)可用的。”

與之相呼應(yīng)的是，DeepSeek驚艷四座后，OpenAI CEO山姆·奧特曼、微軟CEO納德拉和亞馬遜CEO安迪·賈西都不約而同地談到，AI成本下降是趨勢(shì)。

此次峰會(huì)上，李彥宏同樣談到了這點(diǎn)。他認(rèn)為，“創(chuàng)新的本質(zhì)是成本下降與生產(chǎn)力提升。”根據(jù)摩爾定律，每十八個(gè)月，性能就會(huì)翻倍而價(jià)格減半。如今大模型推理成本每年降低90%以上。

前不久，在接入DeepSeek模型后，百度智能云立馬宣布了打折——千帆平臺(tái)上的DeepSeek-R1僅為官方刊例價(jià)的5折，DeepSeek-V3為官方刊例價(jià)的3折，并提供限時(shí)免費(fèi)服務(wù)，便是回響。

成本下降的后面是技術(shù)帶動(dòng)：推理引擎性能優(yōu)化層面，針對(duì)DeepSeek模型MLA結(jié)構(gòu)的計(jì)算進(jìn)行極致性能優(yōu)化；推理服務(wù)工程架構(gòu)創(chuàng)新層面，做了嚴(yán)格的推/拉模式性能對(duì)比、設(shè)計(jì)了請(qǐng)求失敗的續(xù)推機(jī)制、實(shí)現(xiàn)了主流的KV-Cache復(fù)用技術(shù)……是百度云智能將AI成本打下來(lái)的重要支撐。

結(jié)果就是，DeepSeek模型上線首日，已有超1.5萬(wàn)家客戶通過(guò)百度千帆平臺(tái)進(jìn)行模型調(diào)用。

降本是最好的“刺激”。依托技術(shù)賦能，推動(dòng)自有與納管主流大模型降低調(diào)用成本，已成千帆平臺(tái)的“基操”。過(guò)去一年，文心旗艦大模型降價(jià)幅度超過(guò)90%、主力模型全面免費(fèi)，就累計(jì)幫助用戶精調(diào)了3.3萬(wàn)個(gè)大模型，開(kāi)發(fā)出逾77萬(wàn)個(gè)企業(yè)級(jí)應(yīng)用。

很大程度上，在推動(dòng)AI成本下降上，李彥宏跟梁文鋒也是殊途同歸：如果說(shuō)，DeepSeek讓全世界看到了中國(guó)AI花小錢辦大事的破題能力，那百度點(diǎn)亮首個(gè)國(guó)產(chǎn)萬(wàn)卡集群，就是中國(guó)AI從算力基建層面尋求成本突破的另一種解法。

有專業(yè)人士提到，由于訓(xùn)練效率與數(shù)據(jù)利用效率差距，中國(guó)的模型整體資源消耗大概是全球頂尖模型的四倍。

而DeepSeek的框架創(chuàng)新，百度的AI基礎(chǔ)設(shè)施完善，正是將效率提上去、成本降下來(lái)的兩種思路。

2024年9月，百度升級(jí)發(fā)布百舸AI異構(gòu)計(jì)算平臺(tái)4.0，就是著力為企業(yè)提供“多、快、穩(wěn)、省”的AI基礎(chǔ)設(shè)施。該平臺(tái)迄今已具備成熟的10萬(wàn)卡集群部署和管理能力，能將兩種芯片混合訓(xùn)練大模型的效率折損控制在5%以內(nèi)，達(dá)到業(yè)界最領(lǐng)先的水平。

百度近期成功點(diǎn)亮昆侖芯三代萬(wàn)卡集群，又放大了其降本效應(yīng)與提效價(jià)值：萬(wàn)卡集群可通過(guò)模型優(yōu)化、并行策略、有效訓(xùn)練率提升、動(dòng)態(tài)資源分配等手段智能調(diào)度任務(wù)，將訓(xùn)練、微調(diào)、推理任務(wù)混合部署，最大化提升集群綜合利用率，降低單位算力成本，滿足AI原生應(yīng)用快速迭代需求，實(shí)現(xiàn)訓(xùn)練成本指數(shù)級(jí)下降。

“創(chuàng)新的本質(zhì)是成本下降與生產(chǎn)力提升”，百度和DeepSeek們降低成本，自然能撬動(dòng)更多創(chuàng)新。

花旗銀行的研報(bào)說(shuō)，百度、DeepSeek等中國(guó)模型展現(xiàn)出的高效和低成本優(yōu)勢(shì)，將有助于加速全球AI應(yīng)用開(kāi)發(fā)，并在全球引發(fā)更多技術(shù)創(chuàng)新，就是前瞻預(yù)判。

提供“多、快、穩(wěn)、省”的AI基礎(chǔ)設(shè)施，是百度AI全棧布局之下的能力體現(xiàn)。

“百度是全球少有的在AI上實(shí)現(xiàn)全棧布局的公司”，是《時(shí)代》周刊將百度納入“2024年全球100大最具影響力企業(yè)”榜單時(shí)給出的評(píng)語(yǔ)。

何為全棧布局？簡(jiǎn)單來(lái)說(shuō)就是，大模型發(fā)展所需的AI基礎(chǔ)設(shè)施、框架、云服務(wù)、AI生態(tài)反哺模型能力等條件，它都有。從芯片層的昆侖芯、框架層的百度飛槳到模型層與應(yīng)用層的落子，百度的“六邊形戰(zhàn)士”形態(tài)已若隱若現(xiàn)。

全棧布局，不能少了場(chǎng)景落實(shí)、應(yīng)用搭建等拼塊，也必然體現(xiàn)在應(yīng)用層的先行一步上。

AI產(chǎn)業(yè)發(fā)展，不是建空中樓閣，應(yīng)用層跑通了，基礎(chǔ)設(shè)施投入才可持續(xù)。移動(dòng)互聯(lián)網(wǎng)時(shí)代，從應(yīng)用層到基礎(chǔ)設(shè)施的倒三角型利益分配，催生了數(shù)量眾多的超級(jí)應(yīng)用和明星獨(dú)角獸，支撐了移動(dòng)生態(tài)的長(zhǎng)久繁榮，就是最好的證明。

可AI時(shí)代的“倒三角”尚未成型，AI企業(yè)給英偉達(dá)們“打工”仍是常見(jiàn)圖景。強(qiáng)如微軟谷歌，AI基礎(chǔ)設(shè)施投資中約一半的錢也要用來(lái)買卡。

就此看，李彥宏的那段話很有針對(duì)性：過(guò)去幾年，我們對(duì)各種技術(shù)進(jìn)步和突破感到非常興奮。但如果我們看技術(shù)棧，它就像一個(gè)金字塔，最賺錢的是硅層面，即GPU和其他類型的AI芯片；然后在其上面的是云基礎(chǔ)設(shè)施，由超大規(guī)模云服務(wù)提供商提供；再往上是語(yǔ)言模型，最上層是應(yīng)用層。應(yīng)用層雖然位于最頂端，但應(yīng)用層目前還沒(méi)有賺到太多錢。

AI產(chǎn)業(yè)可持續(xù)發(fā)展，推動(dòng)AI成本下降的確重要，幫助應(yīng)用層跑通則更為關(guān)鍵，這樣才能形成正循環(huán)。李彥宏在峰會(huì)上就說(shuō)：我們確實(shí)需要關(guān)注應(yīng)用層的價(jià)值創(chuàng)造。如果你作為基礎(chǔ)設(shè)施層投入了數(shù)千億美元，卻無(wú)法開(kāi)發(fā)出能帶來(lái)十倍以上回報(bào)的應(yīng)用，那么這是不可持續(xù)的。

該怎么加速大模型落地應(yīng)用的提點(diǎn)擴(kuò)面？峰會(huì)上有個(gè)細(xì)節(jié)頗堪玩味，也為此提供了參照：李彥宏談到Robotaxi比人開(kāi)車安全十倍，蘿卜快跑出險(xiǎn)率僅為人類駕駛員的1/14，阿聯(lián)酋AI部長(zhǎng)也表示也許明年峰會(huì)可以探索用蘿卜快跑提供交通服務(wù)。

蘿卜快跑是百度推動(dòng)AI規(guī)�；瘧�(yīng)用的重要抓手。2024年發(fā)布了全球首個(gè)支持L4級(jí)無(wú)人駕駛的自動(dòng)駕駛大模型Apollo ADFM的蘿卜快跑，自動(dòng)駕駛訂單量擊敗谷歌Waymo位居全球第一，入選《全球自動(dòng)駕駛十大里程碑》及MIT2025十大突破性進(jìn)展，就表明了中國(guó)AI在應(yīng)用上的巨大未來(lái)想象空間。

在大模型應(yīng)用場(chǎng)景早已從“Chat”擴(kuò)圍到各個(gè)領(lǐng)域的時(shí)下，蘿卜快跑只是大模型應(yīng)用場(chǎng)景豐富性的注腳：大模型To C側(cè)最先實(shí)現(xiàn)商業(yè)化的標(biāo)桿性應(yīng)用百度文庫(kù)，以4000萬(wàn)付費(fèi)用戶緊逼微軟的Copilot，百度智能云2024年在中標(biāo)項(xiàng)目數(shù)、行業(yè)覆蓋數(shù)、央國(guó)企中標(biāo)項(xiàng)目數(shù)三個(gè)維度里均為第一……就擘畫出了大模型規(guī)�；瘧�(yīng)用途徑的多元。

DeepSeek爆紅后，有些人又陷入了將研發(fā)與應(yīng)用二元對(duì)立的誤區(qū)。但事實(shí)上，規(guī)�；瘧�(yīng)用的反哺，恰是DeepSeek們?nèi)〉酶嗉夹g(shù)突破的動(dòng)能。

需要看到的是，無(wú)論是技術(shù)研發(fā)，還是落地應(yīng)用，都需要“有準(zhǔn)備”——DeepSeek跟百度都推動(dòng)了AI技術(shù)進(jìn)步、成本下降，但這不意味著，就該因此降低對(duì)AI的投入。

亞馬遜CEO安迪·賈西就說(shuō)：（在DeepSeek的帶動(dòng)下）AI 的成本在降低，但這并不意味著企業(yè)會(huì)減少對(duì)技術(shù)的投入。相反，降低的成本將使企業(yè)能夠重新考慮那些因預(yù)算限制而擱置的創(chuàng)新項(xiàng)目，從而加大整體的技術(shù)支出。

就在近日，微軟、亞馬遜、谷歌和Meta四巨頭表示，在去年創(chuàng)紀(jì)錄的支出之后，他們將在2025年進(jìn)一步加大投資，預(yù)計(jì)在AI技術(shù)和數(shù)據(jù)中心建設(shè)上總共投入3200億美元。相較之下，四巨頭2024年的總資本支出為2300億美元。

其中動(dòng)作最猛的，正是亞馬遜——它準(zhǔn)備將支出增至1000億美元以上。

李彥宏說(shuō)“仍需對(duì)芯片、數(shù)據(jù)中心和云基礎(chǔ)設(shè)施持續(xù)投入，以打造下一代模型”，DeepSeek追求持續(xù)進(jìn)化，顯然也是著眼于提升中國(guó)AI競(jìng)爭(zhēng)力的應(yīng)然之舉。

伊瓦爾·�？死试凇蹲罴芽赡艿氖澜纾簲�(shù)學(xué)與命運(yùn)》中說(shuō)：世界不分因果鏈，不是線性地安排事件……每個(gè)事件就像樹(shù)干，把網(wǎng)狀的根伸向過(guò)去，把樹(shù)冠托向未來(lái)。

持續(xù)投入，就是將AI技術(shù)突破和應(yīng)用拓圈的根扎得更深，最終將AI時(shí)代紅利的樹(shù)冠托得更高。而這，需要技術(shù)理想主義的堅(jiān)持，需要?jiǎng)?wù)實(shí)的準(zhǔn)備。

4個(gè)月前，在百度世界大會(huì)上，針對(duì)“硅谷預(yù)言家”安德森多年前的那個(gè)著名論斷“軟件吞噬世界”，李彥宏表示，這個(gè)世界不應(yīng)該被吞噬，而應(yīng)該被創(chuàng)造。

某種意義上講，他和其他的AI從業(yè)者們都是在“創(chuàng)造”——他們處在同一側(cè)，都在以探索下一代技術(shù)為支點(diǎn)，創(chuàng)造“最佳可能的世界”。

創(chuàng)新不能被計(jì)劃，但他們都在為創(chuàng)新做準(zhǔn)備。

原文標(biāo)題 : DeepSeek式創(chuàng)新無(wú)法計(jì)劃，但對(duì)“下一代模型”該有準(zhǔn)備