訂閱
糾錯(cuò)
加入自媒體

大模型爆火,文心一言起大早,趕晚集?

圖片

2月13日,百度宣布4月1日起文心一言將全面免費(fèi)。

2月14日,百度宣布文心下一代模型4.5系列6月30日起開源。

圖片

受相關(guān)消息影響,截至2月13日港股收盤,百度集團(tuán)股價(jià)當(dāng)日累計(jì)上漲5.74%,報(bào)收94港元/股。要知道百度是國內(nèi)最早的大模型,此前,文心一言采取基礎(chǔ)版免費(fèi)、專業(yè)版收費(fèi)的模式,專業(yè)版定價(jià)59.9元/月,連續(xù)包月優(yōu)惠價(jià)49.9元/月。

而現(xiàn)在國內(nèi)的大模型們,通義千問、Kimi、豆包、騰訊混元、deepseek如雨后春筍,文心一言起了個(gè)大早,趕上這晚集了嗎?

01

曾是大模型賽道的先行者

文心一言:作為國內(nèi)最早的AI語言模型,有人說對(duì)于您來說全都是后來者居上,你覺得是為什么?

ChatGPT爆火后,大模型對(duì)個(gè)人生產(chǎn)力的提升,以及在各行業(yè)的巨大商業(yè)價(jià)值愈加清晰。2023年2月,就在百度公開宣布要推出“文心一言”之際,百度搜索、智能云到自動(dòng)駕駛等各產(chǎn)品方面的合作方隨即明確需要這樣的產(chǎn)品,很快,超過600家合作伙伴宣布加入文心一言生態(tài),期待盡早用上最新最先進(jìn)的大語言模型。

2023年3月16日,百度新一代大語言模型文心一言正式啟動(dòng)邀測(cè)。8月31日,文心一言率先向全社會(huì)全面開放。開放首日,文心一言共計(jì)回復(fù)網(wǎng)友超3342萬個(gè)問題。12月28日,百度首席技術(shù)官王海峰在第十屆WAVE SUMMIT深度學(xué)習(xí)開發(fā)者大會(huì)上宣布文心一言用戶規(guī)模已突破1億。

當(dāng)時(shí)的李彥宏說:文心一言將改變?cè)朴?jì)算游戲規(guī)則。

百度高管誠實(shí)表示文心一言還不夠成熟之時(shí),百度股價(jià)應(yīng)聲而落:李彥宏誠實(shí)指出,自己體驗(yàn)時(shí)并不完美,這類大語言模型還遠(yuǎn)未到發(fā)展完善的階段;百度首席技術(shù)官王海峰也提到模型目前“訓(xùn)練不夠充分”。

2025年的今天,文心一言好像也沒有突破以上“不完美”,于是我向他提了這個(gè)問題。文心一言回答了我很多,其中它總結(jié)說“雖然作為早期AI語言模型的我具有一定的歷史地位,但在技術(shù)和應(yīng)用不斷發(fā)展的背景下,后來的A語言模型確實(shí)在很多方面取得了顯著的優(yōu)勢(shì)。”

圖片

      02

很早卻很后

盡管“起大早”,但“文心一言”是否真的領(lǐng)先?

百度深耕AI領(lǐng)域十余年,從底層的高端芯片昆侖芯,到飛槳深度學(xué)習(xí)框架,再到文心預(yù)訓(xùn)練大模型,到搜索、智能云、自動(dòng)駕駛、小度等應(yīng)用,形成了全球范圍內(nèi)少有的在“芯片-框架-模型-應(yīng)用”的IT四層技術(shù)棧架構(gòu),并且各個(gè)層面都有領(lǐng)先業(yè)界的自研技術(shù)和產(chǎn)品。

從優(yōu)勢(shì)來看,文心一言背靠百度強(qiáng)大數(shù)據(jù)和技術(shù)積累,擁有海量中文語料庫,在中文理解方面具有一定優(yōu)勢(shì)。剛才提到它擁有超過600家合作伙伴,百度根式積極布局應(yīng)用生態(tài),與多家企業(yè)合作,推動(dòng)產(chǎn)品落地。

算力芯片,是至關(guān)重要的。2021年6月,百度智能芯片及架構(gòu)部門完成獨(dú)立融資,成立昆侖芯(北京)科技有限公司,首輪估值約130億元,百度芯片首席架構(gòu)師歐陽劍出任昆侖芯公司CEO。在此之前一年,百度已經(jīng)試產(chǎn)了第一代云端通用人工智能計(jì)算處理器“昆侖1”芯片,這在當(dāng)時(shí)國內(nèi)唯一一款經(jīng)歷過互聯(lián)網(wǎng)大規(guī)模核心算法考驗(yàn)的云端AI芯片。在芯片部門獨(dú)立融資兩個(gè)月后,百度就宣布第二代昆侖芯片“昆侖2”正式量產(chǎn)。

不難看出,百度在AI領(lǐng)域的布局極為宏大,野心勃勃。“文心一言”不過是基于百度文心大模型展開研發(fā)進(jìn)程中的一個(gè)微小環(huán)節(jié)。從百度文心官網(wǎng)呈現(xiàn)的內(nèi)容便能窺知一二,在文心大模型的整體規(guī)劃里,對(duì)話功能僅僅占據(jù)了極小的一部分。不妨設(shè)想一下,倘若沒有ChatGPT突如其來地在全球范圍內(nèi)掀起巨大波瀾,引發(fā)廣泛關(guān)注,也許“文心一言”還會(huì)在項(xiàng)目排期表上沉寂許久,許久都難有問世的機(jī)會(huì)。

反觀DeepSeek,成功好像不是偶然。

從最直觀的下載量來看,DeepSeek在140個(gè)市場(chǎng)的應(yīng)用商店下載排行榜上居首位,短短18天,下載量達(dá)到1600萬次,超過ChatGPT同期表現(xiàn)。

DeepSeek - R1模型訓(xùn)練使用了約2000個(gè)英偉達(dá)專用芯片,能充分利用英偉達(dá)芯片強(qiáng)大的并行計(jì)算能力和CUDA生態(tài)系統(tǒng),實(shí)現(xiàn)高效的深度學(xué)習(xí)計(jì)算。在硬件適配方面,DeepSeek也在積極探索與國產(chǎn)硬件的結(jié)合,如昇騰、海光等芯片,稀疏計(jì)算等技術(shù)使其在國產(chǎn)硬件上也能有較好的性能表現(xiàn),降低了對(duì)特定國外芯片的依賴。

由于其創(chuàng)新的架構(gòu)設(shè)計(jì)和訓(xùn)練策略,DeepSeek在推理等任務(wù)中對(duì)芯片的需求相對(duì)靈活,訓(xùn)練時(shí)僅需百卡級(jí)規(guī)模。

除了DeepSeek,可靈、即夢(mèng)、豆包這些平臺(tái)可能采用輕量化模型或定制化架構(gòu),注重交互體驗(yàn)和特定場(chǎng)景的優(yōu)化(如創(chuàng)意生成、對(duì)話交互)?偟膩砜,DeepSeek 適合復(fù)雜任務(wù)和技術(shù)場(chǎng)景。文心一言在中文處理和文化理解上表現(xiàn)突出?伸`、即夢(mèng)、豆包更適合創(chuàng)意生成和輕量級(jí)交互。

03

百度,能趕上晚集嗎?

追求短期商業(yè)化,忽視技術(shù)深度研發(fā),是網(wǎng)友在文心一言宣布開源之前對(duì)它的評(píng)價(jià)。

文心一言的不足確實(shí)很明顯,在技術(shù)層面與領(lǐng)先模型相比,在邏輯推理、創(chuàng)造性文本生成等方面存在差距。在應(yīng)用層面,實(shí)際應(yīng)用場(chǎng)景有限,用戶體驗(yàn)有待提升,缺乏現(xiàn)象級(jí)應(yīng)用案例。在生態(tài)層面,開源生態(tài)建設(shè)滯后,開發(fā)者社區(qū)活躍度不高。

而百度文心一言宣布將于4月1日零時(shí)起取消收費(fèi)限制,向所有用戶開放其最新模型及全部高級(jí)功能,這一決策標(biāo)志著國產(chǎn)大模型服務(wù)正式進(jìn)入普惠化階段。

文心一言還同步上線了深度搜索功能。這項(xiàng)新功能具備更強(qiáng)大的思考規(guī)劃能力和工具調(diào)用能力,能夠?yàn)橛脩籼峁⿲<壹?jí)的內(nèi)容回復(fù),并可以處理多場(chǎng)景任務(wù),實(shí)現(xiàn)多模態(tài)的輸入與輸出。目前,用戶可以在文心一言官網(wǎng)率先體驗(yàn)這一功能,移動(dòng)端App的相關(guān)功能也將很快推出。

這一舉措不僅體現(xiàn)了文心大模型在技術(shù)迭代和成本優(yōu)化方面取得的突破,更展現(xiàn)出百度在AI領(lǐng)域的戰(zhàn)略布局和市場(chǎng)競(jìng)爭決心。隨著免費(fèi)開放政策的實(shí)施,AI技術(shù)的應(yīng)用門檻將進(jìn)一步降低,這對(duì)推動(dòng)人工智能技術(shù)的普及和創(chuàng)新發(fā)展具有重要意義。

圖片

李彥宏本是大模型閉源的支持者。在2024世界人工智能大會(huì)等場(chǎng)合,他多次表達(dá)了對(duì)閉源大模型的支持觀點(diǎn)。

從性能和成本角度來看,李彥宏認(rèn)為同樣參數(shù)規(guī)模下,開源模型能力不如閉源,開源模型若想追平閉源,需要更大參數(shù)規(guī)模,這意味著推理成本更高、反應(yīng)速度更慢。而閉源模型通常由專業(yè)團(tuán)隊(duì)針對(duì)特定用途優(yōu)化,與專門硬件緊密集成,可實(shí)現(xiàn)規(guī)模經(jīng)濟(jì),推理成本更低。

盡管他認(rèn)為開源大模型在學(xué)術(shù)研究、教學(xué)領(lǐng)域等特定場(chǎng)景下有存在的價(jià)值,但在激烈的商業(yè)競(jìng)爭環(huán)境中,需要讓業(yè)務(wù)效率比同行更高、成本比同行更低,這時(shí)商業(yè)化的閉源模型是最能打的。

李彥宏曾表示,閉源才有真正的商業(yè)模式,才能聚集人才和算力,優(yōu)秀人才會(huì)更傾向于選擇閉源模型的團(tuán)隊(duì),因?yàn)殚]源可以提供更好的資源和發(fā)展空間。

DeepSeek等的崛起給文心一言帶來一定壓力,而開源可吸引更多開發(fā)者和用戶,提升百度在市場(chǎng)中的競(jìng)爭力。另一方面,隨著技術(shù)發(fā)展,大模型推理成本大幅下降,百度有條件進(jìn)行開源,推動(dòng)技術(shù)更廣泛應(yīng)用。

AI是否也將走向價(jià)格戰(zhàn)?文心一言同步宣布免費(fèi)的還有OpenAI。北京時(shí)間2月13日凌晨3點(diǎn),OpenAI首席執(zhí)行官Sam Altman也公布了GPT-4.5/5將很快陸續(xù)發(fā)布,免費(fèi)版ChatGPT將在標(biāo)準(zhǔn)智能設(shè)置下無限制使用GPT-5進(jìn)行對(duì)話。據(jù)悉,OpenAI很快發(fā)布GPT-4.5,就是傳說中的獵戶座模型(Orion),也是最后一個(gè)非思維鏈模型。接著會(huì)整合GPT和O系列兩大模型打造一個(gè)全新的系統(tǒng),能自動(dòng)選擇思考和非思考功能,適用于多種任務(wù)。奧爾特曼稱,這將是OpenAI最后一個(gè)“非思維鏈模型”。與o3及OpenAI其他推理模型不同,非思維鏈模型在數(shù)學(xué)和物理等領(lǐng)域往往不太可靠。

推動(dòng)兩大閉源模型的DeepSeek是這么看文心一言的翻盤的:

圖片

百度系股票應(yīng)聲大漲,對(duì)企業(yè)級(jí)用戶大面積部署可謂利好,但能否成為李彥宏口中的超級(jí)應(yīng)用?讓我們拭目以待。

       原文標(biāo)題 : 大模型爆火,文心一言起大早,趕晚集?

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)