老汉tv永久视频福利在线观看,精品人妻少妇嫩草Av无码专区,久久久精品2025免费观看

文心一言，一言難盡

2023-03-21 15:11

趕鴨子上架的“百度”

ChatGPT以火箭般的速度爆紅，沉靜許久的中國科技圈和創(chuàng)投界的終于再次引發(fā)熱潮�；ヂ�(lián)網(wǎng)大佬王慧文自掏腰包、帶資建組，科技大廠摩拳擦掌、爭先恐后，創(chuàng)業(yè)公司也不遑多讓，甚至跟AI不搭邊的個別企業(yè)也借勢營銷，并因此而收獲一波股價的大漲。

但真正下場目前要發(fā)布產(chǎn)品就只有百度了。以AI技術(shù)見長，號稱過去10年在AI領(lǐng)域投入超過1100億元研發(fā)費用的百度，自然成為被關(guān)注的對象。是騾子是馬總要拉出來溜溜才行。

但巧合的是，OpenAI于3月15日發(fā)布GPT-4瞬間火爆全網(wǎng)，但已經(jīng)定下3月16日發(fā)布的百度總不能推遲日子，說好的對標(biāo)ChatGPT呢？

但想象中的百度版ChatGPT沒來，“ChatPPT”倒是來了。發(fā)布會的演示最重點的就是實際使用的演示，從喬布斯的年代開始都是如此。老羅的李姐萬歲言猶在耳。百度這次選擇了全錄制，很難不讓人聯(lián)想到是擔(dān)心出現(xiàn)老羅一樣的事故，也就代表著有很強烈的不自信；當(dāng)然也可能是被 Google 演示的小錯誤事故嚇怕了。

發(fā)布會現(xiàn)場，李彥宏用提前錄制好的視頻展示了文心一言的文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理邏輯推算、中文理解、多模態(tài)生成等五方面功能。在錄制好的視頻里，文心一言幫劉慈欣續(xù)寫了《三體》，介紹了洛陽紙貴背后的經(jīng)濟學(xué)原理，算了雞兔同籠數(shù)學(xué)題，根據(jù)指令生成了海報和一段宣傳視頻。

但是明顯進步的GPT-4在昨天已經(jīng)拉高了群眾期待，你百度遮遮掩掩拿一個半成品算怎么回事呢？資本市場可不管你什么網(wǎng)絡(luò)原因，先跑為敬所以百度發(fā)布會當(dāng)天一度跌停。

百度這次發(fā)布會，有著很明顯是背著很重的銷售 KPI 包袱的，在聊后面的部分，都是 toB 銷售的話術(shù)，講技術(shù)的抽象概念和商業(yè)合作的價值。這就跟OpenAI大篇幅講產(chǎn)品形成了鮮明對比，觀感不好還是其次，沒講好產(chǎn)品那就是加負(fù)分了。

錄播的文心一言就一定不行嗎

根據(jù)多家媒體對文心一言的試用綜合來看，與預(yù)期相比，百度文心一言還是能夠及格的。雖然與搭載 Chat GPT 的 Bing 稍微有一些差距，但差距不是特別大，在中文常識上，文心一言是強于 Bing 的，但在英文內(nèi)容和邏輯推理上是弱于Bing。

對于“文心一言”的產(chǎn)品表現(xiàn)，百度創(chuàng)始人李彥宏略顯底氣不足，在發(fā)布會剛出場不久，就開始主動降低用戶預(yù)期。他說道，“要對標(biāo) ChatGPT、甚至 GPT-4，門檻還是很高的”、“自己測試還是感覺有很多不完美的地方”。

文心一言確實還不如ChatGPT，但總要客觀認(rèn)識到我們今天所說的 ChatGPT，或者其背后的 GPT-4 語言模型，是一個花了 5 年時間、經(jīng)歷了 4 次迭代，完成了從量變到質(zhì)變過程。想讓文心一言在幾個月這么短的時間內(nèi)實現(xiàn)趕超，幾乎是不可能的事情。

不過就目前而言有大語言模型可用比好不好用更重要，只要基本框架打好后面就只需要堆疊豐富的語料和模型校正，好用起來那只是時間問題。在筆者看來雖然目前已經(jīng)聲稱要做中國版Chat GPT的很多，比如騰訊的混元AI大模型、京東的Chat JD等等，但真正在AI在內(nèi)容上有長期大投入還是百度，如果百度都做不出來其他家希望就不大了。

目前來看文心一言不至于讓用戶很失望，更何況谷歌聲勢浩大的Bard不一樣不盡人意。拿這點批評中美科技差距過大是有點過了。

做大模型，前提是有資金的投入。OpenAI 在 2019 年獲得微軟 10 億美金的投入后，又于今年獲得了微軟 100 億美金的投資，這讓其有了燒錢的資本。業(yè)界測算， GPT-3 涉及 1750 億參數(shù)，訓(xùn)練費用約花費 1200 萬美元。據(jù)國盛證券報告估算， GPT-3 訓(xùn)練一次成本約為 140 萬美元，每一次訓(xùn)練任務(wù)都耗資巨大。

此外，大模型訓(xùn)練的三要素包括大算力、大數(shù)據(jù)和大模型。有從業(yè)者指出，影響最后訓(xùn)練結(jié)果的因素有很多，包括清洗、標(biāo)注、模型結(jié)構(gòu)設(shè)計、訓(xùn)練推理的技術(shù)積累等。每一個因素的變化都影響著最后的結(jié)果。

過去十幾年里百度一直在 AI 方面投入，包括 2019 年推出文心大語言模型。2022 年百度核心研發(fā)費用達(dá)到 214.16 億元，占百度核心收入比例達(dá) 22.4%。但是，百度和 OpenAI 還有不小差距。李彥宏也直言，無論是哪家公司，都不可能靠突擊幾個月就能做出這樣的大語言模型。因為深度學(xué)習(xí)、自然語言處理，需要多年的堅持和積累，沒法速成。

百度想要做什么

在國內(nèi)一級市場上，投資機構(gòu)為了投大模型公司，焦慮難安，行業(yè)幾乎每天都會有大量認(rèn)知的迭代。與之相應(yīng)的是創(chuàng)業(yè)熱潮，前美團聯(lián)合創(chuàng)始人王慧文、出門問問 CEO 李志飛、前搜狗 CEO 王小川、前京東高級副總裁周伯文等一批大佬，都在殺向大模型賽道。國內(nèi)大廠們更是如此。除了百度之外，阿里、騰訊、華為、字節(jié)、科大訊飛、商湯都沒有放棄大模型之戰(zhàn)。大模型耗資巨大不是模型問題，“這是我的問題”，一些從業(yè)者這樣回答，也彰顯了他們急切想要在大模型領(lǐng)域做出一番成績。

對于百度來說這更是生死之戰(zhàn)，百度的營收結(jié)構(gòu)中廣告是大頭，而廣告又是極其依賴搜索的，如果搜索未來被GPT顛覆，那么百度就死無葬身之地了。

2022年全年，百度的營收和凈利潤均下滑。2022年，百度實現(xiàn)營收1236.75億元，同比下滑0.66%；歸母凈利潤75.59億元，同比下滑23.46%。

百度搜索引擎的市場份額已經(jīng)在加速下滑。市場調(diào)研機構(gòu)StatCounter數(shù)據(jù)顯示，從2022年1月至2023年1月，百度搜索引擎市場份額已經(jīng)從84.36%下降至65.21%。2022年全年，百度的廣告收入在每一個季度均出現(xiàn)同比下滑。數(shù)據(jù)顯示，百度2022年第一季度廣告收入同比下滑3.6%、第二季度為10%、第三季度為4%、第四季度為5.2%。如果All in AI不能成為新的增長曲線，百度恐怕連二線大廠的地位都難以守住。

目前來看，百度做大模型并不是毫無優(yōu)勢，技術(shù)面上，百度在中文NLP領(lǐng)域，無疑擁有先天優(yōu)勢。首先是對國內(nèi)技術(shù)政策的熟悉，令它比ChatGPT 更能滿足國內(nèi)市場需求。其次，作為最大的中文搜索引擎，百度擁有的高質(zhì)量數(shù)據(jù)集及中文數(shù)據(jù)收集能力，其他家難以比擬。

如果文心一言能夠成功，國內(nèi)流量是可以重新洗牌的。在國內(nèi)，百度搜索入口的流量長時間被移動互聯(lián)網(wǎng)其他流量怪獸一點點分流，而如今除了百度的移動生態(tài)，大的流量入口基本都掐在騰訊系（微信、QQ）、阿里系（支付寶、淘系）、字節(jié)系（抖音）手上；文心一言給了百度一個機會，但凡能有ChatGPT級別的表演，就有可能重新奪回流量。而生成式內(nèi)容也會豐富內(nèi)容生態(tài)與供給，讓百度的搜索業(yè)務(wù)，重新有其他可能性。

文心一言是百度搜索引擎實現(xiàn)“模糊搜索”到“精準(zhǔn)推送”跨越的關(guān)鍵。生成式AI問世之前，搜索引擎以“模糊搜索”為主，用戶需要根據(jù)在搜索引擎中打入關(guān)鍵字找到需要的內(nèi)容或鏈接，而通過文心一言，用戶可以通過自然語言交互的方式輕松獲得需要的內(nèi)容或鏈接，且內(nèi)容較為精準(zhǔn)，即“精準(zhǔn)推送”。與此同時，生成式內(nèi)容也會極大豐富內(nèi)容生態(tài)和內(nèi)容供給，讓成熟的搜索業(yè)務(wù)和搜索體驗煥發(fā)生機。相比抖音短視頻長時間大量試錯來做精準(zhǔn)營銷，Chat GPT類的精準(zhǔn)搜索無疑將會降低大量成本，這對廣告商來說非常具有吸引力。當(dāng)然，百度還要想清楚如何讓用戶接收到真正有價值的信息，而不僅僅是廣告信息，避免再次出現(xiàn)目前搜索引擎廣告業(yè)務(wù)的尷尬。

還有更重要的一點，文心一言的出現(xiàn)會加速百度通過人工智能技術(shù)賦能其他產(chǎn)業(yè)，從技術(shù)本身，基于百度文心大模型已經(jīng)產(chǎn)生了多款面向 C 端的單點產(chǎn)品，例如產(chǎn)業(yè)級搜索系統(tǒng)“文心百中”。

寫在最后

有投資人講中國要做Chat GPT要邁過三座大山，第一是資金山，微軟近些年共投入100億美元，國內(nèi)要做至少也要10億美元起步，這點對國內(nèi)大廠并不是特別困難。第二是工具限制芯片禁售難題，運行AI大模型需要大量GPU芯片——芯片上受的鉗制，又影響了做AI大模型。要想跑通一次100億以上參數(shù)量的模型，至少要做到“千卡/月”這個級別，即：用1000張GPU卡，然后訓(xùn)練一個月。

即使不用最先進的英偉達(dá)A100，按照一張GPU五萬元的均價計算，1000張GPU意味著單月5000萬的算力成本，這還沒算上算法工程師的工資。百度目前來看并沒有受到這個問題困擾，不知道是通過什么替代方案解決的。

第三是AI人才尤其是NLP領(lǐng)域的人才，國內(nèi)目前還是非常匱乏的，如今世界局勢、國內(nèi)財務(wù)自由前景都截然不同，如何讓人才“系統(tǒng)性回國”成為非常大的挑戰(zhàn)。這點國內(nèi)大廠要多動點腦筋不要遇事不決一直加薪。

所以想要做大模型做Chat GPT一定要想清楚，不要像元宇宙一樣風(fēng)口過后一地炮灰。

相比大多數(shù)企業(yè)都在關(guān)注GPT在語言上應(yīng)用，任正非則更關(guān)注對工業(yè)社會和農(nóng)業(yè)社會的促進，認(rèn)為未來98%的機會在這兩方面。ChatGPT對我們的機會是什么？它會把計算撐大，把管道流量撐大，這樣我們的產(chǎn)品就有市場需求。

任正非的話還是有一定道理的，工業(yè)對于AI的需求還是容易實現(xiàn)的強需求，對于眼下提升效率是實實在在可見的。變革的時代已經(jīng)來臨，創(chuàng)新已經(jīng)不是可選項而是必選項。

參考資料：

究竟是ChatGPT還是ChatPPT？來源：全天候科技

百度“文心一言”就這？來源：深燃

李彥宏，有一點急來源：商業(yè)人物

百度趕鴨子上架來源：鹽財經(jīng)

百度步谷歌后塵來源：甲子光年

文心一言發(fā)布我們拿到內(nèi)測賬號試了試來源：知危

為什么會對文心一言發(fā)布會失望來源：劉言飛語

ChatGPT真的是全村人的希望嗎來源：美股研究社

原文標(biāo)題 : 文心一言，一言難盡