訂閱
糾錯(cuò)
加入自媒體

大廠搶做ChatGPT,百度能否狂飆?

文丨光錐智能  周文斌

ChatGPT席卷全球,在中國(guó)疊加出了一個(gè)更強(qiáng)沖擊波。

如今,從市值千億的互聯(lián)網(wǎng)企業(yè)高管,到路邊賣菜的大爺大媽,大家都樂(lè)此不疲的在談?wù)揅hatGPT,比如事前讓它幫忙“算一卦”,或者聊聊誰(shuí)將被優(yōu)先替代。用網(wǎng)友的話說(shuō),ChatGPT出現(xiàn)之后,就像村里來(lái)了個(gè)免費(fèi)算命的。

當(dāng)然,要說(shuō)通用人工智能取代大部分人類的工作那肯定還比較遙遠(yuǎn),但它仍然在科技圈扔下了一枚原子彈。

在二級(jí)市場(chǎng),包括百度、網(wǎng)易有道、360等幾乎所有和ChatGPT沾上邊的企業(yè),股價(jià)都在近期拔地而起。而在股價(jià)高漲的背后,企業(yè)也都在試圖搭上ChatGPT這輛快車。

2月7日開始,百度率先宣布了自家類ChatGPT產(chǎn)品的名字,之后網(wǎng)易有道宣布在教育場(chǎng)景研發(fā)類ChatGPT技術(shù),阿里、騰訊、京東也都紛紛表態(tài)。

但從全球范圍來(lái)看,ChatGPT這顆原子彈還是率先在搜索引擎領(lǐng)域炸開。

比如微軟拿到ChatGPT之后的第一件事,就是將其和搜索引擎Bing結(jié)合,并且已經(jīng)在近期展開內(nèi)測(cè);谷歌也聞?dòng)嵍鴦?dòng),倉(cāng)促發(fā)布Bard,并也表示要在搜索領(lǐng)域落地。在國(guó)內(nèi),百度文心一言發(fā)布后,CEO李彥宏今年一季度的OKR也被媒體扒了出來(lái),寫著要“引領(lǐng)搜索體驗(yàn)的代際變革”。

除了搜索之外,ChatGPT的應(yīng)用也在向其他領(lǐng)域延伸,比如微軟計(jì)劃將其接入包括云業(yè)務(wù)在內(nèi)的所有產(chǎn)品線。百度文心一言發(fā)布后,小度隨后發(fā)布了首款搭載ChatGPT同源技術(shù)的平板產(chǎn)品。除此之外,以ChatGPT為代表的大模型在自動(dòng)駕駛、翻譯、文本撰寫等方面也都有落地。

顯而易見,AI將會(huì)逐漸波及到幾乎整個(gè)信息技術(shù)行業(yè)——讓所有的業(yè)務(wù)用AI重新做一遍。

而在中國(guó),百度是第一家公布類ChatGPT的公司,也是最大的搜索引擎公司。那么,在All in AI之后的第六年,ChatGPT來(lái)了,百度將會(huì)發(fā)生哪些變化?機(jī)遇和挑戰(zhàn),哪個(gè)對(duì)百度更多一些?

01 誰(shuí)能率先做出中國(guó)ChatGPT ?

2月7日,百度公布了自家類ChatGPT的產(chǎn)品名稱文心一言,成為ChatGPT席卷全球之后第一家跟進(jìn)相關(guān)產(chǎn)品的國(guó)內(nèi)企業(yè)。從這往后,網(wǎng)易有道、京東、阿里、騰訊紛紛表態(tài),相關(guān)計(jì)劃已提上日程。做一款類似ChatGPT的產(chǎn)品,成為當(dāng)前許多企業(yè)最緊迫的一件事情。

不過(guò),雖然現(xiàn)在投入類ChatGPT研發(fā)的企業(yè)如過(guò)江之鯽,但也有業(yè)內(nèi)人士指出,大多數(shù)做同類產(chǎn)品的企業(yè)只是在原有的產(chǎn)品里加入了一個(gè)BOT,因?yàn)椴⒉皇敲考夜径季邆渥约航ㄕZ(yǔ)料庫(kù)和特征工程的能力,畢竟做這件事情不僅花錢多,而且效果還不一定好。

所以這里面其實(shí)就涉及到一個(gè)問(wèn)題,即做一個(gè)類ChatGPT產(chǎn)品到底需要具備哪些底層能力。

比如ChatGPT基于GPT-3.5這個(gè)大語(yǔ)言模型訓(xùn)練,使用了約45TB數(shù)據(jù),包含約1萬(wàn)億個(gè)單詞的文本內(nèi)容。這些數(shù)據(jù)顯然不是從網(wǎng)上爬取下來(lái)就能用,有做模型訓(xùn)練的工程師就提到,他們之前訓(xùn)練模型時(shí)使用了某社交平臺(tái)的數(shù)據(jù),導(dǎo)致該模型“除了罵人什么都不會(huì)”。

所以對(duì)于模型訓(xùn)練來(lái)說(shuō),高質(zhì)量且大規(guī)模的數(shù)據(jù)來(lái)源本身就是一個(gè)問(wèn)題,而要訓(xùn)練如此大規(guī)模的數(shù)據(jù)也太燒錢,有數(shù)據(jù)顯示,GPT-3訓(xùn)練的硬件和電力成本就達(dá)到1200萬(wàn)美元。

這其實(shí)也是為什么OpenAI和Anthropic會(huì)分別接受微軟和谷歌投資的原因。除了背靠大樹好乘涼之外(給到充足的資金和落地場(chǎng)景),微軟、谷歌都分別和OpenAI、Anthropic簽訂了大型的云計(jì)算供應(yīng)合同。就像周鴻祎說(shuō)的:“這個(gè)東西最終還是要拼算力的!

除了算力的支持,ChatGPT的訓(xùn)練需要引入“人工標(biāo)注數(shù)據(jù)+強(qiáng)化學(xué)習(xí)”來(lái)不斷Fine-tune(微調(diào))預(yù)訓(xùn)練語(yǔ)言模型,以此來(lái)讓大語(yǔ)言模型(LLM)學(xué)會(huì)理解人類的命令指令的含義,以及讓LLM學(xué)會(huì)判斷對(duì)于給定的prompt輸入指令(用戶的問(wèn)題),給出什么樣的回答才是優(yōu)質(zhì)的。

整體上,這都反映了ChatGPT背后,對(duì)于大語(yǔ)言模型、數(shù)據(jù)來(lái)源、特征工程等更具體的工程性的問(wèn)題。所以就像張朝陽(yáng)在節(jié)目《星空下的對(duì)話》中一直堅(jiān)持的那樣,ChatGPT的產(chǎn)生,是從量變到質(zhì)變,它積累了很多年,絕對(duì)不是一個(gè)新企業(yè)進(jìn)去就能做好的技術(shù)。

那什么樣的企業(yè)更適合做中國(guó)的ChatGPT呢?周鴻祎的答案是有搜索業(yè)務(wù)的公司,他認(rèn)為做搜索的公司在這方面有許多優(yōu)勢(shì)。

比如在算力方面,做搜索的公司都有服務(wù)器集群。在數(shù)據(jù)積累和自然語(yǔ)言處理方面,搜索引擎本身需要每天在全網(wǎng)爬取所有的網(wǎng)頁(yè),而人類真正積累的知識(shí)庫(kù)就存在在這些網(wǎng)頁(yè)里;同時(shí)搜索本身就需要做大量的自然語(yǔ)言處理,和人類知識(shí)標(biāo)注,這些都是GPT模型必備的基礎(chǔ)。

“GPT模型做出來(lái)之后,它實(shí)際上像剛具備學(xué)習(xí)能力的小朋友一樣,并不會(huì)馬上表現(xiàn)出很強(qiáng)悍的智能,它需要用戶不斷的使用,而搜索引擎每天有巨大的用戶流量,有用戶每天的carry,有搜索詞可以對(duì)它進(jìn)行修正和持續(xù)不斷的訓(xùn)練,這個(gè)飛輪才能不斷的越轉(zhuǎn)越快!敝茗櫟t提到。

而回過(guò)頭來(lái),從搜索業(yè)務(wù)的角度來(lái)看,國(guó)內(nèi)做ChatGPT最有優(yōu)勢(shì)的自然是百度,作為看家本領(lǐng),百度搜索坐擁千億級(jí)全網(wǎng)索引,覆蓋超50億實(shí)體的中文知識(shí)圖譜。

此外,從2017年百度宣布All in AI到今天的6年多里,百度還建立了全棧AI技術(shù)構(gòu)架,百度將這樣的技術(shù)構(gòu)架分為四層,分別是芯片層、框架層、模型層和應(yīng)用層。

比如在底層算力層面,百度在2020年發(fā)布了第一塊專注于數(shù)據(jù)中心和云計(jì)算業(yè)務(wù)的量產(chǎn)AI芯片昆侖芯1代。目前,昆侖芯已經(jīng)量產(chǎn)了兩代,并達(dá)到數(shù)萬(wàn)片規(guī)模部署。

比如在框架層,百度飛槳深度學(xué)習(xí)平臺(tái)集深度學(xué)習(xí)核心框架、基礎(chǔ)模型庫(kù)、端到端開發(fā)套件和豐富的工具組件于一體,到2022年5月,飛槳官方支持的產(chǎn)業(yè)級(jí)開源算法模型超過(guò)500個(gè),發(fā)布了23個(gè)PP系列模型。到2022年12月,飛槳已匯聚 535 萬(wàn)開發(fā)者。

而基于飛槳深度學(xué)習(xí)平臺(tái),百度訓(xùn)練了文心大模型。在去年AI繪畫火熱的時(shí)候,百度基于文心大模型推出了AI繪畫平臺(tái)文心一格。

到2022年11月,文心已累計(jì)發(fā)布11個(gè)行業(yè)大模型,涵蓋電力、燃?xì)狻⒔鹑、航天、傳媒、城市、影視、制造、社科等領(lǐng)域,推動(dòng)行業(yè)的智能化轉(zhuǎn)型升級(jí),這也讓百度在大模型的應(yīng)用上積累了豐富的經(jīng)驗(yàn)。

整體上,從算力到應(yīng)用,百度在各個(gè)層面都有關(guān)鍵的自研技術(shù),這其實(shí)也是為什么百度能在ChatGPT上線僅僅兩個(gè)月后,就能迅速宣布推出自家的類ChatGPT大模型,并給出具體上線日期的原因。

有業(yè)內(nèi)頂尖的NLP專家對(duì)光錐智能表示,認(rèn)為百度的NLP能力在中國(guó)是最好的,但真正做出像ChatGPT同等水平的產(chǎn)品,可能至少還需要一年。不過(guò)百度已經(jīng)確認(rèn),文心一言“3月和大家正式見面”。

02 搜索對(duì)百度不只是防御戰(zhàn),更是一場(chǎng)攻堅(jiān)戰(zhàn)

正如最適合做“ChatGPT”的是搜索公司一樣,ChatGPT落地的第一戰(zhàn)也將從搜索展開。

比如微軟在“拿到”ChatGPT之后,第一件事就是將其與Bing搜索相結(jié)合,緊跟著谷歌也表示將推出類似的模型,并以“搜索伴侶”的形式使用。

在國(guó)內(nèi),百度發(fā)布文心一言的第二天,有媒體就扒出來(lái)了李彥宏2023年第一季度的OKR—“引領(lǐng)搜索體驗(yàn)的代際變革”。搜索,這個(gè)互聯(lián)網(wǎng)1.0時(shí)代的業(yè)務(wù)在人工智能時(shí)代被ChatGPT再次推到了風(fēng)口浪尖上。

作為第一家將搜索和ChatGPT結(jié)合的企業(yè),微軟目前已經(jīng)開放融合了ChatGPT的Bing的全球內(nèi)測(cè)。

新版本的Bing沒(méi)有搜索欄,取而代之的是一個(gè)寫著“向我提問(wèn)吧”的對(duì)話框,用戶可以在其中輸入問(wèn)題并展開對(duì)話。

和傳統(tǒng)搜索只能通過(guò)關(guān)鍵詞給出結(jié)果展示,然后由用戶自己在海量信息中篩查有效內(nèi)容不同,升級(jí)后的Bing可以幫助用戶完成這個(gè)信息篩選和內(nèi)容整理過(guò)程。

比如根據(jù)微軟發(fā)布會(huì)上的展示,用戶可以讓新版Bing編寫一份為期五天的墨西哥城旅行行程單并且轉(zhuǎn)化成一封電子郵件,隨后發(fā)送給他的家人。除此之外,在Bing給出的示例中,還涉及到包括做計(jì)劃安排、寫詩(shī)和創(chuàng)作故事、制定菜單、提供買車建議等等生活的方方面面。

如果說(shuō)上一代搜索引擎搜索的是信息,那升級(jí)后的搜索引擎搜索的就是知識(shí),并且可以通過(guò)這種方式,成為用戶的“全職助手”。

事實(shí)上,隨著移動(dòng)互聯(lián)網(wǎng)的發(fā)展越來(lái)越成熟,搜索作為PC互聯(lián)網(wǎng)時(shí)代的產(chǎn)品一直都面臨著許多挑戰(zhàn)。

比如移動(dòng)APP將互聯(lián)網(wǎng)的信息割裂成一個(gè)又一個(gè)孤島,在這樣的背景下,搜索變得越來(lái)越場(chǎng)景化,搜索需求也在被不斷分化。比如越來(lái)越多年輕人將小紅書作為搜索的第一選擇,同時(shí)微信、今日頭條、知乎、B站都有自己的獨(dú)特的信息和展現(xiàn)形式。

而隨著搜索的場(chǎng)景和需求被逐步解構(gòu),這塊業(yè)務(wù)放在公司整體估值上也通常會(huì)被低估。而目前,無(wú)論是百度還是谷歌,搜索業(yè)務(wù)在營(yíng)收中的占比都在60%左右,這其實(shí)也直接影響了百度和谷歌的估值。

但新一代產(chǎn)品的升級(jí),再次讓市場(chǎng)對(duì)搜索引擎可以應(yīng)用的場(chǎng)景有了更多期待,估值也自然水漲船高。一個(gè)最直接的表現(xiàn)是,在宣布自己類ChatGPT產(chǎn)品文心一言的名字之后,百度股價(jià)當(dāng)時(shí)就上漲的超13%。

圖:近3個(gè)月百度股價(jià)走勢(shì)

如今,隨著ChatGPT對(duì)傳統(tǒng)搜索能力的提升,“搜索”這個(gè)產(chǎn)品的定義也將被改寫,所以這不僅對(duì)百度來(lái)說(shuō)是一場(chǎng)“老樹煥新”的機(jī)會(huì),對(duì)于只在全球搜索市場(chǎng)占比2.46%的微軟必應(yīng)也是難得的一次開疆?dāng)U土的機(jī)會(huì)。

所以說(shuō),推出中國(guó)版ChatGPT,然后接入搜索,對(duì)于百度來(lái)說(shuō)不只是一場(chǎng)防御戰(zhàn),更是一場(chǎng)攻堅(jiān)戰(zhàn)。

03 用AI將傳統(tǒng)業(yè)務(wù)再做一遍

除了百度、微軟和谷歌之外,AI對(duì)企業(yè)的影響也越來(lái)越大。

1月27日,美版頭條BuzzFeed宣布使用ChatGPT來(lái)創(chuàng)作之后,股價(jià)在兩天里暴漲了306.94%。2月8日,網(wǎng)易有道宣布投入到ChatGPT同源技術(shù)在教育場(chǎng)景的落地研發(fā),當(dāng)前股價(jià)盤前漲超20%。

類似的例子還有很多,最近只要有公司宣布正在研發(fā)類ChatGPT的產(chǎn)品,無(wú)論是否有實(shí)際進(jìn)展,股市都會(huì)先漲為敬。

雖然這種現(xiàn)象背后有炒作和跟風(fēng)的因素,但這其實(shí)也宣告了一種潛在的變化,即二級(jí)市場(chǎng)的投資者對(duì)企業(yè)估值邏輯的改變。

在互聯(lián)網(wǎng)行業(yè)的估值邏輯里,我們通常更關(guān)注營(yíng)收、用戶規(guī)模、MAU等數(shù)據(jù)及其增速,但如今投資者更關(guān)心一家企業(yè)是否具備下一代技術(shù)能力。

而在這個(gè)時(shí)代,AI已經(jīng)被當(dāng)成底層技術(shù),被認(rèn)為是今后推動(dòng)企業(yè)發(fā)展的重要底層驅(qū)動(dòng)力。

而具體到百度、微軟或者谷歌這樣的企業(yè)來(lái)說(shuō),ChatGPT要改變的顯然不只是搜索,而是所有的業(yè)務(wù)線。

以百度為例,在云業(yè)務(wù)上,百度一直強(qiáng)調(diào)智能云的標(biāo)簽,其特點(diǎn)它能夠?qū)I的能力賦能到具體的場(chǎng)景中,比如實(shí)現(xiàn)某些具體場(chǎng)景的數(shù)據(jù)識(shí)別、清洗、分類的自動(dòng)化等等,并以此來(lái)提高效率。

如果百度智能云與百度文心一言結(jié)合,那使用百度智能云的企業(yè)就可以直接調(diào)用文心一言的能力來(lái)解決自己場(chǎng)景里的具體問(wèn)題。

這其實(shí)也是微軟為什么需要將ChatGPT接入它的Azure云服務(wù)中的原因。所以這其實(shí)代表一種趨勢(shì),即在未來(lái)的云業(yè)務(wù)中,競(jìng)爭(zhēng)將越來(lái)越聚焦智能,而不只是存儲(chǔ)帶寬和算力。

從最新的財(cái)報(bào)數(shù)據(jù)來(lái)看,百度2022年三季度核心收入為人民幣252億元,同比增長(zhǎng)2%。其中,廣告收入為人民幣187億元,相比第二季度增長(zhǎng)10%;非廣告收入為人民幣65億元,同比增長(zhǎng)25%,主要受百度智能云及其他AI驅(qū)動(dòng)業(yè)務(wù)的推動(dòng)。而隨著文心一言接入百度智能云,顯然這樣的驅(qū)動(dòng)力還將持續(xù)增長(zhǎng)。

除此之外,大模型也已經(jīng)成為自動(dòng)駕駛能力提升的核心驅(qū)動(dòng)力。

比如通過(guò)10億以上參數(shù)規(guī)模的大模型訓(xùn)練小模型,能夠顯著提高自動(dòng)駕駛的感知泛化能力。這種技術(shù)諸如特斯拉、毫末等自動(dòng)駕駛企業(yè)都在應(yīng)用。

具體到百度而言,百度自動(dòng)駕駛基于文心大模型數(shù)千種物體識(shí)別能力訓(xùn)練的圖文弱監(jiān)督預(yù)訓(xùn)練模型,能夠大幅擴(kuò)充自動(dòng)駕駛語(yǔ)義識(shí)別數(shù)據(jù),如特殊車輛(消防車、救護(hù)車)識(shí)別、塑料袋等,自動(dòng)駕駛長(zhǎng)尾問(wèn)題解決效率指數(shù)級(jí)提升。

截至2022年第三季度末,百度Apollo自動(dòng)駕駛出行服務(wù)平臺(tái)“蘿卜快跑”向公眾提供的乘車次數(shù)已累計(jì)達(dá)到140萬(wàn),是全世界最大的自動(dòng)駕駛出行服務(wù)商。而隨著文心一言在百度自動(dòng)駕駛方面的應(yīng)用,或?qū)⒓铀偻七M(jìn)百度自動(dòng)駕駛的落地和服務(wù)的增長(zhǎng)。

除了智能云和駕駛業(yè)務(wù)外,百度的一些創(chuàng)新業(yè)務(wù)也將受到類ChatGPT產(chǎn)品的影響。

比如小度智能音箱,根據(jù)RUNTO1月份發(fā)布的2022年中國(guó)智能音箱市場(chǎng)調(diào)研報(bào)告數(shù)據(jù),2022年中國(guó)智能音箱綜合全年銷量?jī)H2631萬(wàn)臺(tái),同比下降達(dá) 28%。

對(duì)于智能音箱,許多購(gòu)買過(guò)的用戶都表示更像一個(gè)雞肋,所謂的智能更像是一個(gè)“智障”。而且相比于其他電子產(chǎn)品,當(dāng)前不同品牌之間的智能音箱功能基本雷同,也沒(méi)有太多革命式的創(chuàng)新可以刺激消費(fèi)者換代。

而類ChatGPT應(yīng)用出來(lái)之后,與智能音箱結(jié)合必然會(huì)變得更加智能,而有作為私人秘書一樣的ChatGPT作為樣例,智能音箱必然也將打開更多剛性的需求場(chǎng)景。

比如百度旗下的小度音箱在2月8日就已經(jīng)宣布推出旗下首款搭載ChatGPT同源技術(shù)的教育硬件產(chǎn)品—小度光學(xué)護(hù)眼學(xué)習(xí)平板。使用這款新的產(chǎn)品用戶可以體驗(yàn)作文批改和主動(dòng)潤(rùn)色等AI功能。

據(jù)了解,用戶在該產(chǎn)品上已經(jīng)可以體驗(yàn)作文批改和主動(dòng)潤(rùn)色等AI功能,更多基于ChatGPT同源技術(shù)的功能和體驗(yàn)后續(xù)將在該產(chǎn)品陸續(xù)上線。

就像小冰公司CEO李笛所言,對(duì)于科技企業(yè)來(lái)說(shuō),它的商業(yè)格局由它的技術(shù)創(chuàng)新所代表,這在全球范圍內(nèi)都一樣。大模型的出現(xiàn)打破了之前已經(jīng)進(jìn)入瓶頸的商業(yè)格局,大模型代表一種新的思想,如果你使用,就有可能抓住未來(lái)幾年集中的創(chuàng)新,如果不使用,你就可能在這個(gè)新的時(shí)代落后了。

如今,行業(yè)結(jié)合ChatGPT已經(jīng)成為一種趨勢(shì),比如有廣告公司已經(jīng)開始使用ChatGPT撰寫營(yíng)銷文案,有新聞網(wǎng)站開始使用ChatGPT編寫新聞等等。

比如2月14日,包括澎湃新聞、每日經(jīng)濟(jì)新聞、重慶日?qǐng)?bào)報(bào)業(yè)集團(tuán)在內(nèi)的7家傳媒巨頭同時(shí)宣布將全面體驗(yàn)并接入文心一言的能力。

作為文心一言首批生態(tài)合作伙伴,這些媒體或能借助AI的能力,在智慧內(nèi)容、數(shù)字文傳、產(chǎn)教融合、智能營(yíng)銷等方面實(shí)現(xiàn)產(chǎn)品和內(nèi)容創(chuàng)新,并帶來(lái)顛覆式變化。而顯然,未來(lái)這樣的生態(tài)還將擴(kuò)展到更多的行業(yè)。

就像20年前互聯(lián)網(wǎng)可以將傳統(tǒng)行業(yè)重做一遍一樣,未來(lái)AI也將重塑目前大多數(shù)行業(yè),這個(gè)過(guò)程中,許多商業(yè)價(jià)值也將得到挖掘。而當(dāng)AI的潛力在具體的業(yè)務(wù)上得到發(fā)掘,如百度、微軟、谷歌等企業(yè)價(jià)值也將面臨重估。

市值排行榜或?qū)⒚媾R一次新的洗牌也猶未可知。

       原文標(biāo)題 : 大廠搶做ChatGPT,百度能否狂飆?

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)