訂閱
糾錯
加入自媒體

文心一言,開幕?

2023-03-22 15:46
極新
關(guān)注

ChatGPT API上線,

文心一言希望滿滿。

文|王凡 & 秦怡

編輯 | 小白

出品|極新

01

大模型帶來的商業(yè)機會天花板在哪里

就像李彥宏在大屏上展示的內(nèi)容里,大模型帶來的商業(yè)機會天花板吸引了諸多目光。在文心一言的帶動下,“三把尖刀”的發(fā)展值得期待。首先是新型云計算公司的未來將不會遙遠。文心一言將根本性地改變云計算行業(yè)的游戲規(guī)則,MaaS(Model as a service模型即服務(wù))可以稱得上是為專用模型給垂直客戶提供服務(wù)的新窗口。如果把云計算公司視為一輛汽車,那么Maas的發(fā)展可以被視為其核心動力,客戶也將會注重這輛汽車的實踐表現(xiàn)。在未來文心一言企圖通過百度智能云構(gòu)建企業(yè)模型,對外提供服務(wù),讓AI與云計算的模式助力多元行業(yè)迭代升級,突出對于產(chǎn)業(yè)空間的可操作性。

其余兩把尖刀就是行業(yè)模型精調(diào)的公司以及基于大模型底座進行應(yīng)用開發(fā)的公司。前者處于模型層與應(yīng)用層的中間位置,其行業(yè)服務(wù)能力影響著客戶的實際需求能否真正得到滿足,后者主要是針對在AIGC背景下應(yīng)運而生的“破殼企業(yè)”提供應(yīng)用服務(wù),其發(fā)展能力自然不必多言。

02

真刀實槍,還是空穴來風

目前,AIGC 產(chǎn)業(yè)生態(tài)體系雛形初現(xiàn),基礎(chǔ)層、中間層、應(yīng)用層三層架構(gòu)層層相扣。以高門檻的預(yù)訓(xùn)練模型為基礎(chǔ)搭建的 AIGC,技術(shù)基礎(chǔ)層正是核心所在。在基礎(chǔ)層足夠堅實之后,大模型的垂直場景化模型開發(fā)將更加順暢,ChatGPT-4展現(xiàn)出來的超然能力讓它在大模型發(fā)展方面傲視群雄,尤其是在編程方面的“獨家竅門”更是創(chuàng)造了新燃點。

對比ChatGPT-4,李彥宏在文心一言的“編程方面”似乎顯得不那么自信,這一點并沒有在現(xiàn)場展示,這似乎也意味著文心一言的能力局限。在中文世界里,大量強大的互聯(lián)網(wǎng)公司并沒有滋生出Github這種高質(zhì)量的全門類代碼倉庫,這也成了百度的痛點。與前輩們相比,文心一言的創(chuàng)作能力、RLHF訓(xùn)練的強度、RL模型選擇、多模態(tài)的工程細節(jié)方面還需要打磨。參數(shù)和數(shù)據(jù)訓(xùn)練的頻次是否到位,基于人類反饋的強化學習算法是否能夠精準,將 NLP 技術(shù)和機器學習結(jié)合的能力是否足夠科學化,大語言模型商業(yè)化對于C端是否足夠友好,這都是李彥宏需要考慮的問題。

OpenAI發(fā)展多年,ChatGPT-4發(fā)布的迅速和準備的成熟度證實了其很顯然不是工程縫合的產(chǎn)物,對比之下,百度的倉促有些令人感慨。

03

文心一言,是橫空出世還是醞釀已久

雖然如同李彥宏描述的那樣,文心一言要走的路還很長。但是我們不能否認百度在模型訓(xùn)練方面得天獨厚的優(yōu)勢。作為百度基于其文心大模型技術(shù)推出的大語言模型,文心一言可謂是在關(guān)愛下長成的“溫室花朵”——如百度知道、百度文庫、百度知識圖譜、百度搜索等百度旗下多款應(yīng)用均能有效支撐大模型的訓(xùn)練與迭代,為助力文心大模型快速成長為全球領(lǐng)先的大模型提供著充足的養(yǎng)料。

百度打出的這一槍,說突然也突然, 現(xiàn)場采用錄制而非直接嘗試,甚至有小道消息“用人工推進人工智能,在文心一言運行出錯的時候員工要頂住”,引起一片嘩然;但是,說正常也正常,一方面是因為十年磨一劍,霜刃未曾試,百度已經(jīng)在這里傾注了大量的心血;另一方面是虎視眈眈的競爭對手:微軟已經(jīng)宣布在 Bing 搜索、Azure 云服務(wù)、Teams 等產(chǎn)品中加入 ChatGPT 技術(shù),并期待在 Office 套件中也集成 ChatGPT;谷歌基于 LaMDA 模型推出 ChatGPT 的競品Bard,Meta官宣將開源新的范圍從 70 億到 650 億參數(shù)的大預(yù)言模型 LLaMA……面對重重壓力,百度希望“橫空出世”也情有可原。

04

文心一言還有多少時間?

百度的發(fā)布會觀眾買賬程度并不高,議論紛紛,這與文心一言所處的環(huán)境有關(guān),目前中文 NLP 數(shù)據(jù)集稀缺、質(zhì)量參差不齊,中文互聯(lián)網(wǎng)的發(fā)展并不等價于高質(zhì)量的語言積累,在展示上也顯示出中文大語言模型發(fā)展緩慢的缺陷,這正是百度的本質(zhì)缺陷。

但是,這樣的環(huán)境也給了文心一言新的發(fā)展空間,在發(fā)布會上對于古詩創(chuàng)造的能力,各類評測上對于中文語言的理解都不遜色于ChatGPT-4。當然,文心一言的發(fā)布會上,最動人心弦的一幕應(yīng)該是視頻的生成,盡管時間很短,也不會直接向用戶開放,但是也跨出了新的一步——未來的大模型的輸入輸出將是多元多樣的,文字對話,圖像、音頻、視頻等多種形式或許都會成為可能。相較于DALL-E 2 從文字生成圖片,以及Make-A-Video 從文字生成視頻,文心一言似乎邁出了更遠的一小步,這也意味著用戶的期待,就是潛力的所在。

“文心一言”目前包含以下五類落地場景:文學創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理邏輯推送、中文理解、多模態(tài)生成。對于百度而言,技術(shù)從未止步,2010年百度CTO王海峰成立自然語言處理部,2019年就推出了文心大語言模型,2012年百度的飛槳深度學習平臺研發(fā)了4D混合并行技術(shù),2022 年百度核心研發(fā)費用超200 億元,百度在爬蟲技術(shù)、搜索技術(shù)以及占有搜索數(shù)據(jù)量上面的優(yōu)勢依然為其爭取了喘息時間,在高時效性高準確性的團隊運營理念下,深耕AI領(lǐng)域多年的百度應(yīng)該不會造出一款“胡編亂造”的新產(chǎn)品,李彥宏其實從未放松對于超大規(guī)模模型的訓(xùn)練處理的追逐。

05

C端唱衰,但是B端還有余地

表現(xiàn)平平的發(fā)布會甚至影響了百度股價;但是B端熱情不減,企業(yè)對調(diào)用文心一言接口抱有期待,認為其還是大有可為。目前,醫(yī)療、教育、互聯(lián)網(wǎng)、銀行等各領(lǐng)域為文心一言的投資已經(jīng)成為現(xiàn)實,例如郵儲銀行通過“郵儲大腦”接入并應(yīng)用“文心一言”的能力,吉利汽車應(yīng)用在其銀河的全新智能座艙系統(tǒng)的人工智能交流對話領(lǐng)域;能鏈智電將智能對話接入能源供應(yīng)鏈、資產(chǎn)管理、零售等場景。辦公軟件、OA、ERP 等企業(yè)日常管理經(jīng)營必備系統(tǒng)也同樣期待著文心一言的發(fā)展帶給他們新的紅利。

對待文心一言的發(fā)展,有幾個問題至關(guān)重要,也是B端投資者極為關(guān)注的問題:首先,對于信息特別是數(shù)據(jù)自身的關(guān)聯(lián),其能否建立背后的邏輯;其次,文心一言能不能在可預(yù)見的未來提供獨特的洞見,而不僅僅只是一個更高級的傳聲筒;最后,更低門檻,面向場景研發(fā)更好的 AI 模型會不會生長成為一個普惠性的工具而不是象牙塔里的寶物。

唱紅或者是唱衰,百度和文心一言一直在路上,多年的積累與沉淀給了百度底氣,ChatGPT-4的發(fā)展也幫助文心一言做對照。讓我們一起拭目以待。

頭圖來源:unsplash

本文原創(chuàng):極新(jixintech)

       原文標題 : 文心一言,開幕?

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號