文心一言免費(fèi)!DeepSeek迎來最大對手,大模型將全面落地
文心一言官宣免費(fèi)了。
2月13日,百度官方宣布文心一言將于4月1日0時全面免費(fèi),所有PC端和App端用戶可以免費(fèi)使用旗下最新的模型。2023年11月1日,百度推出文心一言專業(yè)版,連續(xù)包月價格為49.9元,是中國AI巨頭中首家面向C端推出付費(fèi)服務(wù)的大模型產(chǎn)品。時隔516天后,文心一言終于宣布全面免費(fèi)。
(圖源:文心一言)
就在官宣免費(fèi)前不久,百度創(chuàng)始人兼首席執(zhí)行官李彥宏在談及DeepSeek對AI行業(yè)的沖擊時,大方表示沒有被震驚,甚至還要加大創(chuàng)新力度。“這是一個非常激動人心的時刻,我們到處都能看到創(chuàng)新,我們必須適應(yīng)這種快速變化的創(chuàng)新”,李彥宏接受采訪時回應(yīng)道。
DeepSeek的到來的確讓與AI相關(guān)的行業(yè)全面地震,一方面,它代表著中國AI大模型站在了世界的前列,無論是思維模式的創(chuàng)新性,還是落地實(shí)踐的實(shí)用性;另一方面,它讓投資者與硬件開發(fā)商看到了AI大模型的另一種方向,即便不需要豪擲千金,也能獲得不錯的效果。
更重要的是,DeepSeek完全免費(fèi),面對C端消費(fèi)者,我們可以隨時隨地免費(fèi)地使用其最新的大模型。這與此前正在焦慮如何通過大模型C端產(chǎn)品實(shí)現(xiàn)盈利的巨頭們完全背道而馳,比如OpenAI。
如今,文心一言徹底免費(fèi),擁有強(qiáng)悍推理、理解、記憶和邏輯能力的文心4.0 Turbo也將面向所有普通用戶開放。這也意味著,文心一言與DeepSeek之間的戰(zhàn)爭,正式拉開序幕。
免費(fèi)開放后,文心一言會如付費(fèi)階段好用嗎?
文心一言目前面向C端的大模型產(chǎn)品主要分為四個,分別是文心3.5、文心4.0、文心4.0 Turbo和文心4.0工具版。其中文心3.5為免費(fèi)開放,后三個模型都需要開通VIP獲得使用權(quán)限。
此前,文心一言VIP價格為59.9元連續(xù)包月、588.8元連續(xù)包年。與其官方的對標(biāo)產(chǎn)品GPT Plus相比,這個價格已經(jīng)非常合理。但在今年4月1日之后,包括文心4.0、文心4.0 Turbo、文心4.0工具版在內(nèi),全都免費(fèi)開放。
但很多用戶可能會疑惑,文心3.5和需要付費(fèi)的文心4.0 Turbo,究竟差別有多大呢?為了讓各位提前看到即將免費(fèi)開放的文心一言VIP服務(wù),小雷給它們來了個對比測試。
首先,我們拋出了一個最簡單的語言類問題:
我也想過過過兒的生活。
“過兒”,其實(shí)就是金庸小說《神雕俠侶》的人物楊過,作為男主角,他與姑姑的愛情故事可以稱得上是武俠小說歷史上的經(jīng)典情節(jié)之一。那么這個問題其實(shí)最重要的就是AI會如何理解“過過”和“過兒”這樣的語言組織關(guān)系。
(圖源:雷科技制圖/文心3.5)
文心3.5和文心4.0 Turbo都能明確了解這句話的實(shí)際含義,但通過思考后,給出的建議卻有些不同。文心3.5真的推薦了一些武術(shù)課程和身體鍛煉的方式,想要幫助小雷成為一名“大俠”。但從實(shí)際角度出發(fā),這樣的建議其實(shí)不太合理。而文心4.0 Turbo則建議小雷可以從精神角度做一名大俠,即便無法和楊過一樣獲得超群的武藝,也能學(xué)會他行為處事作風(fēng)。
(圖源:雷科技制圖/文心4.0 Turbo)
而到了推理環(huán)節(jié),文心4.0 Turbo的優(yōu)勢就更加明顯了。
我們準(zhǔn)備了一個邏輯推理問題,需要從中判斷出小明在哪一天說了實(shí)話。
我的同桌小明特別喜歡撒謊,而且他也是一個奇怪的人:在一個星期中(連續(xù)的七天,首日不一定是周一或周日),他有6天都始終在撒謊,但是總會有一天,他說的所有話都是實(shí)話。有一次,我收錄了他在一個星期中連續(xù)三天所說的話。 第一天:在星期一和星期二我都會說謊話。 第二天:今天要么是星期六,星期四或者星期天。 第三天:在星期三和星期五我都會說謊話。 通過這些,我知道了小明會在哪一天說實(shí)話。你知道了嗎?
在推理速度上,文心4.0 Turbo節(jié)奏明顯要快很多,只做了四次假設(shè),回溯問題后就做出了判斷,最終給出的答案是小明在第三天(星期二)說了實(shí)話,而這個回答也的確是正確回答。
(圖源:雷科技制圖/文心4.0 Turbo)
但文心3.5在推理速度上就有一些不盡人意的地方,它先是將條件單獨(dú)羅列,再逐個分析解釋,整個過程花費(fèi)了大概1分鐘時間。而最終給出的答案也不對,可以說是白浪費(fèi)等待的時間了。但文心3.5也有值得夸贊的地方,它給出的思維鏈非常清晰,以致于我們能從其中某一步就發(fā)現(xiàn)它的推理出現(xiàn)問題。
(圖源:雷科技制圖/文心3.5)
在進(jìn)階的數(shù)學(xué)推理問題上,文心一言兩個模型再一次被拉開差距。
我們挑選了經(jīng)典的撲克牌數(shù)字推論問題,要求文心3.5和文心4.0 Turbo算出正確結(jié)果:
老師發(fā)給甲、乙、丙三張撲克牌,老師說:“你們?nèi)齻人拿到的數(shù)字和是14,并且沒有鬼牌。其中,J、Q、K、A分別代表11、12、13、1。你們只能看自己的牌,能猜出其他兩人拿到的是什么數(shù)字嗎?”甲:“我只知道乙丙兩人的數(shù)字一定不同。”乙:“其實(shí)一開始我就知道咱們?nèi)齻人的數(shù)字一定不同。”丙:“我知道你們倆拿到的數(shù)字了。”請問,丙拿到什么數(shù)字了呢?
和之前的結(jié)論一致,文心4.0 Turbo無論是速度還是推理能力都表現(xiàn)十分優(yōu)秀,幾乎在20秒之內(nèi)就給出了完整的思考過程和答案。而文心3.5此次的推理速度要比之前快很多,但其推理過程要比4.0 Turbo復(fù)雜,反復(fù)的思辨使其在其中某個環(huán)節(jié)就出現(xiàn)幻覺。最終文心4.0 Turbo給出了正確答案,而文心3.5則回答錯誤。
(圖源:雷科技制圖/文心4.0 Turbo)
不過,文心3.5在小雷的重復(fù)測試后,最終也給出了正確的回答,這說明其實(shí)對于普通用戶而言,文心一言整體的正確率其實(shí)還是不錯的,只是效率上還是文心4.0 Turbo更加出色。
(圖源:雷科技制圖/文心3.5)
整體來看,早前需要付費(fèi)才能享用的文心4.0 Turbo的確有很大的優(yōu)勢,主要體現(xiàn)在推理的邏輯性、記憶能力和處理速度上。清華研究報告在此前給出的大模型綜合評測中,文心一言4.0都取得了相當(dāng)不錯的成績,這也確實(shí)反映在普通用戶使用的體驗上。
免費(fèi)的文心一言,DeepSeek的唯一對手?
前面我們提到,文心4.0 Turbo最大的優(yōu)勢還是在推理能力、處理速度上,其實(shí)這同樣也是DeepSeek爆火的原因之一。
那么,DeepSeek在處理同樣的問題時,會比文心一言表現(xiàn)更好嗎?
在前面關(guān)于撲克牌數(shù)字的推斷中,文心4.0 Turbo幾乎在1分鐘內(nèi)就完成了解答,并且答案正確,可以說是真的快準(zhǔn)狠。而同樣的問題交給DeepSeek,它卻無法給出正確答案。而DeepSeek最大的問題在于思維過程過于繁瑣,它會不停驗證自己假設(shè)的條件是否符合此前的推算邏輯,并且重復(fù)驗證后推倒重來。文心4.0 Turbo僅花費(fèi)1分鐘不到時間就能得出答案的問題,DeepSeek居然要花費(fèi)近十分鐘推理。
(圖源:雷科技制圖/DeepSeek)
最離奇的還是,DeepSeek在推理過程中得出了正確答案,但最終的回答卻是錯誤的,這足以說明R1大模型還有進(jìn)步的空間,算不上是非常成熟且可靠的大模型應(yīng)用。
當(dāng)然,目前DeepSeek最大的問題還是服務(wù)器算力不足,對于普通用戶而言,隨手啟用DeepSeek詢問問題,還是有很大的概率會得出服務(wù)器繁忙的回答。不過,DeepSeek目前的優(yōu)勢還是思維鏈清晰,這對于我們復(fù)現(xiàn)和檢查推理過程很有幫助。
而在普通的推理問題上,DeepSeek和文心4.0 Turbo實(shí)際上也是相同的問題,前者雖然能展示詳細(xì)的思考過程,但速度較慢,遇到復(fù)雜的問題還會出現(xiàn)思考與實(shí)際答案不符的情況。而文心4.0 Turbo則更成熟,只是展示的思考過程沒有DeepSeek詳細(xì)。
實(shí)際上,百度作為中國最早推出C端大模型應(yīng)用的廠商,在歷經(jīng)多次升級后已經(jīng)非常成熟。只是在2023年11月后,象征著百度已落地最強(qiáng)的大模型應(yīng)用開始收費(fèi),對很多普通用戶而言,付費(fèi)服務(wù)仍然存在著一定的距離。
截止目前,中國面向C端的AI大模型應(yīng)用中,僅有百度文心一言、智譜清言的智譜AI有向用戶提供VIP服務(wù)。其中,文心一言VIP服務(wù)僅限制不同模型的使用權(quán)限,比如免費(fèi)用戶只能使用文心3.5,其推理能力和生成能力與收費(fèi)的模型有所區(qū)別;智譜AI則是限制問答次數(shù),只有開通VIP服務(wù)后才能無限次使用,其余生成能力也有一定限制。
(圖源:雷科技制圖)
免費(fèi)向用戶開放所有權(quán)限的AI應(yīng)用中,元寶、豆包、通義千問都屬于多模態(tài)應(yīng)用,簡單來說,用戶可以要求其生成圖片、表格,豆包還開放了音樂制作的接口,以及實(shí)時語音交流能力。在海外市場,包括ChatGPT、Claude 2在內(nèi)的主流AI應(yīng)用,全面開啟VIP訂閱模式。
整體來看,中國市場里的AI應(yīng)用普遍采用免費(fèi)的方式向消費(fèi)者提供服務(wù),一方面,免費(fèi)提供服務(wù)是快速擴(kuò)大用戶基礎(chǔ)的有效方式。通過免費(fèi)向大眾提供服務(wù),企業(yè)可以迅速積累大量用戶,提升市場份額。正如字節(jié)跳動在推出豆包時,作為免費(fèi)AI應(yīng)用,它在上線短短三個月時間內(nèi)就突破了千萬的訪問量,躋身一線AI應(yīng)用地位。另一方面,AI作為新興市場,在競爭激烈的環(huán)境中,免費(fèi)策略有助于提升品牌影響力,吸引更多用戶使用產(chǎn)品,從而在市場中占據(jù)有利位置。
如今,百度宣布文心一言免費(fèi)開放,對于風(fēng)頭正盛的DeepSeek,或是其他AI應(yīng)用而言,都是巨大的威脅。
力大飛磚堆算力后,大模型終于要規(guī)模落地了
在2023年文心一言、ChatGPT開啟訂閱模式后,市場普遍認(rèn)為AI付費(fèi)的時代即將到來。兩年時間過去,這股風(fēng)潮不僅沒有被其他大模型開發(fā)商跟隨,甚至在一次又一次初創(chuàng)型AI應(yīng)用的爆火里落于輿論下風(fēng),月之暗面的Kimi如今,時下火熱的DeepSeek亦是如此。
關(guān)于AI應(yīng)用該如何盈利,目前還沒有完善的市場策略出爐。但DeepSeek的走紅給了市場一些警示:開發(fā)大模型并非純靠力大飛磚即可,狠砸資金堆砌算力也未必能獲得高回報。就連OpenAI也被免費(fèi)的DeepSeek狠狠打臉,迫使創(chuàng)始人奧特曼緊急宣布即將發(fā)布的GPT-5將免費(fèi)開放。不過,百度轉(zhuǎn)向免費(fèi)的背后,實(shí)際上也是市場邁向成熟的關(guān)鍵。早在官宣免費(fèi)前,百度創(chuàng)始人李彥宏已經(jīng)透露“每12個月,(大模型)推理成本就可以降低90%以上。”
作為普通用戶,小雷當(dāng)然文心一言的開放免費(fèi)感到興奮。畢竟在中文領(lǐng)域里,文心4.0 Turbo無論是推理能力還是處理速度,又或是穩(wěn)定性而言,都是首屈一指的存在。但文心一言免費(fèi),也代表著它將進(jìn)入到更公開的市場里去和DeepSeek、豆包、元寶們一較高下,到那時候,屬于中國AI應(yīng)用們的大比拼才算真正開始。
來源:雷科技
原文標(biāo)題 : 文心一言免費(fèi)!DeepSeek迎來最大對手,大模型將全面落地

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?