訂閱
糾錯
加入自媒體

文心一言免費(fèi)!DeepSeek迎來最大對手,大模型將全面落地

2025-02-14 09:10
雷科技
關(guān)注

大模型不再是“力大飛磚”。

聚焦DeepSeek專題banner(補(bǔ)充標(biāo)題).png

文心一言官宣免費(fèi)了。

2月13日,百度官方宣布文心一言將于4月1日0時全面免費(fèi),所有PC端和App端用戶可以免費(fèi)使用旗下最新的模型。2023年11月1日,百度推出文心一言專業(yè)版,連續(xù)包月價格為49.9元,是中國AI巨頭中首家面向C端推出付費(fèi)服務(wù)的大模型產(chǎn)品。時隔516天后,文心一言終于宣布全面免費(fèi)。

截屏2025-02-13 14.15.20.png

(圖源:文心一言)

就在官宣免費(fèi)前不久,百度創(chuàng)始人兼首席執(zhí)行官李彥宏在談及DeepSeek對AI行業(yè)的沖擊時,大方表示沒有被震驚,甚至還要加大創(chuàng)新力度。“這是一個非常激動人心的時刻,我們到處都能看到創(chuàng)新,我們必須適應(yīng)這種快速變化的創(chuàng)新”,李彥宏接受采訪時回應(yīng)道。

DeepSeek的到來的確讓與AI相關(guān)的行業(yè)全面地震,一方面,它代表著中國AI大模型站在了世界的前列,無論是思維模式的創(chuàng)新性,還是落地實(shí)踐的實(shí)用性;另一方面,它讓投資者與硬件開發(fā)商看到了AI大模型的另一種方向,即便不需要豪擲千金,也能獲得不錯的效果。

更重要的是,DeepSeek完全免費(fèi),面對C端消費(fèi)者,我們可以隨時隨地免費(fèi)地使用其最新的大模型。這與此前正在焦慮如何通過大模型C端產(chǎn)品實(shí)現(xiàn)盈利的巨頭們完全背道而馳,比如OpenAI。

如今,文心一言徹底免費(fèi),擁有強(qiáng)悍推理、理解、記憶和邏輯能力的文心4.0 Turbo也將面向所有普通用戶開放。這也意味著,文心一言與DeepSeek之間的戰(zhàn)爭,正式拉開序幕。

免費(fèi)開放后,文心一言會如付費(fèi)階段好用嗎?

文心一言目前面向C端的大模型產(chǎn)品主要分為四個,分別是文心3.5、文心4.0、文心4.0 Turbo和文心4.0工具版。其中文心3.5為免費(fèi)開放,后三個模型都需要開通VIP獲得使用權(quán)限。

此前,文心一言VIP價格為59.9元連續(xù)包月、588.8元連續(xù)包年。與其官方的對標(biāo)產(chǎn)品GPT Plus相比,這個價格已經(jīng)非常合理。但在今年4月1日之后,包括文心4.0、文心4.0 Turbo、文心4.0工具版在內(nèi),全都免費(fèi)開放。

但很多用戶可能會疑惑,文心3.5和需要付費(fèi)的文心4.0 Turbo,究竟差別有多大呢?為了讓各位提前看到即將免費(fèi)開放的文心一言VIP服務(wù),小雷給它們來了個對比測試。

首先,我們拋出了一個最簡單的語言類問題:

我也想過過過兒的生活。

“過兒”,其實(shí)就是金庸小說《神雕俠侶》的人物楊過,作為男主角,他與姑姑的愛情故事可以稱得上是武俠小說歷史上的經(jīng)典情節(jié)之一。那么這個問題其實(shí)最重要的就是AI會如何理解“過過”和“過兒”這樣的語言組織關(guān)系。

截屏2025-02-13 19.56.11.png

(圖源:雷科技制圖/文心3.5)

文心3.5和文心4.0 Turbo都能明確了解這句話的實(shí)際含義,但通過思考后,給出的建議卻有些不同。文心3.5真的推薦了一些武術(shù)課程和身體鍛煉的方式,想要幫助小雷成為一名“大俠”。但從實(shí)際角度出發(fā),這樣的建議其實(shí)不太合理。而文心4.0 Turbo則建議小雷可以從精神角度做一名大俠,即便無法和楊過一樣獲得超群的武藝,也能學(xué)會他行為處事作風(fēng)。

截屏2025-02-13 19.56.38.png

(圖源:雷科技制圖/文心4.0 Turbo)

而到了推理環(huán)節(jié),文心4.0 Turbo的優(yōu)勢就更加明顯了。

我們準(zhǔn)備了一個邏輯推理問題,需要從中判斷出小明在哪一天說了實(shí)話。

我的同桌小明特別喜歡撒謊,而且他也是一個奇怪的人:在一個星期中(連續(xù)的七天,首日不一定是周一或周日),他有6天都始終在撒謊,但是總會有一天,他說的所有話都是實(shí)話。有一次,我收錄了他在一個星期中連續(xù)三天所說的話。 第一天:在星期一和星期二我都會說謊話。 第二天:今天要么是星期六,星期四或者星期天。 第三天:在星期三和星期五我都會說謊話。 通過這些,我知道了小明會在哪一天說實(shí)話。你知道了嗎?

在推理速度上,文心4.0 Turbo節(jié)奏明顯要快很多,只做了四次假設(shè),回溯問題后就做出了判斷,最終給出的答案是小明在第三天(星期二)說了實(shí)話,而這個回答也的確是正確回答。

截屏2025-02-13 15.02.39.png

(圖源:雷科技制圖/文心4.0 Turbo)

但文心3.5在推理速度上就有一些不盡人意的地方,它先是將條件單獨(dú)羅列,再逐個分析解釋,整個過程花費(fèi)了大概1分鐘時間。而最終給出的答案也不對,可以說是白浪費(fèi)等待的時間了。但文心3.5也有值得夸贊的地方,它給出的思維鏈非常清晰,以致于我們能從其中某一步就發(fā)現(xiàn)它的推理出現(xiàn)問題。

截屏2025-02-13 15.04.36.png

(圖源:雷科技制圖/文心3.5)

在進(jìn)階的數(shù)學(xué)推理問題上,文心一言兩個模型再一次被拉開差距。

我們挑選了經(jīng)典的撲克牌數(shù)字推論問題,要求文心3.5和文心4.0 Turbo算出正確結(jié)果:

老師發(fā)給甲、乙、丙三張撲克牌,老師說:“你們?nèi)齻人拿到的數(shù)字和是14,并且沒有鬼牌。其中,J、Q、K、A分別代表11、12、13、1。你們只能看自己的牌,能猜出其他兩人拿到的是什么數(shù)字嗎?”甲:“我只知道乙丙兩人的數(shù)字一定不同。”乙:“其實(shí)一開始我就知道咱們?nèi)齻人的數(shù)字一定不同。”丙:“我知道你們倆拿到的數(shù)字了。”請問,丙拿到什么數(shù)字了呢?

和之前的結(jié)論一致,文心4.0 Turbo無論是速度還是推理能力都表現(xiàn)十分優(yōu)秀,幾乎在20秒之內(nèi)就給出了完整的思考過程和答案。而文心3.5此次的推理速度要比之前快很多,但其推理過程要比4.0 Turbo復(fù)雜,反復(fù)的思辨使其在其中某個環(huán)節(jié)就出現(xiàn)幻覺。最終文心4.0 Turbo給出了正確答案,而文心3.5則回答錯誤。

截屏2025-02-13 14.57.05.png

(圖源:雷科技制圖/文心4.0 Turbo)

不過,文心3.5在小雷的重復(fù)測試后,最終也給出了正確的回答,這說明其實(shí)對于普通用戶而言,文心一言整體的正確率其實(shí)還是不錯的,只是效率上還是文心4.0 Turbo更加出色。

image.png

(圖源:雷科技制圖/文心3.5)

整體來看,早前需要付費(fèi)才能享用的文心4.0 Turbo的確有很大的優(yōu)勢,主要體現(xiàn)在推理的邏輯性、記憶能力和處理速度上。清華研究報告在此前給出的大模型綜合評測中,文心一言4.0都取得了相當(dāng)不錯的成績,這也確實(shí)反映在普通用戶使用的體驗上。

免費(fèi)的文心一言,DeepSeek的唯一對手?

前面我們提到,文心4.0 Turbo最大的優(yōu)勢還是在推理能力、處理速度上,其實(shí)這同樣也是DeepSeek爆火的原因之一。

那么,DeepSeek在處理同樣的問題時,會比文心一言表現(xiàn)更好嗎?

在前面關(guān)于撲克牌數(shù)字的推斷中,文心4.0 Turbo幾乎在1分鐘內(nèi)就完成了解答,并且答案正確,可以說是真的快準(zhǔn)狠。而同樣的問題交給DeepSeek,它卻無法給出正確答案。而DeepSeek最大的問題在于思維過程過于繁瑣,它會不停驗證自己假設(shè)的條件是否符合此前的推算邏輯,并且重復(fù)驗證后推倒重來。文心4.0 Turbo僅花費(fèi)1分鐘不到時間就能得出答案的問題,DeepSeek居然要花費(fèi)近十分鐘推理。

截屏2025-02-13 19.59.17.png

(圖源:雷科技制圖/DeepSeek)

最離奇的還是,DeepSeek在推理過程中得出了正確答案,但最終的回答卻是錯誤的,這足以說明R1大模型還有進(jìn)步的空間,算不上是非常成熟且可靠的大模型應(yīng)用。

當(dāng)然,目前DeepSeek最大的問題還是服務(wù)器算力不足,對于普通用戶而言,隨手啟用DeepSeek詢問問題,還是有很大的概率會得出服務(wù)器繁忙的回答。不過,DeepSeek目前的優(yōu)勢還是思維鏈清晰,這對于我們復(fù)現(xiàn)和檢查推理過程很有幫助。

而在普通的推理問題上,DeepSeek和文心4.0 Turbo實(shí)際上也是相同的問題,前者雖然能展示詳細(xì)的思考過程,但速度較慢,遇到復(fù)雜的問題還會出現(xiàn)思考與實(shí)際答案不符的情況。而文心4.0 Turbo則更成熟,只是展示的思考過程沒有DeepSeek詳細(xì)。

實(shí)際上,百度作為中國最早推出C端大模型應(yīng)用的廠商,在歷經(jīng)多次升級后已經(jīng)非常成熟。只是在2023年11月后,象征著百度已落地最強(qiáng)的大模型應(yīng)用開始收費(fèi),對很多普通用戶而言,付費(fèi)服務(wù)仍然存在著一定的距離。

截止目前,中國面向C端的AI大模型應(yīng)用中,僅有百度文心一言、智譜清言的智譜AI有向用戶提供VIP服務(wù)。其中,文心一言VIP服務(wù)僅限制不同模型的使用權(quán)限,比如免費(fèi)用戶只能使用文心3.5,其推理能力和生成能力與收費(fèi)的模型有所區(qū)別;智譜AI則是限制問答次數(shù),只有開通VIP服務(wù)后才能無限次使用,其余生成能力也有一定限制。

image.png

(圖源:雷科技制圖)

免費(fèi)向用戶開放所有權(quán)限的AI應(yīng)用中,元寶、豆包、通義千問都屬于多模態(tài)應(yīng)用,簡單來說,用戶可以要求其生成圖片、表格,豆包還開放了音樂制作的接口,以及實(shí)時語音交流能力。在海外市場,包括ChatGPT、Claude 2在內(nèi)的主流AI應(yīng)用,全面開啟VIP訂閱模式。

整體來看,中國市場里的AI應(yīng)用普遍采用免費(fèi)的方式向消費(fèi)者提供服務(wù),一方面,免費(fèi)提供服務(wù)是快速擴(kuò)大用戶基礎(chǔ)的有效方式。通過免費(fèi)向大眾提供服務(wù),企業(yè)可以迅速積累大量用戶,提升市場份額。正如字節(jié)跳動在推出豆包時,作為免費(fèi)AI應(yīng)用,它在上線短短三個月時間內(nèi)就突破了千萬的訪問量,躋身一線AI應(yīng)用地位。另一方面,AI作為新興市場,在競爭激烈的環(huán)境中,免費(fèi)策略有助于提升品牌影響力,吸引更多用戶使用產(chǎn)品,從而在市場中占據(jù)有利位置。

如今,百度宣布文心一言免費(fèi)開放,對于風(fēng)頭正盛的DeepSeek,或是其他AI應(yīng)用而言,都是巨大的威脅。

力大飛磚堆算力后,大模型終于要規(guī)模落地了

在2023年文心一言、ChatGPT開啟訂閱模式后,市場普遍認(rèn)為AI付費(fèi)的時代即將到來。兩年時間過去,這股風(fēng)潮不僅沒有被其他大模型開發(fā)商跟隨,甚至在一次又一次初創(chuàng)型AI應(yīng)用的爆火里落于輿論下風(fēng),月之暗面的Kimi如今,時下火熱的DeepSeek亦是如此。

關(guān)于AI應(yīng)用該如何盈利,目前還沒有完善的市場策略出爐。但DeepSeek的走紅給了市場一些警示:開發(fā)大模型并非純靠力大飛磚即可,狠砸資金堆砌算力也未必能獲得高回報。就連OpenAI也被免費(fèi)的DeepSeek狠狠打臉,迫使創(chuàng)始人奧特曼緊急宣布即將發(fā)布的GPT-5將免費(fèi)開放。不過,百度轉(zhuǎn)向免費(fèi)的背后,實(shí)際上也是市場邁向成熟的關(guān)鍵。早在官宣免費(fèi)前,百度創(chuàng)始人李彥宏已經(jīng)透露“每12個月,(大模型)推理成本就可以降低90%以上。”

作為普通用戶,小雷當(dāng)然文心一言的開放免費(fèi)感到興奮。畢竟在中文領(lǐng)域里,文心4.0 Turbo無論是推理能力還是處理速度,又或是穩(wěn)定性而言,都是首屈一指的存在。但文心一言免費(fèi),也代表著它將進(jìn)入到更公開的市場里去和DeepSeek、豆包、元寶們一較高下,到那時候,屬于中國AI應(yīng)用們的大比拼才算真正開始。

來源:雷科技

       原文標(biāo)題 : 文心一言免費(fèi)!DeepSeek迎來最大對手,大模型將全面落地

聲明: 本文由入駐維科號的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號