訂閱
糾錯(cuò)
加入自媒體

文心一言免費(fèi)!DeepSeek迎來(lái)最大對(duì)手,大模型將全面落地

2025-02-14 09:10
雷科技
關(guān)注

大模型不再是“力大飛磚”。

聚焦DeepSeek專題banner(補(bǔ)充標(biāo)題).png

文心一言官宣免費(fèi)了。

2月13日,百度官方宣布文心一言將于4月1日0時(shí)全面免費(fèi),所有PC端和App端用戶可以免費(fèi)使用旗下最新的模型。2023年11月1日,百度推出文心一言專業(yè)版,連續(xù)包月價(jià)格為49.9元,是中國(guó)AI巨頭中首家面向C端推出付費(fèi)服務(wù)的大模型產(chǎn)品。時(shí)隔516天后,文心一言終于宣布全面免費(fèi)。

截屏2025-02-13 14.15.20.png

(圖源:文心一言)

就在官宣免費(fèi)前不久,百度創(chuàng)始人兼首席執(zhí)行官李彥宏在談及DeepSeek對(duì)AI行業(yè)的沖擊時(shí),大方表示沒(méi)有被震驚,甚至還要加大創(chuàng)新力度。“這是一個(gè)非常激動(dòng)人心的時(shí)刻,我們到處都能看到創(chuàng)新,我們必須適應(yīng)這種快速變化的創(chuàng)新”,李彥宏接受采訪時(shí)回應(yīng)道。

DeepSeek的到來(lái)的確讓與AI相關(guān)的行業(yè)全面地震,一方面,它代表著中國(guó)AI大模型站在了世界的前列,無(wú)論是思維模式的創(chuàng)新性,還是落地實(shí)踐的實(shí)用性;另一方面,它讓投資者與硬件開(kāi)發(fā)商看到了AI大模型的另一種方向,即便不需要豪擲千金,也能獲得不錯(cuò)的效果。

更重要的是,DeepSeek完全免費(fèi),面對(duì)C端消費(fèi)者,我們可以隨時(shí)隨地免費(fèi)地使用其最新的大模型。這與此前正在焦慮如何通過(guò)大模型C端產(chǎn)品實(shí)現(xiàn)盈利的巨頭們完全背道而馳,比如OpenAI。

如今,文心一言徹底免費(fèi),擁有強(qiáng)悍推理、理解、記憶和邏輯能力的文心4.0 Turbo也將面向所有普通用戶開(kāi)放。這也意味著,文心一言與DeepSeek之間的戰(zhàn)爭(zhēng),正式拉開(kāi)序幕。

免費(fèi)開(kāi)放后,文心一言會(huì)如付費(fèi)階段好用嗎?

文心一言目前面向C端的大模型產(chǎn)品主要分為四個(gè),分別是文心3.5、文心4.0、文心4.0 Turbo和文心4.0工具版。其中文心3.5為免費(fèi)開(kāi)放,后三個(gè)模型都需要開(kāi)通VIP獲得使用權(quán)限。

此前,文心一言VIP價(jià)格為59.9元連續(xù)包月、588.8元連續(xù)包年。與其官方的對(duì)標(biāo)產(chǎn)品GPT Plus相比,這個(gè)價(jià)格已經(jīng)非常合理。但在今年4月1日之后,包括文心4.0、文心4.0 Turbo、文心4.0工具版在內(nèi),全都免費(fèi)開(kāi)放。

但很多用戶可能會(huì)疑惑,文心3.5和需要付費(fèi)的文心4.0 Turbo,究竟差別有多大呢?為了讓各位提前看到即將免費(fèi)開(kāi)放的文心一言VIP服務(wù),小雷給它們來(lái)了個(gè)對(duì)比測(cè)試。

首先,我們拋出了一個(gè)最簡(jiǎn)單的語(yǔ)言類問(wèn)題:

我也想過(guò)過(guò)過(guò)兒的生活。

“過(guò)兒”,其實(shí)就是金庸小說(shuō)《神雕俠侶》的人物楊過(guò),作為男主角,他與姑姑的愛(ài)情故事可以稱得上是武俠小說(shuō)歷史上的經(jīng)典情節(jié)之一。那么這個(gè)問(wèn)題其實(shí)最重要的就是AI會(huì)如何理解“過(guò)過(guò)”和“過(guò)兒”這樣的語(yǔ)言組織關(guān)系。

截屏2025-02-13 19.56.11.png

(圖源:雷科技制圖/文心3.5)

文心3.5和文心4.0 Turbo都能明確了解這句話的實(shí)際含義,但通過(guò)思考后,給出的建議卻有些不同。文心3.5真的推薦了一些武術(shù)課程和身體鍛煉的方式,想要幫助小雷成為一名“大俠”。但從實(shí)際角度出發(fā),這樣的建議其實(shí)不太合理。而文心4.0 Turbo則建議小雷可以從精神角度做一名大俠,即便無(wú)法和楊過(guò)一樣獲得超群的武藝,也能學(xué)會(huì)他行為處事作風(fēng)。

截屏2025-02-13 19.56.38.png

(圖源:雷科技制圖/文心4.0 Turbo)

而到了推理環(huán)節(jié),文心4.0 Turbo的優(yōu)勢(shì)就更加明顯了。

我們準(zhǔn)備了一個(gè)邏輯推理問(wèn)題,需要從中判斷出小明在哪一天說(shuō)了實(shí)話。

我的同桌小明特別喜歡撒謊,而且他也是一個(gè)奇怪的人:在一個(gè)星期中(連續(xù)的七天,首日不一定是周一或周日),他有6天都始終在撒謊,但是總會(huì)有一天,他說(shuō)的所有話都是實(shí)話。有一次,我收錄了他在一個(gè)星期中連續(xù)三天所說(shuō)的話。 第一天:在星期一和星期二我都會(huì)說(shuō)謊話。 第二天:今天要么是星期六,星期四或者星期天。 第三天:在星期三和星期五我都會(huì)說(shuō)謊話。 通過(guò)這些,我知道了小明會(huì)在哪一天說(shuō)實(shí)話。你知道了嗎?

在推理速度上,文心4.0 Turbo節(jié)奏明顯要快很多,只做了四次假設(shè),回溯問(wèn)題后就做出了判斷,最終給出的答案是小明在第三天(星期二)說(shuō)了實(shí)話,而這個(gè)回答也的確是正確回答。

截屏2025-02-13 15.02.39.png

(圖源:雷科技制圖/文心4.0 Turbo)

但文心3.5在推理速度上就有一些不盡人意的地方,它先是將條件單獨(dú)羅列,再逐個(gè)分析解釋,整個(gè)過(guò)程花費(fèi)了大概1分鐘時(shí)間。而最終給出的答案也不對(duì),可以說(shuō)是白浪費(fèi)等待的時(shí)間了。但文心3.5也有值得夸贊的地方,它給出的思維鏈非常清晰,以致于我們能從其中某一步就發(fā)現(xiàn)它的推理出現(xiàn)問(wèn)題。

截屏2025-02-13 15.04.36.png

(圖源:雷科技制圖/文心3.5)

在進(jìn)階的數(shù)學(xué)推理問(wèn)題上,文心一言兩個(gè)模型再一次被拉開(kāi)差距。

我們挑選了經(jīng)典的撲克牌數(shù)字推論問(wèn)題,要求文心3.5和文心4.0 Turbo算出正確結(jié)果:

老師發(fā)給甲、乙、丙三張撲克牌,老師說(shuō):“你們?nèi)齻(gè)人拿到的數(shù)字和是14,并且沒(méi)有鬼牌。其中,J、Q、K、A分別代表11、12、13、1。你們只能看自己的牌,能猜出其他兩人拿到的是什么數(shù)字嗎?”甲:“我只知道乙丙兩人的數(shù)字一定不同。”乙:“其實(shí)一開(kāi)始我就知道咱們?nèi)齻(gè)人的數(shù)字一定不同。”丙:“我知道你們倆拿到的數(shù)字了。”請(qǐng)問(wèn),丙拿到什么數(shù)字了呢?

和之前的結(jié)論一致,文心4.0 Turbo無(wú)論是速度還是推理能力都表現(xiàn)十分優(yōu)秀,幾乎在20秒之內(nèi)就給出了完整的思考過(guò)程和答案。而文心3.5此次的推理速度要比之前快很多,但其推理過(guò)程要比4.0 Turbo復(fù)雜,反復(fù)的思辨使其在其中某個(gè)環(huán)節(jié)就出現(xiàn)幻覺(jué)。最終文心4.0 Turbo給出了正確答案,而文心3.5則回答錯(cuò)誤。

截屏2025-02-13 14.57.05.png

(圖源:雷科技制圖/文心4.0 Turbo)

不過(guò),文心3.5在小雷的重復(fù)測(cè)試后,最終也給出了正確的回答,這說(shuō)明其實(shí)對(duì)于普通用戶而言,文心一言整體的正確率其實(shí)還是不錯(cuò)的,只是效率上還是文心4.0 Turbo更加出色。

image.png

(圖源:雷科技制圖/文心3.5)

整體來(lái)看,早前需要付費(fèi)才能享用的文心4.0 Turbo的確有很大的優(yōu)勢(shì),主要體現(xiàn)在推理的邏輯性、記憶能力和處理速度上。清華研究報(bào)告在此前給出的大模型綜合評(píng)測(cè)中,文心一言4.0都取得了相當(dāng)不錯(cuò)的成績(jī),這也確實(shí)反映在普通用戶使用的體驗(yàn)上。

免費(fèi)的文心一言,DeepSeek的唯一對(duì)手?

前面我們提到,文心4.0 Turbo最大的優(yōu)勢(shì)還是在推理能力、處理速度上,其實(shí)這同樣也是DeepSeek爆火的原因之一。

那么,DeepSeek在處理同樣的問(wèn)題時(shí),會(huì)比文心一言表現(xiàn)更好嗎?

在前面關(guān)于撲克牌數(shù)字的推斷中,文心4.0 Turbo幾乎在1分鐘內(nèi)就完成了解答,并且答案正確,可以說(shuō)是真的快準(zhǔn)狠。而同樣的問(wèn)題交給DeepSeek,它卻無(wú)法給出正確答案。而DeepSeek最大的問(wèn)題在于思維過(guò)程過(guò)于繁瑣,它會(huì)不停驗(yàn)證自己假設(shè)的條件是否符合此前的推算邏輯,并且重復(fù)驗(yàn)證后推倒重來(lái)。文心4.0 Turbo僅花費(fèi)1分鐘不到時(shí)間就能得出答案的問(wèn)題,DeepSeek居然要花費(fèi)近十分鐘推理。

截屏2025-02-13 19.59.17.png

(圖源:雷科技制圖/DeepSeek)

最離奇的還是,DeepSeek在推理過(guò)程中得出了正確答案,但最終的回答卻是錯(cuò)誤的,這足以說(shuō)明R1大模型還有進(jìn)步的空間,算不上是非常成熟且可靠的大模型應(yīng)用。

當(dāng)然,目前DeepSeek最大的問(wèn)題還是服務(wù)器算力不足,對(duì)于普通用戶而言,隨手啟用DeepSeek詢問(wèn)問(wèn)題,還是有很大的概率會(huì)得出服務(wù)器繁忙的回答。不過(guò),DeepSeek目前的優(yōu)勢(shì)還是思維鏈清晰,這對(duì)于我們復(fù)現(xiàn)和檢查推理過(guò)程很有幫助。

而在普通的推理問(wèn)題上,DeepSeek和文心4.0 Turbo實(shí)際上也是相同的問(wèn)題,前者雖然能展示詳細(xì)的思考過(guò)程,但速度較慢,遇到復(fù)雜的問(wèn)題還會(huì)出現(xiàn)思考與實(shí)際答案不符的情況。而文心4.0 Turbo則更成熟,只是展示的思考過(guò)程沒(méi)有DeepSeek詳細(xì)。

實(shí)際上,百度作為中國(guó)最早推出C端大模型應(yīng)用的廠商,在歷經(jīng)多次升級(jí)后已經(jīng)非常成熟。只是在2023年11月后,象征著百度已落地最強(qiáng)的大模型應(yīng)用開(kāi)始收費(fèi),對(duì)很多普通用戶而言,付費(fèi)服務(wù)仍然存在著一定的距離。

截止目前,中國(guó)面向C端的AI大模型應(yīng)用中,僅有百度文心一言、智譜清言的智譜AI有向用戶提供VIP服務(wù)。其中,文心一言VIP服務(wù)僅限制不同模型的使用權(quán)限,比如免費(fèi)用戶只能使用文心3.5,其推理能力和生成能力與收費(fèi)的模型有所區(qū)別;智譜AI則是限制問(wèn)答次數(shù),只有開(kāi)通VIP服務(wù)后才能無(wú)限次使用,其余生成能力也有一定限制。

image.png

(圖源:雷科技制圖)

免費(fèi)向用戶開(kāi)放所有權(quán)限的AI應(yīng)用中,元寶、豆包、通義千問(wèn)都屬于多模態(tài)應(yīng)用,簡(jiǎn)單來(lái)說(shuō),用戶可以要求其生成圖片、表格,豆包還開(kāi)放了音樂(lè)制作的接口,以及實(shí)時(shí)語(yǔ)音交流能力。在海外市場(chǎng),包括ChatGPT、Claude 2在內(nèi)的主流AI應(yīng)用,全面開(kāi)啟VIP訂閱模式。

整體來(lái)看,中國(guó)市場(chǎng)里的AI應(yīng)用普遍采用免費(fèi)的方式向消費(fèi)者提供服務(wù),一方面,免費(fèi)提供服務(wù)是快速擴(kuò)大用戶基礎(chǔ)的有效方式。通過(guò)免費(fèi)向大眾提供服務(wù),企業(yè)可以迅速積累大量用戶,提升市場(chǎng)份額。正如字節(jié)跳動(dòng)在推出豆包時(shí),作為免費(fèi)AI應(yīng)用,它在上線短短三個(gè)月時(shí)間內(nèi)就突破了千萬(wàn)的訪問(wèn)量,躋身一線AI應(yīng)用地位。另一方面,AI作為新興市場(chǎng),在競(jìng)爭(zhēng)激烈的環(huán)境中,免費(fèi)策略有助于提升品牌影響力,吸引更多用戶使用產(chǎn)品,從而在市場(chǎng)中占據(jù)有利位置。

如今,百度宣布文心一言免費(fèi)開(kāi)放,對(duì)于風(fēng)頭正盛的DeepSeek,或是其他AI應(yīng)用而言,都是巨大的威脅。

力大飛磚堆算力后,大模型終于要規(guī)模落地了

在2023年文心一言、ChatGPT開(kāi)啟訂閱模式后,市場(chǎng)普遍認(rèn)為AI付費(fèi)的時(shí)代即將到來(lái)。兩年時(shí)間過(guò)去,這股風(fēng)潮不僅沒(méi)有被其他大模型開(kāi)發(fā)商跟隨,甚至在一次又一次初創(chuàng)型AI應(yīng)用的爆火里落于輿論下風(fēng),月之暗面的Kimi如今,時(shí)下火熱的DeepSeek亦是如此。

關(guān)于AI應(yīng)用該如何盈利,目前還沒(méi)有完善的市場(chǎng)策略出爐。但DeepSeek的走紅給了市場(chǎng)一些警示:開(kāi)發(fā)大模型并非純靠力大飛磚即可,狠砸資金堆砌算力也未必能獲得高回報(bào)。就連OpenAI也被免費(fèi)的DeepSeek狠狠打臉,迫使創(chuàng)始人奧特曼緊急宣布即將發(fā)布的GPT-5將免費(fèi)開(kāi)放。不過(guò),百度轉(zhuǎn)向免費(fèi)的背后,實(shí)際上也是市場(chǎng)邁向成熟的關(guān)鍵。早在官宣免費(fèi)前,百度創(chuàng)始人李彥宏已經(jīng)透露“每12個(gè)月,(大模型)推理成本就可以降低90%以上。”

作為普通用戶,小雷當(dāng)然文心一言的開(kāi)放免費(fèi)感到興奮。畢竟在中文領(lǐng)域里,文心4.0 Turbo無(wú)論是推理能力還是處理速度,又或是穩(wěn)定性而言,都是首屈一指的存在。但文心一言免費(fèi),也代表著它將進(jìn)入到更公開(kāi)的市場(chǎng)里去和DeepSeek、豆包、元寶們一較高下,到那時(shí)候,屬于中國(guó)AI應(yīng)用們的大比拼才算真正開(kāi)始。

來(lái)源:雷科技

       原文標(biāo)題 : 文心一言免費(fèi)!DeepSeek迎來(lái)最大對(duì)手,大模型將全面落地

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)