日韩高清视频一区,国产一区二区免费在线

谷歌 VS OpenAI，大模型Gemini有多拼？

2023-12-12 10:28

Ai芯天下

關(guān)注

前言：

為了與OpenAI和微軟在人工智能領(lǐng)域展開(kāi)競(jìng)爭(zhēng)，谷歌采取了果斷的措施。

他們從PaLM 2切換到了Gemini上，并決定將谷歌大腦和DeepMind合并，以進(jìn)一步加強(qiáng)對(duì)大模型的研發(fā)能力。

合并后的Google DeepMind將集兩個(gè)實(shí)驗(yàn)室的力量，全力攻關(guān)Gemini。這充分展示了谷歌在大模型軍備競(jìng)賽中孤注一擲的心態(tài)。

作者 | 方文三

圖片來(lái)源 | 網(wǎng) 絡(luò)

谷歌大模型Gemini正式發(fā)布

近日，谷歌公司宣布推出新型大型語(yǔ)言模型Gemini。

Gemini是一個(gè)多模態(tài)大模型，意味著它可以泛化并無(wú)縫地理解、操作和組合不同類型的信息，包括文本、代碼、音頻、圖像和視頻。

谷歌表示，Gemini還是他們迄今為止最靈活的模型，能夠高效地運(yùn)行在數(shù)據(jù)中心和移動(dòng)設(shè)備等多類型平臺(tái)上。

Gemini提供的SOTA能力將顯著增強(qiáng)開(kāi)發(fā)人員和企業(yè)客戶構(gòu)建和擴(kuò)展AI的方式。

Gemini將作為首個(gè)直接在手機(jī)上運(yùn)行的大型模型，應(yīng)用于谷歌Pixel 8 Pro智能手機(jī)和聊天機(jī)器人Bard。

谷歌計(jì)劃通過(guò)谷歌云向客戶提供Gemini授權(quán)，并將在未來(lái)幾個(gè)月內(nèi)將其與其他谷歌服務(wù)產(chǎn)品進(jìn)行集成。

為了比較Gemini與OpenAI的GPT-4的性能，谷歌運(yùn)行了32個(gè)完善的多模態(tài)基準(zhǔn)測(cè)試，結(jié)果顯示Gemini在32項(xiàng)基準(zhǔn)測(cè)試中的30項(xiàng)中均領(lǐng)先于GPT-4。

在MMLU（大規(guī)模多任務(wù)語(yǔ)言理解）測(cè)試中，Gemini首次在MMLU得分率達(dá)到90.0%，成為第一個(gè)在MMLU測(cè)試中超越人類專家的模型。

Gemini包括了三種不同規(guī)模的模型：

①Gemini Ultra為最大、功能最強(qiáng)大的類別，定位為GPT-4的競(jìng)爭(zhēng)對(duì)手；

②Gemini Pro為中端型號(hào)，性能優(yōu)于GPT-3.5，可擴(kuò)展多種任務(wù)；

③Gemini Nano則適用于特定任務(wù)和移動(dòng)設(shè)備。

利用移動(dòng)手機(jī)的算力來(lái)運(yùn)行生成式AI，而不是通過(guò)由大型科技公司運(yùn)營(yíng)的云端服務(wù)器，這將大大降低運(yùn)營(yíng)這類系統(tǒng)的成本。

對(duì)于那些希望將私人數(shù)據(jù)限制在設(shè)備上的人來(lái)說(shuō)，這也提供了一層保障。

然后，在面臨有關(guān)宣傳方面可能存在夸大的質(zhì)疑下，谷歌在一篇官方博客文章中，谷歌的回應(yīng)基本上承認(rèn)了。

在實(shí)現(xiàn)演示視頻中所展示的效果時(shí)，必須依賴于使用靜態(tài)圖片以及多段提示詞的組合。

以視頻為例，其中展示了向Gemini系統(tǒng)輪流展示拳頭、剪刀手和張開(kāi)的手掌，而Gemini系統(tǒng)能夠立刻理解這是在玩猜拳游戲。

然而，谷歌在文章中明確指出，只有當(dāng)同時(shí)向Gemini系統(tǒng)展示這三個(gè)手勢(shì)，并給予提示這是游戲時(shí)，系統(tǒng)才會(huì)得出猜拳游戲的結(jié)論。

從投資者角度來(lái)看，至少這是一個(gè)積極的開(kāi)端。上周四，谷歌的股價(jià)出現(xiàn)了暴漲，市值增加了800億美元。

谷歌 VS OpenAI：從失利的首敗走出來(lái)

在今年2月的巴黎活動(dòng)中，谷歌因聊天機(jī)器人Bard的一次失誤，導(dǎo)致市值蒸發(fā)了1000億美元，引發(fā)了外界對(duì)Bard準(zhǔn)確性的擔(dān)憂。

同時(shí)，隨著競(jìng)爭(zhēng)對(duì)手OpenAI推出的ChatGPT以及在必應(yīng)搜索中整合的GPT技術(shù)，谷歌在應(yīng)用程序下載量上被超越，人們開(kāi)始質(zhì)疑谷歌是否在人工智能領(lǐng)域落后于競(jìng)爭(zhēng)對(duì)手。

其實(shí)谷歌才是提出2017年Transformer模型、為當(dāng)今人工智能領(lǐng)域制定規(guī)則的先行者。

2021年，谷歌推出了1.6萬(wàn)億參數(shù)的Switch Transformer，強(qiáng)調(diào)稀疏多模態(tài)結(jié)構(gòu)的潛力。

此外，谷歌還提出了Flan-T5模型，通過(guò)更多監(jiān)督數(shù)據(jù)降低了模型規(guī)模，比GPT-3模型參數(shù)更少但性能更佳。

測(cè)試結(jié)果顯示，谷歌AI在數(shù)學(xué)問(wèn)題上表現(xiàn)更佳，但ChatGPT在常識(shí)問(wèn)題上更準(zhǔn)確。

谷歌在AI領(lǐng)域取得了不少研究進(jìn)展，但尚未將這些成果部署和變現(xiàn)，類似于微軟在過(guò)去的某些時(shí)期。

這可能是因?yàn)楣雀璧凸懒宋④浐蚈penAI的競(jìng)爭(zhēng)實(shí)力，或者過(guò)于自信于自己在搜索引擎領(lǐng)域的主導(dǎo)地位。

在Sam Altman領(lǐng)導(dǎo)下的OpenAI專注于產(chǎn)品為導(dǎo)向的工作，致力于擴(kuò)展和優(yōu)化模型，主要關(guān)注細(xì)節(jié)精調(diào)方法。

而谷歌則在技術(shù)發(fā)展的方向上始終保持著積極和前瞻的態(tài)度，不過(guò)在整體戰(zhàn)略規(guī)劃上卻屢次調(diào)整。

在谷歌[選擇困難癥]期間，OpenAI已經(jīng)完成了對(duì)ChatGPT的訓(xùn)練。

GPT-4 VS Gemini：多模態(tài)的性能優(yōu)勢(shì)凸顯

作為谷歌應(yīng)對(duì)GPT-4的[重要武器]，Gemini在32個(gè)多模態(tài)基準(zhǔn)測(cè)試中取得了30個(gè)SOTA（即當(dāng)前最優(yōu)效果）的記錄，凸顯了其在多模態(tài)任務(wù)中的卓越性能。

它是第一個(gè)在MMLU（大規(guī)模多任務(wù)語(yǔ)言理解）測(cè)評(píng)上超越人類專家的模型，其成績(jī)達(dá)到了90.0%，相比之下，人類專家的成績(jī)?yōu)?9.8%，GPT-4的成績(jī)?yōu)?6.4%。

在多選問(wèn)題、數(shù)學(xué)問(wèn)題、Python代碼任務(wù)、閱讀等方面，Gemini的性能都超過(guò)了此前最先進(jìn)的水平。

與GPT-4相比，谷歌提供的數(shù)據(jù)顯示Gemini Ultra全面超越GPT-4，而Gemini Pro在大多數(shù)指標(biāo)上超越了GPT-3.5。

總體來(lái)說(shuō)，Gemini在運(yùn)算效能和任務(wù)性能方面都展現(xiàn)出了卓越的表現(xiàn)，成功應(yīng)對(duì)了GPT-4的挑戰(zhàn)。

Gemini模型最初強(qiáng)調(diào)了其生成文本和圖像的能力，以與GPT-4區(qū)分開(kāi)來(lái)。

具體而言，Gemini可以理解正式和非正式語(yǔ)言之間的差異，捕捉文本的語(yǔ)氣和情感，并識(shí)別其他文本或來(lái)源的引用和暗示。

現(xiàn)在，兩者之間的關(guān)鍵差異可能在于谷歌豐富的專有訓(xùn)練數(shù)據(jù)集。

Gemini能夠處理來(lái)自各種服務(wù)（包括Google搜索、YouTube、Google Books和Google Scholar等）的數(shù)據(jù)。

這些服務(wù)包含了來(lái)自不同領(lǐng)域和語(yǔ)言的大量豐富信息，有助于Gemini從各種來(lái)源和語(yǔ)境中學(xué)習(xí)。

Gemini的培訓(xùn)數(shù)據(jù)量是GPT-4的兩倍，這可能使其在從數(shù)據(jù)集中產(chǎn)生更復(fù)雜的見(jiàn)解和推斷方面具有優(yōu)勢(shì)。

當(dāng)然GPT-4也有其獨(dú)特的優(yōu)勢(shì)，GPT-4作為OpenAI開(kāi)發(fā)的大語(yǔ)言模型，在語(yǔ)言理解和生成方面具有很強(qiáng)的能力。

GPT-4采用Transformer架構(gòu)和無(wú)監(jiān)督學(xué)習(xí)技術(shù)，能捕捉長(zhǎng)距離依賴關(guān)系和上下文信息，展現(xiàn)出卓越的語(yǔ)言理解和生成能力。

此外，GPT-4還具有強(qiáng)大的推理能力，適應(yīng)各種復(fù)雜場(chǎng)景并提供更智能高效的服務(wù)。

結(jié)尾：

與OpenAI的方法不同，谷歌從一開(kāi)始就構(gòu)建了一個(gè)多感官模型。

多模態(tài)是生成式AI下一步的重點(diǎn)方向，有待繼續(xù)探索的應(yīng)用場(chǎng)景非常廣泛。

下一階段的重點(diǎn)攻克方向是多模態(tài)技術(shù)。

短期來(lái)看，Gemini的發(fā)布將進(jìn)一步激發(fā)市場(chǎng)對(duì)多模態(tài)模型的期待，對(duì)產(chǎn)業(yè)而言，多模態(tài)將帶動(dòng)算力需求的提升。

中長(zhǎng)期來(lái)看，預(yù)計(jì)多模態(tài)模型的升級(jí)將豐富相關(guān)產(chǎn)品的使用場(chǎng)景，疊加硬件升級(jí)、算法優(yōu)化帶來(lái)的成本優(yōu)化，2C產(chǎn)品的進(jìn)展值得期待。

部分資料參考：機(jī)器之心：《谷歌大殺器終于來(lái)了，最大規(guī)模Gemini震撼發(fā)布》，甲子光年：《優(yōu)等生歸來(lái)，谷歌最強(qiáng)大模型Gemini能否打敗GPT4？》，財(cái)經(jīng)E法：《Gemini發(fā)布僅一天就遭質(zhì)疑，谷歌追趕OpenAI太過(guò)心急？》

原文標(biāo)題 : 熱點(diǎn)丨谷歌 VS OpenAI，大模型Gemini有多拼？