GPT-4.5發(fā)布,號稱OpenAI最好的聊天模型
前言:GPT-4.5的發(fā)布被OpenAI視為[非思維鏈模型的最后一代],此后將轉(zhuǎn)向需要長時(shí)間思考的推理模型。
這一轉(zhuǎn)變與行業(yè)趨勢緊密相連——自從DeepSeekR1開源引發(fā)推理熱潮后,AI競爭的焦點(diǎn)已經(jīng)從數(shù)據(jù)規(guī)模轉(zhuǎn)向邏輯深度。
作者| 方文三圖片來源|網(wǎng) 絡(luò)
OpenAI正式發(fā)布GPT-4.5
在2月27日,OpenAI通過一段時(shí)長為13分鐘的視頻,正式發(fā)布了其迄今為止最為龐大的最新模型——GPT-4.5。
在介紹該模型時(shí),OpenAI的研究副總裁MiaGlaese指出,GPT-4.5模型的顯著特點(diǎn)是其能夠進(jìn)行充滿熱情、直觀且自然流暢的對話,并且在理解用戶需求方面展現(xiàn)出更為強(qiáng)大的能力。
GPT-4.5與o1在回答同一問題時(shí)的表現(xiàn)有所不同。
值得注意的是,GPT-4.5并非一個(gè)推理模型,而是迄今為止OpenAI所構(gòu)建的規(guī)模最大、知識儲(chǔ)備最為豐富的模型。
據(jù)透露,GPT-4.5的訓(xùn)練過程消耗了相當(dāng)于GPT-4o十倍的計(jì)算資源,其性能的提升充分展示了預(yù)訓(xùn)練規(guī)模擴(kuò)展所帶來的顯著效果。
在多項(xiàng)基準(zhǔn)測試中,GPT-4.5的表現(xiàn)超越了GPT-4o,特別是在數(shù)學(xué)能力上提高了27%,在編碼能力上提升了7%至10%。GPT-4.5在某些特定指標(biāo)上甚至超越了o3-mini。
GPT-4.5的核心進(jìn)步體現(xiàn)在無監(jiān)督學(xué)習(xí)能力的增強(qiáng)。
通過增強(qiáng)計(jì)算資源和數(shù)據(jù)規(guī)模,該模型在執(zhí)行復(fù)雜任務(wù)時(shí)表現(xiàn)出更高的精確度,特別是在降低[幻覺]現(xiàn)象(即錯(cuò)誤生成信息)方面取得了顯著成效。
這使得GPT-4.5在處理事實(shí)性問題時(shí)更為可靠,適用范圍也更為廣泛。
在減少幻覺和提高準(zhǔn)確率方面,早期測試顯示GPT-4.5具有較高的情感智能(EQ),能夠根據(jù)對話情境調(diào)整其回應(yīng),尤其在處理與用戶情感相關(guān)的交流時(shí),展現(xiàn)了較高的同理心。
盡管其更高的[情商]、審美直覺和創(chuàng)造力主要依賴于無監(jiān)督學(xué)習(xí),GPT-4.5在推理能力方面也顯示出強(qiáng)勁的實(shí)力。
GPT-4.5的顯著升級體現(xiàn)在其對人類情感的深刻理解。
OpenAI的研究副總裁MiaGlaese強(qiáng)調(diào),GPT-4.5的回應(yīng)更加溫馨、自然,并且能夠通過語言調(diào)整用戶的情緒狀態(tài)。
更通用和更自然智能的模型
OpenAI明確指出,GPT-4.5在作出反應(yīng)之前并不進(jìn)行思考,這使得其優(yōu)勢與推理模型如o1等截然不同。
因此,與o1、o3-mini相比,GPT-4.5被認(rèn)為是一種更通用、更自然智能的模型。
OpenAI堅(jiān)信推理將成為未來模型的核心能力,而預(yù)訓(xùn)練和推理這兩種擴(kuò)展方法將相互補(bǔ)充。
隨著GPT-4.5等模型通過預(yù)訓(xùn)練變得更加智能和知識淵博,它們將成為推理和使用工具的代理的更強(qiáng)大的基礎(chǔ)。
在GPQA(科學(xué))、AIME’24(數(shù)學(xué))、SWE-BenchVerfied(編碼)等數(shù)據(jù)集上,GPT-4.5全面領(lǐng)先于GPT-4o,但在數(shù)學(xué)和真實(shí)編程能力方面,仍略遜于o3-mini。
OpenAI已經(jīng)開發(fā)出一系列先進(jìn)的可擴(kuò)展技術(shù),這些技術(shù)使得GPT-4.5能夠利用較小模型的數(shù)據(jù)集來訓(xùn)練更為龐大和強(qiáng)大的模型。
這些技術(shù)的引入顯著提升了GPT-4.5的操作性、對細(xì)節(jié)的敏感度以及自然對話能力。
定價(jià)高于市面主力大模型
目前,GPT-4.5僅對ChatGPTPro用戶開放,其訂閱費(fèi)用高達(dá)每月200美元,API使用成本則為輸入75美元/百萬token、輸出150美元/百萬token,是GPT-4o的30倍。
OpenAI坦承,模型訓(xùn)練消耗了大量GPU資源,因此迫切需要擴(kuò)充數(shù)萬張顯卡以滿足需求。
以輸入數(shù)據(jù)緩存未命中為例,GPT-4.5的API費(fèi)用是GPT-4o的三十倍,較之DeepSeek-V3(美元定價(jià))則為二百七十七倍,與DeepSeek-R1(美元定價(jià))相比則為一百三十六倍。
進(jìn)一步比較,即便是在DeepSeek的優(yōu)惠時(shí)段,GPT-4.5的費(fèi)用也達(dá)到了前者的五百五十五倍。
GPT-4.5的API定價(jià)出乎意料地高,不僅高于自家主力大模型,甚至比新推出的全球首個(gè)混合推理模型Claude-3.7-Sonnet高出二十五倍,更不用說與剛剛宣布錯(cuò)峰定價(jià)的[價(jià)格屠夫]DeepSeek相比了。
GPT-4.5的計(jì)算效率相較于GPT-4實(shí)現(xiàn)了超過十倍的提升。
在API層面,ChatCompletionsAPI、AssistantsAPI和BatchAPI將向所有付費(fèi)開發(fā)者提供預(yù)覽,支持函數(shù)調(diào)用等關(guān)鍵功能及圖像輸入視覺功能,適用于寫作輔助等應(yīng)用場景。
然而,由于模型龐大且計(jì)算密集,成本較高,官方正在評估是否長期在API中提供該服務(wù)。
將與kimi、DeepSeek展開競爭
目前,OpenAI的市值已超過1570億美元(約合人民幣1.1萬億元)。
最近,奧爾特曼公開透露,OpenAI正在考慮根據(jù)使用量來設(shè)定價(jià)格策略。
至于何時(shí)能夠?qū)崿F(xiàn)通用人工智能(AGI),他指出,當(dāng)一個(gè)AI系統(tǒng)能夠執(zhí)行一個(gè)熟練人士在關(guān)鍵工作中所能完成的任務(wù)時(shí),即可稱之為AGI。
值得注意的是,在今天凌晨,月之暗面kimi再次發(fā)布最版本的Kimi-K1.6-IOI-high模型,該模型在LiveCodeBench基準(zhǔn)測試中排名第一,超越了GPT和Claude系列模型。
同時(shí),DeepSeek的開源周活動(dòng)持續(xù)吸引公眾關(guān)注,包括發(fā)布了專為英偉達(dá)HopperGPU設(shè)計(jì)的MLA解碼內(nèi)核FlashMLA、EP通信庫DeepEP、FP8GEMM(通用矩陣乘法)計(jì)算庫DeepGEMM等。
據(jù)公開資料,2024年全年,OpenAI的銷售收入約為37億美元,同比增長超過1700%。
預(yù)計(jì)到2025年,OpenAI的年化收入將增長至116億美元,其中75%的收入來源于用戶對ChatGPTPlus服務(wù)的訂閱。
內(nèi)部預(yù)估,到2029年全年,OpenAI的營收將達(dá)到1000億美元,相當(dāng)于目前雀巢公司的年銷售額。
GPT-4.5象征著一個(gè)時(shí)代的終結(jié)
OpenAI宣布,GPT-4.5將是其聊天機(jī)器人系統(tǒng)中最后一個(gè)不包含[思維鏈推理]功能的版本。
繼GPT-4.5之后,OpenAI的模型將可能模仿人類的思考方式,花費(fèi)更多時(shí)間深入思考問題后再給出回答,而不是立即作出反應(yīng)。
GPT-4.5代表了OpenAI最后一個(gè)[非思維鏈]模型。
基于GPT-4.5,OpenAI計(jì)劃優(yōu)化其產(chǎn)品線,為GPT-5的重大創(chuàng)新做好準(zhǔn)備,并奠定采用新方法的基礎(chǔ)。
山姆·奧特曼指出,過多的模型會(huì)使用戶感到困惑,而未來的GPT-5將成為一個(gè)重要里程碑,它將整合OpenAI的所有技術(shù)進(jìn)步。
其中最大的創(chuàng)新在于它與之前獨(dú)立的o系列模型的融合。
OpenAI表示,它將把o3模型中的大部分技術(shù)整合進(jìn)GPT-5,這實(shí)際上意味著o3模型將不再作為一個(gè)獨(dú)立的產(chǎn)品存在。
換言之,GPT-5將融合兩個(gè)并行發(fā)展的[AI大腦]的優(yōu)勢。
業(yè)界推測,GPT-5可能會(huì)扮演[路由器模型]的角色,根據(jù)需要協(xié)調(diào)各種內(nèi)部組件或子模型。
用戶只需與GPT-5交互,而GPT-5將利用不同的工具和知識資源來尋找最佳解決方案,這可能包括訪問搜索引擎、執(zhí)行計(jì)算或使用代碼解釋工具,具體取決于任務(wù)需求。
結(jié)尾:在收購OpenAI未果后計(jì)劃
GPT-4.5的發(fā)布不僅是技術(shù)上的進(jìn)步,更是AI人性化的重要里程碑。
它用情商重新定義了人機(jī)交互,用知識的廣度賦能實(shí)際應(yīng)用場景,同時(shí)也因高昂的成本引發(fā)了爭議。
隨著推理模型的到來,AI有望真正融入人類生活,成為工作與情感的[雙重助手]。
對于普通用戶而言,如何在性能與成本之間找到平衡,將是接下來最實(shí)際的挑戰(zhàn)。
部分資料參考:鳳凰網(wǎng)科技:《史上最貴AI模型上線,主打情商高,奧特曼竟因"帶娃"缺席發(fā)布會(huì)?》,網(wǎng)站知識:《OpenAI發(fā)布GPT-4.5:高情商AI引發(fā)全網(wǎng)熱議》,機(jī)器之心:《OpenAI迄今最大、最貴模型,API價(jià)格飛漲30倍,不拼推理拼情商》,DeepTech深科技:《OpenAI發(fā)布號稱[情商最高]的AI模型,奧特曼稱GPU已用完》,雷科技:《價(jià)格是DeepSeek277倍!GPT-4.5還是太自信了》,鈦媒體AGI:《6年來最強(qiáng)模型GPT-4.5登場:更貴、更高情商、更少幻覺》
原文標(biāo)題 : AI芯天下丨熱點(diǎn)丨GPT-4.5正式發(fā)布,號稱OpenAI最好的聊天模型

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車】汽車E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評 >> 【評選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評選
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?