GPT5來了!奧特曼真聽勸,但我擔(dān)心的還是發(fā)生了......
兩年多的時間,無數(shù)次的預(yù)告,無數(shù)次的營銷,F(xiàn)在,GPT-5 終于來了!
這次,奧特曼是真聽勸了。以前的 OpenAI 模型命名,像什么 o1、o3、o4、mini、nano、pro...... 看著比奶茶菜單還亂。而現(xiàn)在,它們統(tǒng)一都是 GPT-5?瓷先デ逅瞬簧。
但是大家最期待的那種ChatGPT、Sora式的驚艷技術(shù)大突破,說實(shí)話,沒有......
這也是我所擔(dān)心的點(diǎn)。
1 介紹一下GPT-5
GPT-5 并不是一個單一模型,而是一個融合了多個模型的 “混血系統(tǒng)”。它背后有三種不同層次的模型:
日常應(yīng)答模型:快、準(zhǔn)、便宜,回答大多數(shù)問題
深度推理模型:專門解決難題
實(shí)時路由器:自動判斷該用哪個模型,根據(jù)你的問題類型、復(fù)雜度、是否需要工具來選擇
比如你說一句 “這個題請認(rèn)真推理”,它就會切換到推理模型。用完配額之后,還有 mini 版本頂上。
這是 GPT-5 真正的殺手锏,代表它已經(jīng)具備非常成熟的工具和模型調(diào)用能力。
API 端也很簡單,直接分成三個型號:
gpt-5(主力)
gpt-5-mini(輕量)
gpt-5-nano(極輕量)
每個型號還能設(shè)置 4 個推理等級。最特別的是增加了一個 “minimal模式”,不繞彎子、不浪費(fèi)推理 token,直接提高響應(yīng)速度。
此外,GPT-5 支持超長上下文,以及雙模輸入:
輸入上限:272,000 tokens
輸出上限(含推理 token):128,000 tokens
支持“文本+圖片”輸入,輸出只支持文本
這意味著它能一口氣消化上百頁文檔,相當(dāng)于一本巨著,還能邊看圖邊理解,再用相當(dāng)長的篇幅給你答復(fù)。
2 GPT-5確實(shí)更聰明了
OpenAI說,GPT-5的推理能力提升了,還更誠實(shí)、更少幻覺,在寫作、編程、醫(yī)療等領(lǐng)域都比前代強(qiáng)。奧特曼自信地說:
“GPT-3有點(diǎn)像和高中生交談。GPT-4,也許就像和大學(xué)生交談一樣。但有了GPT-5,現(xiàn)在就像和一位專家交談,一位博士級別的專家,在任何你需要的領(lǐng)域,按需交流。”
聽起來很燃,但一些早期體驗(yàn)者給出的評價是:它很穩(wěn),很能干,但不是質(zhì)變。
特別是在寫作上,甚至有人覺得GPT-4.5的文字風(fēng)格更貼近人類,而GPT-5偶爾還是會冒出“套話式”的流水文。
不過在編程方面,GPT-5的口碑倒是相當(dāng)炸裂。
從一口氣生成整個網(wǎng)站,到精準(zhǔn)解決復(fù)雜依賴沖突,它比任何前代模型都干脆利落,能用并行調(diào)用多個工具,像個人類程序員一樣干活。
OpenAI官網(wǎng)甚至展示了GPT-5生成的小游戲,直接可以玩的那種,以及對應(yīng)Prompt。
下面我們看一下 GPT-5 的成績單:
數(shù)學(xué):AIME 2025(無工具輔助)得分 94.6% 。
編程:SWEbench Verified 得分 74.9%,Aider Polyglot 得分 88% 。
多模態(tài)理解:在 MMMU 上取得 84.2% 。
健康領(lǐng)域:HealthBench Hard 得分 46.2% 。
經(jīng)濟(jì)重要任務(wù):在涵蓋法律、物流、銷售和工程等 40 多個職業(yè)的任務(wù)中,其表現(xiàn)優(yōu)于 o3 和 ChatGPT Agent。
推理能力:在 GPQA(面向研究生水平的科學(xué)問題)上也創(chuàng)下新記錄,無工具情況下取得 88.4% 的高分。
3 價格打骨折
這次的定價直接開卷:
GPT-5:輸入 $1.25/百萬token;輸出 $10/百萬token
GPT-5 Mini:輸入 $0.25/百萬token;輸出 $2/百萬token
GPT-5 Nano:輸入 $0.05/百萬token;輸出 $0.4/百萬token
GPT-5 的價格比 GPT-4o 便宜一半,再加上90%的緩存折扣(短時間重復(fù)用相同輸入時),做AI產(chǎn)品的成本能省一大截。
和同類Claude、Gemini、Grok比起來,價格優(yōu)勢明顯。OpenAI這是要赤裸裸地?fù)屖袌觥?nbsp;
4 更安全可靠,從“拒絕”到“安全回答”
以前 AI 要么直接回答你,要么一句“抱歉不能回答”。
GPT-5 用了新的 safe-completions 策略:在安全政策范圍內(nèi)盡量給出高層次、有用的答案,而不是簡單拒絕。
其他改進(jìn)包括:
降低幻覺率:尤其是無聯(lián)網(wǎng)時的事實(shí)錯誤
減少諂媚傾向:通過獎勵機(jī)制減少它盲目迎合用戶
承認(rèn)做不到:遇到無法完成的任務(wù),會明確告訴你,而不是裝作完成了
在外部紅隊(duì)的 Prompt Injection 測試中,GPT-5-thinking 在攻擊成功率上只有 56.8%(k=10),明顯好于其他主流模型,但也說明這問題還沒解決,超過一半的多次嘗試仍然能突破防線。
5 GPT-5的發(fā)布時機(jī)
這次發(fā)布的時機(jī)非常 “奧特曼”:
谷歌剛發(fā) Gemini Pro 1.5,他立刻甩出 GPT-5 搶頭條
一口氣覆蓋免費(fèi)到 $200/月全價位用戶
同步進(jìn)駐微軟全家桶(Copilot、Azure AI)
這不僅是技術(shù)迭代和價格戰(zhàn),更是生態(tài)戰(zhàn):讓所有用戶和開發(fā)者在 GPT-5 體系里閉環(huán),不給競品留空間。
6 沒有突破性技術(shù),AI進(jìn)入瓶頸期?
別看這次 GPT-5 發(fā)布得聲勢浩大,價格表甩得啪啪響,性能數(shù)據(jù)擺得整整齊齊,但如果你把興奮勁壓下來,就會發(fā)現(xiàn)一個殘酷事實(shí):
這次的內(nèi)核,并沒有任何真正的 “質(zhì)變”技術(shù)突破。
它的推理能力更強(qiáng)、上下文更大、工具用得更靈活,這些進(jìn)步本質(zhì)上都是在現(xiàn)有LLM架構(gòu)下的堆料與優(yōu)化。
而這恰恰暴露了一個可能讓整個行業(yè)都不安的信號:
我們是不是已經(jīng)接近了這一代 AI 技術(shù)的 “天花板” ?
想想看,過去兩年里,AI 大模型的驚艷時刻幾乎都發(fā)生在 2022-2023:ChatGPT 橫空出世、GPT-4 讓人驚掉下巴、Stable Diffusion 把圖像生成送到民用級別、Midjourney 的畫風(fēng)一度封神。
可到了 2024-2025,這些新品的“驚喜值”明顯下降,發(fā)布會更多是在講降價、整合、生態(tài),而不是在炫耀什么 “完全新的智能范式”。
而且,目前大模型的訓(xùn)練成本依然高得難以落地,性能提升卻越來越依賴于數(shù)據(jù)清洗、推理策略優(yōu)化這種 “精裝修” 工作,而不是地基上的革命。
這可能意味著:
下一代質(zhì)變可能需要全新的架構(gòu)突破,而不是繼續(xù)把 Transformer 喂到天荒地老。
當(dāng)前的 LLM,很可能已經(jīng)到了一個短期內(nèi)難以跨越的瓶頸期,我們不知道這個瓶頸會持續(xù)一年,還是五年。
換句話說,GPT-5 是一次優(yōu)秀的迭代,但它的意義更像是 “蘋果把 iPhone 15 做到了極致”,而不是 “喬布斯第一次拿出 iPhone ”。
對于GPT-5,你是驚喜呢?還是失望呢?
歡迎在評論區(qū)討論!
原文標(biāo)題 : GPT5來了!奧特曼真聽勸,但我擔(dān)心的還是發(fā)生了......

發(fā)表評論
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
即日-9.16點(diǎn)擊進(jìn)入 >> 【限時福利】TE 2025國際物聯(lián)網(wǎng)展·深圳站
-
10月23日火熱報(bào)名中>> 2025是德科技創(chuàng)新技術(shù)峰會
-
10月23日立即報(bào)名>> Works With 開發(fā)者大會深圳站
-
10月24日立即參評>> 【評選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評選
-
11月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會
-
12月18日立即報(bào)名>> 【線下會議】OFweek 2025(第十屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會
推薦專題
- 1 先進(jìn)算力新選擇 | 2025華為算力場景發(fā)布會暨北京xPN伙伴大會成功舉辦
- 2 人形機(jī)器人,正狂奔在批量交付的曠野
- 3 宇樹機(jī)器人撞人事件的深度剖析:六維力傳感器如何成為人機(jī)安全的關(guān)鍵屏障
- 4 解碼特斯拉新AI芯片戰(zhàn)略 :從Dojo到AI5和AI6推理引擎
- 5 AI版“四萬億刺激”計(jì)劃來了
- 6 2025年8月人工智能投融資觀察
- 7 騰訊 Q2 財(cái)報(bào)亮眼:AI 已成第二增長曲線
- 8 9 a16z最新AI百強(qiáng)榜:硅谷頂級VC帶你讀懂全球生成式AI賽道最新趨勢
- 10 Manus跑路,大廠掉線,只能靠DeepSeek了