OpenAI發(fā)布最強AI模型!
沒等來GPT-5,卻等來了OpenAI悄悄發(fā)布的「o3-pro」。
我們一起看看這個聲稱 “最強AI模型” 的o3-pro,有哪些亮點?適合哪些人使用?
1 什么是o3-pro?
簡單來說,o3-pro是o3推理模型的加強版。官方介紹它是目前推理能力最強的一代。
具體來說,o3-pro是專門為復雜問題設計的:它不追求快,而是強調(diào)“想得清楚”。像數(shù)學、科學、編程、寫作、教育類任務,它處理得更有條理,輸出內(nèi)容更準確、結構更清晰。
2 性能表現(xiàn)亮眼
先來上成績單。
在專家評估中,o3-pro比o3得到了更多認可。
在OpenAI內(nèi)部的測試數(shù)據(jù)中,o3-pro表現(xiàn)相當亮眼:
在數(shù)學測試AIME 2024中,超過了谷歌的 Gemini 2.5 Pro。
在GPQA Diamond(博士級科學知識評測)中,勝過了Anthropic家的 Claude 4 Opus。
在編程測試Codeforces中,也比前代模型有了不小的提升。
這些測試都是針對邏輯嚴謹性和知識深度的高難度評估。能在這里脫穎而出,確實說明了OpenAI在思考推理能力上的進步。
此外,OpenAI還用 “4/4可靠性評估” 來證明了o3-pro的可靠性(4次回答全部正確才被視為成功)。
3 價格如何?
來看下API調(diào)用的價格:
輸入:$20/百萬token
輸出:$80/百萬token
相較于普通o3,價格貴了10倍......
4 最強也有局限性
再強的模型,也不是十全十美。
OpenAI列出了目前o3-pro存在的一些局限:
速度比前代慢,輸出時間更長;
暫不支持圖像生成;
暫時不兼容Canvas功能;
ChatGPT中無法使用“臨時對話”功能。
不過這些問題對大多數(shù)文字為主的使用場景來說,影響不大。但如果你要的是深度和準確性,那就得接受慢工出細活兒。
目前,o3-pro已經(jīng)面向ChatGPT Pro和Team用戶開放,企業(yè)和教育用戶下周可用。
如果你日常對AI回答的質(zhì)量、準確率有較高要求,不妨試試看。
原文標題 : OpenAI發(fā)布最強AI模型!

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語權
- 2 又一巨頭裁員6000人,賠償N+8!
- 3 全民智駕,宣告結束
- 4 深度報告|中國AI產(chǎn)業(yè)正在崛起成全球力量,市場潛力和關鍵挑戰(zhàn)有哪些?
- 5 上海跑出80億超級獨角獸:獲上市公司戰(zhàn)投,干人形機器人
- 6 國家數(shù)據(jù)局局長劉烈宏調(diào)研格創(chuàng)東智
- 7 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 8 百億AI芯片訂單,瘋狂傾銷中東?
- 9 Robotaxi新消息密集釋放,量產(chǎn)元年誰在領跑?
- 10 格斗大賽出圈!人形機器人致命短板曝光:頭腦過于簡單