GPT-5前菜!OpenAI最強(qiáng)模型o3上手:到底強(qiáng)在哪?
最近 OpenAI 的活確實(shí)有點(diǎn)多。在 3 月底推出 GPT-4o 原生圖像生成再度火遍全球后,北京時(shí)間 4 月 15 日凌晨,OpenAI 又推出了全新 GPT-4.1 系列模型,替代舊款的 GPT-4 模型。
而就在今天(4 月 17 日)凌晨,OpenAI 如約繼續(xù)推出了兩款全新的 o 系列推理模型——o3、o4-mini,替代此前的 o1 和 o3-mini。更重要的是,o3、o4-mini 不僅擁有了更強(qiáng)大的推理能力,支持將圖像直接納入「思考過(guò)程」,還是首次能夠獨(dú)立使用全部 ChatGPT 工具的推理模型,被官方稱(chēng)為:
「我們(OpenAI)迄今為止發(fā)布的最智能的模型,代表了 ChatGPT 能力的一次飛躍!
飛不飛躍我們先按下不談,但有一點(diǎn)實(shí)在讓人在意。OpenAI CEO 山姆·奧爾特曼(Sam Altman)今年 2 月就在 X 平臺(tái)公開(kāi)披露內(nèi)部的模型路線圖,指出 GPT-4.5(Orion)將是「OpenAI 最后一個(gè)非推理(思維鏈)模型」,還說(shuō)之后的 GPT-5 將整合 GPT 系列和 o 系列模型:
「不再將 o3 作為獨(dú)立模型推出!
圖/ X
但現(xiàn)在來(lái)看,山姆·奧爾特曼當(dāng)時(shí)的承諾似乎一個(gè)都沒(méi)有兌現(xiàn),OpenAI 不僅發(fā)布了新的 GPT-4.1 系列非推理模型,還獨(dú)立推出了 o3 推理模型。那還有一直活在傳聞的 GPT-5,我們真的能在今年夏天看到嗎?
OpenAI 又發(fā)一波模型,o3是最特別的一個(gè)
GPT-4.1 系列、o3、o4-mini 發(fā)布之前,關(guān)于 OpenAI 太多模型的吐槽其實(shí)就已經(jīng)甚囂塵上,不僅是普通 ChatGPT 用戶,也包括很多開(kāi)發(fā)者,也認(rèn)為 OpenAI 的模型陣容讓人「選擇困難」。
好在,雖然過(guò)去兩天 OpenAI 又連發(fā)了好幾個(gè)新模型,但至少也同步砍掉了一些「舊模型」。在 GPT-4.1 正式推出后,OpenAI 就預(yù)告將于 4 月 30 日在 ChatGPT 全面下線 GPT-4 模型,同時(shí)還將在 API 中(面向開(kāi)發(fā)者)棄用 GPT-4.5 預(yù)覽版。
作為通用基座模型,GPT-4.1 實(shí)際分為了旗艦版、mini 版、nano 版,支持高達(dá)百萬(wàn)級(jí) tokens 上下文,在性能、成本和速度上全面優(yōu)于目前最主力的 GPT-4o 系列模型,但目前僅面向開(kāi)發(fā)者上線 API。
但如果說(shuō) GPT-4.1 代表了 OpenAI 的現(xiàn)在,o3 和 o4-mini,可能就代表了 OpenAI 的未來(lái)。作為 OpenAI 探索推理模型技術(shù)路線的最新成果,o3 和 o4-mini 率先在推理鏈(chain-of-thought)中真正納入圖像理解能力。
圖/ OpenAI
簡(jiǎn)單來(lái)說(shuō),它不僅能識(shí)別信息,還能把這些視覺(jué)輸入納入思維過(guò)程,成為完整邏輯鏈的一部分。不同于 GPT-4o 這類(lèi)多模態(tài)模型,GPT-4o 雖然能「看圖」,但更多是為了給出自然語(yǔ)言響應(yīng),而 o3、o4-mini 的圖像處理是為了解決問(wèn)題——它是推理的一環(huán)。
與此同時(shí),作為官方認(rèn)證的最強(qiáng)模型——o3,還是第一個(gè)調(diào)用 ChatGPT 全部工具的推理模型,包括搜索網(wǎng)絡(luò)、Python、圖像生成、代碼解釋器、文件讀取等。并且在與 o1 相同的延遲和成本下,o3 在 ChatGPT 中實(shí)現(xiàn)了更高的性能。
但實(shí)際表現(xiàn)如何,還是上手體驗(yàn)才有結(jié)果。
OpenAI「最強(qiáng)推理模型」上手:名副其實(shí)
對(duì)于推理模型而言,推理能力自然是重中之重,先來(lái)一道倫理推理題,非常考驗(yàn)?zāi)P偷耐评砟芰,我們也?duì)比了 DeepSeek-R1 以及 Gemini-2.5-Pro 兩大頂尖模型。
但在揭曉回答之前,o3 最驚艷的就是思考過(guò)程推導(dǎo)的嚴(yán)謹(jǐn)和流暢,相比之下,DeepSeek-R1 的思考過(guò)程就顯得相當(dāng)冗長(zhǎng)和重復(fù),思考非常久,最終的回答卻很難令人滿意。
圖/雷科技
在 DeepSeek-R1 的回答中,實(shí)際只回答了「憤怒的原因」,而沒(méi)有回答出「崩潰的原因」。在 Gemini-2.5-Pro 的回答中,雖然更進(jìn)一步推理出了「女兒撒謊」這個(gè)因素,但也很難導(dǎo)致「父親崩潰」。
圖/雷科技
o3 則相當(dāng)完美地抓出「色盲」的關(guān)鍵判斷,進(jìn)一步根據(jù)生物遺傳知識(shí)推導(dǎo)出最終的解釋。這里還要一提的是,其實(shí) DeepSeek-R1 在思考過(guò)程中也提到了「色盲」這個(gè)點(diǎn),但并沒(méi)有認(rèn)為有效的推導(dǎo)。
此外,o3 以及 o4-mini 的一大突破在于將視覺(jué)能力納入思維鏈之中,相比之前阿里推出的視覺(jué)推理模型 QVQ-Max 更進(jìn)了一步。
你可以上傳一張機(jī)場(chǎng)照片,它會(huì)識(shí)別出航站樓建筑、乘客流線和標(biāo)識(shí)系統(tǒng),再結(jié)合你的問(wèn)題完成空間動(dòng)線的規(guī)劃或問(wèn)題診斷。這種「圖像不是輸入素材,而是參與推理的變量」的設(shè)計(jì),也是過(guò)去 o 系列推理模型所不具備的。
更重要的是,它可以根據(jù)圖像實(shí)時(shí)思考分析策略。
比如最近 AI 行業(yè)非常關(guān)鍵的一件事,就是支付寶在前幾天聯(lián)合魔搭社區(qū)剛剛上線了支付 MCP Server 讓 AI 智能體打通了「變現(xiàn)」的支付環(huán)節(jié)。我就拿一段演示視頻發(fā)送給 o3,詢問(wèn)「視頻里展示技術(shù)的關(guān)鍵之處」,甚至沒(méi)有告訴它任何背景信息。
圖/雷科技
而在實(shí)際測(cè)試中,o3 會(huì)提取不同時(shí)間的關(guān)鍵幀理解視頻,再結(jié)合自身分析推理和聯(lián)網(wǎng)能力,明確定位到了支付寶「支付 MCPServer」的,并且結(jié)合信息分析了支付寶「支付 MCPServer」的關(guān)鍵意義。
不僅如此,在一段關(guān)于短視頻優(yōu)化的測(cè)試中,o3 被要求分析后臺(tái)數(shù)據(jù)并結(jié)合視頻分鏡做優(yōu)化策略,輸出的內(nèi)容不僅覆蓋「3 秒留人、節(jié)奏剪輯、文案鉤子」等核心策略,還匹配了具體視覺(jué)節(jié)奏建議。
圖/雷科技
這點(diǎn)來(lái)看,o3 很像一個(gè)有一定審美和經(jīng)驗(yàn)的「專(zhuān)業(yè)創(chuàng)作者助手」,能針對(duì)實(shí)際的視頻內(nèi)容,而不是「簡(jiǎn)單套模板」的自動(dòng)化建議。
而從這些測(cè)試也能看出,o3 懂得什么時(shí)候該分析、什么時(shí)候該搜索、什么時(shí)候該調(diào)用工具、什么時(shí)候該總結(jié)。而這種「主動(dòng)思維+執(zhí)行鏈條」,正是當(dāng)下大模型集體演進(jìn)的一個(gè)重要方向。
所以,它真的是 OpenAI 迄今為止最智能的模型嗎?從目前的體驗(yàn)來(lái)看,確實(shí)稱(chēng)得上名副其實(shí),甚至在不同推理模型的對(duì)比也是表現(xiàn)最強(qiáng)的。
寫(xiě)在最后
用完 o3 最大的感受,你會(huì)覺(jué)得它在真正理解任務(wù)——而不只是理解你的意圖。在思考過(guò)程中能夠明顯看到這一點(diǎn),同時(shí)還有 o3 在視覺(jué)理解、工具調(diào)用以及強(qiáng)大的推理能力。
也正因?yàn)槿绱,用?o3 后,那些關(guān)于 GPT-5 的想象也變得更具體了。
山姆·奧爾特曼明確說(shuō)過(guò),GPT-5 會(huì)整合 GPT 系列與 o 系列,而按照最新透露出的消息,GPT-5 的推出時(shí)間基本鎖定在今年夏天。按照時(shí)間來(lái)看,GPT-4.1/GPT-4.5 和 o3/o4-mini 很可能就是最后一代「獨(dú)立」模型,也是被「整合」的主力。
如果兩者真的融合,那會(huì)不會(huì)是一個(gè)既能讀百萬(wàn) tokens,又能跨模態(tài)行動(dòng),還能自主調(diào)度工具進(jìn)行思維鏈的大一統(tǒng)模型?無(wú)論如何,這確實(shí)是未來(lái)幾個(gè)月 AI 行業(yè)最值得期待的懸念之一。
來(lái)源:雷科技
原文標(biāo)題 : GPT-5前菜!OpenAI最強(qiáng)模型o3上手:到底強(qiáng)在哪?

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
即日-6.16立即報(bào)名>> 【在線會(huì)議】olution Talks |Computex 2025關(guān)鍵趨勢(shì)深讀
-
6月20日立即下載>> 【白皮書(shū)】精準(zhǔn)測(cè)量 安全高效——福祿克光伏行業(yè)解決方案
-
7月3日立即報(bào)名>> 【在線會(huì)議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車(chē)生態(tài)圈峰會(huì)
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身機(jī)器人動(dòng)力電池技術(shù)應(yīng)用大會(huì)
推薦專(zhuān)題
- 1 AI 眼鏡讓百萬(wàn) APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語(yǔ)權(quán)
- 3 深度報(bào)告|中國(guó)AI產(chǎn)業(yè)正在崛起成全球力量,市場(chǎng)潛力和關(guān)鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級(jí)獨(dú)角獸:獲上市公司戰(zhàn)投,干人形機(jī)器人
- 5 國(guó)家數(shù)據(jù)局局長(zhǎng)劉烈宏調(diào)研格創(chuàng)東智
- 6 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 7 百億AI芯片訂單,瘋狂傾銷(xiāo)中東?
- 8 Robotaxi新消息密集釋放,量產(chǎn)元年誰(shuí)在領(lǐng)跑?
- 9 格斗大賽出圈!人形機(jī)器人致命短板曝光:頭腦過(guò)于簡(jiǎn)單
- 10 “搶灘”家用機(jī)器人領(lǐng)域,聯(lián)通、海爾、美的等紛紛入局