從ChatGPT到Sora,奧特曼要做創(chuàng)世者?
出品 | 何璽 排版 | 葉媛
ChatGPT之后,OpenAI再次讓人驚嘆!2月16日,奧特曼發(fā)布OpenAI首個(gè)視頻生成大模型Sora。
01
Sora能做什么?它又為什么讓業(yè)界如此震驚?
首先,Sora能夠圖文成片。文本成片方面,Sora能夠根據(jù)用戶提供的文本描述完整、準(zhǔn)確生成長(zhǎng)達(dá)60S的的高品質(zhì)視頻。圖片成片方面,Sora不僅能夠從文本生成視頻,還能夠從現(xiàn)有的靜態(tài)圖像開(kāi)始,準(zhǔn)確地動(dòng)畫(huà)化圖像內(nèi)容,或者擴(kuò)展現(xiàn)有視頻,填補(bǔ)視頻中的缺失幀。此外,Sora還能夠生成包含多個(gè)角色、特定運(yùn)動(dòng)類型以及主題精確、背景細(xì)節(jié)復(fù)雜的場(chǎng)景。要知道,再此之前,Pika,RunwayMl,Stable Video等AI視頻大模型一次性生成的視頻時(shí)長(zhǎng)也就幾秒。
其次,Sora還有強(qiáng)大的語(yǔ)音理解能力和多鏡頭生成能力。語(yǔ)言理解方面,Sora能夠準(zhǔn)確解釋提示并生成能表達(dá)豐富情感的角色。這使得模型能夠更好地理解用戶的文本指令,并在生成的視頻內(nèi)容中忠實(shí)地反映這些指令。多鏡頭方面,Sora可以在單個(gè)生成的視頻中創(chuàng)建多個(gè)鏡頭,同時(shí)保持角色和視覺(jué)風(fēng)格的一致性。這種能力對(duì)于制作電影預(yù)告片、動(dòng)畫(huà)或其他需要多視角展示的內(nèi)容非常有用。
第三,Sora有強(qiáng)大的物理世界模擬能力。Sora能夠模擬現(xiàn)實(shí)世界的一些人、動(dòng)物和環(huán)境方面行為的能力。值得一提的是,這些屬性的出現(xiàn)并沒(méi)有依賴于任何明確的3D建模、物體識(shí)別等歸納偏差,而是純粹通過(guò)模型的尺度擴(kuò)展而自然涌現(xiàn)的。
第三點(diǎn)有一點(diǎn)不好理解,璽哥簡(jiǎn)單解釋一下,就是Sora已經(jīng)初步具有了洞察物理世界運(yùn)行規(guī)律的能力。比如人物人類“咬”食物后,食物會(huì)留下咬痕,畫(huà)家在畫(huà)布上涂抹會(huì)留下新的筆觸等。
除了以上能力,Sora還具有視頻到視頻編輯,圖片生成等能力。
02
薩姆奧特曼要做創(chuàng)世者?
看到這里,或許有人會(huì)說(shuō),Sora雖然強(qiáng)大,但也就是一個(gè)視頻生成模型而已,如果你也這樣認(rèn)為,那就大錯(cuò)特錯(cuò)了。下面璽哥聊聊個(gè)人對(duì)Sora的一點(diǎn)看法。
目前我們看到的Sora生成的視頻還只是OpenAI放出來(lái)的demo,但從放出來(lái)的這些視頻可知,在洞察物理世界運(yùn)行規(guī)律這件事情上,OpenAI已經(jīng)找到了一條模擬真實(shí)世界的路徑。而從OpenAI官方文檔透露的信息來(lái)看,Sora并不只是做一個(gè)簡(jiǎn)單的視頻生成工具,其根本目的是做一個(gè)物理世界模擬器,為真實(shí)世界建模;蛟S在不遠(yuǎn)的未來(lái),OpenAI將構(gòu)建一個(gè)和真實(shí)世界一模一樣的”AI擬真世界“。這個(gè)”AI擬真世界“不僅有和真實(shí)世界一模一樣的山川河流等自然環(huán)境,也有一模一樣的物理運(yùn)行規(guī)則。那時(shí),人類或可以在這個(gè)擬真世界以百倍,千倍,萬(wàn)倍的效率完成學(xué)習(xí)、成長(zhǎng)。
當(dāng)然,想要在這個(gè)”AI擬真世界“生活,你必須要有一個(gè)AI世界的身份,那就是人類的“數(shù)字人”分身。談到數(shù)字人分身,我們不得不提ChatGPT,因?yàn)樗?ldquo;人”了。ChatGPT不僅能夠通過(guò)學(xué)習(xí)和理解人類的語(yǔ)言來(lái)進(jìn)行對(duì)話,還能根據(jù)聊天的上下文進(jìn)行互動(dòng)。ChatGPT不僅能理解人的意圖,還有自己的思辨能力,能夠推理,能夠勝任許多人類工作。現(xiàn)在,隨著應(yīng)用商店的發(fā)布,ChatGPT更實(shí)現(xiàn)了對(duì)人類能力的分類。
現(xiàn)在,我們把Sora和ChatGPT結(jié)合起來(lái)看看,一個(gè)是要復(fù)制一個(gè)真實(shí)的物理環(huán)境,一個(gè)是要復(fù)制一個(gè)真實(shí)的人,真實(shí)的物理環(huán)境+人,不就等于一個(gè)新的世界嗎?
或許在不久的將來(lái),我們的人生就將分成兩部分,一個(gè)是AI世界中的我們,一個(gè)是現(xiàn)實(shí)世界的我們。至于是AI世界中的我們更重要,還是現(xiàn)實(shí)世界中的我們更重要,就要看個(gè)人更適合在哪種環(huán)境中生活了。
到那個(gè)時(shí)候,或許奧特曼真的就成了“AI擬真世界”的創(chuàng)世者。
原文標(biāo)題 : 從ChatGPT到Sora,奧特曼要做創(chuàng)世者?

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
-
機(jī)器人奧運(yùn)會(huì)戰(zhàn)報(bào):宇樹(shù)機(jī)器人摘下首金,天工Ultra搶走首位“百米飛人”
-
存儲(chǔ)圈掐架!江波龍起訴佰維,索賠121萬(wàn)
-
長(zhǎng)安汽車母公司突然更名:從“中國(guó)長(zhǎng)安”到“辰致科技”
-
豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
-
字節(jié)AI Lab負(fù)責(zé)人李航卸任后返聘,Seed進(jìn)入調(diào)整期
-
員工持股爆雷?廣汽埃安緊急回應(yīng)
-
中國(guó)“智造”背后的「關(guān)鍵力量」
-
小米汽車研發(fā)中心重磅落地,寶馬家門口“搶人”
最新活動(dòng)更多
-
即日-9.16點(diǎn)擊進(jìn)入 >> 【限時(shí)福利】TE 2025國(guó)際物聯(lián)網(wǎng)展·深圳站
-
10月23日火熱報(bào)名中>> 2025是德科技創(chuàng)新技術(shù)峰會(huì)
-
10月23日立即報(bào)名>> Works With 開(kāi)發(fā)者大會(huì)深圳站
-
10月24日立即參評(píng)>> 【評(píng)選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評(píng)選
-
11月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
12月18日立即報(bào)名>> 【線下會(huì)議】OFweek 2025(第十屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
推薦專題
- 1 先進(jìn)算力新選擇 | 2025華為算力場(chǎng)景發(fā)布會(huì)暨北京xPN伙伴大會(huì)成功舉辦
- 2 人形機(jī)器人,正狂奔在批量交付的曠野
- 3 宇樹(shù)機(jī)器人撞人事件的深度剖析:六維力傳感器如何成為人機(jī)安全的關(guān)鍵屏障
- 4 解碼特斯拉新AI芯片戰(zhàn)略 :從Dojo到AI5和AI6推理引擎
- 5 AI版“四萬(wàn)億刺激”計(jì)劃來(lái)了
- 6 2025年8月人工智能投融資觀察
- 7 騰訊 Q2 財(cái)報(bào)亮眼:AI 已成第二增長(zhǎng)曲線
- 8 9 a16z最新AI百?gòu)?qiáng)榜:硅谷頂級(jí)VC帶你讀懂全球生成式AI賽道最新趨勢(shì)
- 10 Manus跑路,大廠掉線,只能靠DeepSeek了