教AI玩《我的世界》,F(xiàn)acebook意圖打造能自我學(xué)習(xí)的多任務(wù)AI系統(tǒng)
從玩游戲到人臉識別,機器智能在一系列任務(wù)上的表現(xiàn)都超過了人類。
但令人尷尬的事實是,AI系統(tǒng)仍然無法處理多項任務(wù)。AI研究人員的下一個大目標(biāo)是開發(fā)一個能很好地完成很多任務(wù)的系統(tǒng),而不是只擅長一項任務(wù)的超級人類。
Facebook Research的Arthur Szlam和同事們進入了這一領(lǐng)域,他們已經(jīng)開始研究的AI助理能夠和人類互動,然后根據(jù)請求執(zhí)行各種任務(wù)。至關(guān)重要的是,這些助理可以從互動中學(xué)習(xí),從而增加其執(zhí)行任務(wù)的范圍。
Szlam及其同事選擇通過《我的世界》來實現(xiàn)這一目標(biāo)。這是一款3D沙盒視頻游戲,允許玩家在一個獨特的、無限的在線世界中探索、構(gòu)建、制作甚至戰(zhàn)斗。
《我的世界》是有史以來最暢銷的電子游戲,已售出超過1.7億份。每月有超過9000萬人在參與這個游戲。
但讓它對AI研究有用的是,盡管《我的世界》提供了無限的多樣性,但它的規(guī)則也很簡單,在一定范圍內(nèi)是可預(yù)測的。AI研究人員已經(jīng)開始使用它來訓(xùn)練和測試各種AI系統(tǒng)。
現(xiàn)在,Szlam和他的同事正在更進一步發(fā)展。他們表示:“我們感興趣的不是在單個困難任務(wù)上的超人表現(xiàn),而是在大量更簡單任務(wù)上的能力,而這些任務(wù)是由人類指定的!
《我的世界》是AI向人類學(xué)習(xí)的完美環(huán)境。他們說道:“由于我們是在游戲環(huán)境中工作的,玩家可能喜歡在開發(fā)過程中與助手進行互動,這為人類參與到的環(huán)形研究提供了豐富的資源!
乍一看,《我的世界》中可能出現(xiàn)的行動數(shù)量是巨大的。Szlam和同事表示:“一個玩家在游戲中可能做的事情是非常多的;最天真的是,涉及所有區(qū)塊的可行方法需要占據(jù)所有的內(nèi)存。”
但《我的世界》中的絕大多數(shù)區(qū)塊布置都是不太可能的。他們表示:“我們預(yù)計,助理玩家請求的布置將集中在游戲中實際可能的一小部分。”
這使得AI的任務(wù)變得簡單得多。Facebook團隊認為,即使他們的AI系統(tǒng)在很多任務(wù)上失敗了,它仍然是有用的。他們表示:“我們相信,我們可以在成為一名有用的助理方面取得進展,而不必能夠成功應(yīng)對每一個可能的請求。”
但這仍然具有挑戰(zhàn)性。困難之一是理解普通語言。Facebook團隊設(shè)想了以下要求:
玩家:建造一座15個區(qū)塊高的塔樓,然后在上面放上一個巨大的笑臉。
助理:好的。
這個相對簡單的要求需要大量的知識。助理必須理解“塔”的概念和如何建造一座塔,知道“15個區(qū)塊高”是測量塔的高度,知道“15”是什么。它還需要理解“笑臉”這個詞,以及如何構(gòu)建它,并知道將它放在“頂部”意味著什么。不難想象這些請求會變得多么復(fù)雜。
但AI學(xué)習(xí)的機會是巨大的。如果Facebook能夠獲得足夠多的人類幫助,那么這個助理就可以要求人類幫助它學(xué)習(xí)。
而Facebook正在把設(shè)計AI的任務(wù)設(shè)定為自我完善。對AI系統(tǒng)最常見的批評之一是,它們除了接受過收集準(zhǔn)備好的數(shù)據(jù)所提供的訓(xùn)練外,沒有學(xué)到新的任務(wù)。但研究者認為,《我的世界》環(huán)境是發(fā)展這種學(xué)習(xí)的理想環(huán)境。
這是一項有趣的工作,為Facebook制定了一個雄心勃勃的目標(biāo)。當(dāng)然,現(xiàn)在還為時尚早。該團隊將這項工作描述為“戰(zhàn)斗的召喚”。
不過,該助理的早期版本已經(jīng)可供普通用戶開始試用,任何人都可以下載。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機器人東風(fēng)翻身?