人工智能領(lǐng)域面臨極化,巨頭實驗室或?qū)⒅髟譇I未來
他說:“我曾經(jīng)以為機器不可能打五對五的,更不用說贏了。我絕對被征服了!
這種技術(shù)在游戲中的應(yīng)用令人印象深刻,但許多人工智能專家質(zhì)疑它是否最終能轉(zhuǎn)化為解決現(xiàn)實問題。專注于人工智能的喬治亞理工學(xué)院計算機教授Mark Riedl質(zhì)疑到:DeepMind的代理人事實上并沒有真正在合作。他們只是回應(yīng)游戲中發(fā)生的事情,而不是像人類玩家那樣互相交換信息。(甚至渺小如螞蟻也可以通過交換化學(xué)信號進行協(xié)作。)
雖然結(jié)果看起來像是協(xié)作,但這是因為代理人作為個體本身是可以完全理解游戲中發(fā)生的事情。
負責(zé)該項目的另一位DeepMind研究員Max Jaderberg則表示:“如何定義團隊合作并不是我想要解決的問題。但是一名代理人在對手的大本營坐等旗子出現(xiàn)這種情況,只有在依靠隊友時才有可能出現(xiàn)!
像這樣的游戲并不像現(xiàn)實世界那么復(fù)雜。Riedl博士說到:“3D環(huán)境旨在使導(dǎo)航變得容易。Quake的戰(zhàn)略與協(xié)調(diào)很簡單!
強化學(xué)習(xí)非常適合這類游戲。在視頻游戲中,很容易識別成功的指標:獲得更多的得分。但在現(xiàn)實世界中,沒有人能保持得分。研究人員必須以其他方式定義成功。
這一點是可以實現(xiàn)的,至少在簡單的任務(wù)中。OpenAI的研究人員訓(xùn)練了一個機器人手像孩子一樣來操縱字母塊——告訴它給你看字母A,它就會拿字母A給你看。
在谷歌機器人實驗室,研究人員已經(jīng)證明機器可以學(xué)習(xí)拾取隨機物品,例如乒乓球、塑料香蕉,并將它們?nèi)拥綆子⒊咄獾睦淅铩_@種技術(shù)或許在將來可以應(yīng)用到亞馬遜、聯(lián)邦快遞和其他公司運營的大型倉庫和配送中心。目前,這些工作還是由人類工作者來完成的。
如DeepMind和OpenAI這樣的實驗室要想解決更大的問題,他們可能開始需要大量的計算能力。因為OpenAI的系統(tǒng)在幾個月內(nèi)通過完成需要多年時間才能完成的45萬多輪游戲?qū)W會了玩Dota,這依賴于成千上萬的計算機芯片。Brockman表示光買這些芯片就讓實驗室花費了數(shù)百萬美元。
卡內(nèi)基梅隆大學(xué)研究員Devendra Chaplot表示,由各種硅谷大拿,其中包括Khosla Ventures和科技億萬富翁Reid Hoffman在內(nèi)資助的DeepMind和OpenAI可以負擔(dān)得起這些計算能力。但是,學(xué)術(shù)實驗室和其他小型企業(yè)不能。對某些人來說,他們擔(dān)心的是那些資金充足的實驗室將主宰人工智能的未來。
但即使是大型實驗室也可能沒有將這些技術(shù)轉(zhuǎn)移到現(xiàn)實世界的復(fù)雜性所需的計算能力,因為這可能需要更厲害的人工智能形式——人工智能需要學(xué)得更快。雖然機器現(xiàn)在可以在虛擬世界中贏得奪旗游戲,但讓他們在夏令營中開放的場地上贏得游戲仍然無望,并且這將持續(xù)相當(dāng)長一段時間。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機器人東風(fēng)翻身?