深度學習三巨頭之Yoshua Bengio暢談AI如何才能說“人話”
因果邏輯關(guān)系是機器“吃透”人類語言的關(guān)鍵
研究發(fā)現(xiàn)很多實驗室數(shù)據(jù)其實是無效的,一旦環(huán)境改變了,人工智能就會“一臉懵圈”,背后的原因是關(guān)系紐帶的不對,比如圖像識別,實驗者認為引發(fā)人工智能做出判斷的因素是圖片的紋理和顏色,而實際上人類在識別圖像時還會考慮因果關(guān)系,這就是差別。
為了攻克這方面的缺陷,科學家們提出了深度生成模型,它的優(yōu)勢在于通過激勵人工智能在訓練中預(yù)測未來,從而通過培養(yǎng)模型的因果邏輯性提升輸出的準確性,以及深層對抗模型可以不斷提升輸出的準確性,更重要的是人工智能通過訓練最終具備預(yù)測未來以及制定計劃的能力。
在機器學習的訓練中,不僅需要注意因果邏輯,還需要注意用于訓練的樣本數(shù)據(jù)需要遵循獨立同分布原則(Independent and identically distributed):關(guān)注用于訓練的數(shù)據(jù)集的代表性和遷移性,樣本數(shù)據(jù)的分布特征必須和測試用數(shù)據(jù)集、母體數(shù)據(jù)保持一致,研究發(fā)現(xiàn)確保數(shù)據(jù)分布一致性可強化訓練模型的因果邏輯推理能力。
人工智能娃娃游戲平臺(BabyAIgame)
人工智能娃娃游戲平臺模仿嬰兒的成長過程,設(shè)置了‘學習者’和‘人類’的游戲或場景。學習者就是‘babyAI’,我們?yōu)閷W習者設(shè)計任務(wù),任務(wù)以自然語言的形式出現(xiàn),比如去某個地方、打開、撿、放等,通過與人類用自然語言互動幫助學習者理解周圍的環(huán)境。
從科學實驗的角度出發(fā),項目的實施過程將會是趣味性十足的!
首先,大量的人機交互數(shù)據(jù)(尤其是語言)將會被收集,隨著玩家(人類)越來越多,數(shù)據(jù)庫也會越來越大。
另外,游戲甚至允許人類玩家在游戲中自行設(shè)計任務(wù),任務(wù)難度逐漸提升。
該項目最大的挑戰(zhàn)來自于樣本數(shù)據(jù)的復(fù)雜性,哪怕只是非常簡單的任務(wù),比如讓計算機挪動小件物體,對于訓練用的數(shù)據(jù)量要求也是非常巨大的,因此我們首先需要海量的數(shù)據(jù)服務(wù)于這個雄心勃勃的計劃:記錄真實世界中成年人與嬰兒之間互動的數(shù)據(jù)。
“意識先驗”理論:過濾冗余數(shù)據(jù),降低算力消耗
圖片來源: Bengio的演講 Challenges for Deep Learning towards Human-Level AI
傳統(tǒng)的深度學習理論需要大量的數(shù)據(jù),注意力機制的出現(xiàn)為解決訓練數(shù)據(jù)容量的難題帶來了解決思路,但僅僅具備無意識的認知能力(第一類認知系統(tǒng))還遠遠不夠。
為了將機器的推理能力提升到人類水平,我們在現(xiàn)有模型的基礎(chǔ)上,增加預(yù)測未來的能力,即意識先驗(The Consciousness Prior),直觀的說就是人工智能看到“下雨”,聯(lián)想到“人們會打傘”。
意識先驗借用了注意力機制的部分原理篩選出少量、“高緯”的數(shù)據(jù),用作大量的預(yù)測訓練,將無意識層次的數(shù)據(jù)歸類為“低緯數(shù)據(jù)”,使用少量的、更直接的高層次數(shù)據(jù)提升了模型預(yù)測和推理能力,也減少了訓練用時,最終成為有“意識”的類人腦。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機器人東風翻身?