色花堂国产精品网页,中文字幕天堂一区在线二区,av网站免费在线观看

深度學(xué)習(xí)三巨頭之Yoshua Bengio暢談AI如何才能說(shuō)“人話”

2019-02-25 10:21

在人工智能深度學(xué)習(xí)的研究中，科學(xué)家們發(fā)現(xiàn)語(yǔ)言學(xué)習(xí)是其中最為復(fù)雜的領(lǐng)域，語(yǔ)言本身可表達(dá)表層意思，也能表達(dá)深層語(yǔ)義，因此機(jī)器的語(yǔ)言理解能力不僅包括描述能力，也包括解讀和舉一反三的能力，語(yǔ)言的復(fù)雜性與人類文明的演變息息相關(guān)，因此科學(xué)家們?cè)跇?gòu)建語(yǔ)言學(xué)習(xí)模型的同時(shí)，也開始將研究焦點(diǎn)從語(yǔ)言本身擴(kuò)展到語(yǔ)言的歷史、文明的演進(jìn)等方面，本期焦點(diǎn)人物YoshuaBengio正是該領(lǐng)域的佼佼者。

本期編譯文章來(lái)自于Yoshua Bengio于2018年發(fā)表的關(guān)于“人工智能如何理解語(yǔ)言”的演說(shuō)。Yoshua Bengio將會(huì)講述人工智能在語(yǔ)言理解方面達(dá)到人類水平的要點(diǎn)，并且介紹了他引以為豪的“人工智能娃娃游戲平臺(tái)”，且看他獨(dú)樹一幟的學(xué)術(shù)觀點(diǎn)！

oshuaBengio是深度學(xué)習(xí)三大學(xué)術(shù)巨頭最純粹的學(xué)術(shù)派泰斗級(jí)人物，蒙特利爾大學(xué)計(jì)算機(jī)科學(xué)與運(yùn)算研究系教授、蒙特利爾大學(xué)算法學(xué)院MILA院長(zhǎng)， “人工智能娃娃游戲平臺(tái)（BabyAIgame）”發(fā)起人。

【算力觀點(diǎn)】

語(yǔ)言學(xué)習(xí)面臨兩大主要難題：缺乏高度接近人腦思維的訓(xùn)練模型以及所需算力成本高。Bengio博士提出的“意識(shí)先驗(yàn)”模型了模仿人腦的認(rèn)知系統(tǒng)并且過(guò)濾不參與思考過(guò)程的信息，有望突破語(yǔ)言學(xué)習(xí)模型的瓶頸以及拓寬人工智能在語(yǔ)言學(xué)習(xí)領(lǐng)域的應(yīng)用范圍。

強(qiáng)人工智能的實(shí)現(xiàn)當(dāng)然離我們很遠(yuǎn)，但關(guān)于人工智能的道德倫理問(wèn)題的討論從來(lái)沒有停止過(guò)，當(dāng)人工智能也擁有“意識(shí)”時(shí)將引出兩方面的問(wèn)題，首先是人工智能在法律意義上的社會(huì)身份，其次是它帶來(lái)的潛在威脅，需要全社會(huì)共同關(guān)注。

機(jī)器學(xué)習(xí)人類語(yǔ)言的步驟：先搞懂歷史，再學(xué)習(xí)語(yǔ)言

一直以來(lái)人們都嚴(yán)重低估了處理語(yǔ)言學(xué)習(xí)的難度，甚至有一些研究已經(jīng)在往錯(cuò)誤的方向發(fā)展——依靠非常龐大的語(yǔ)料庫(kù)。

僅僅在語(yǔ)料庫(kù)的基礎(chǔ)訓(xùn)練深度學(xué)習(xí)模型是不夠的，造成的后果是，很多模型訓(xùn)練的效果只能是“捕獲”粗糙的信息，翻譯出來(lái)的句子意思詞不達(dá)意，而優(yōu)秀的深度學(xué)習(xí)可以預(yù)測(cè)基于句子中的其他部分。

在語(yǔ)言理解能力的層次上，初級(jí)和高級(jí)之間的深層差異是“常識(shí)”，以威諾格拉德模式測(cè)試（圖靈測(cè)試的另一個(gè)版本）為例，通過(guò)提問(wèn)的方式測(cè)試機(jī)器是否具備人類的思維能力，比如解讀句子，針對(duì)“女人停止吃藥因?yàn)樗齻儜言辛恕�，�?wèn)題將會(huì)是‘“她們”指的是什么？是女人還是藥？’，而如果將“懷孕”改為“患了癌癥”，答案將會(huì)不一樣。

機(jī)器達(dá)到和人類同等水平的語(yǔ)言理解能力是有可能的，但我們首先要明白當(dāng)我們?nèi)ダ斫饩渥踊蛘呶臋n的時(shí)候，我們的大腦到底經(jīng)歷了什么？

根據(jù)研究發(fā)現(xiàn)，答案是“知識(shí)”，但現(xiàn)有的方法仍然存在局限性。

以學(xué)習(xí)外星人的語(yǔ)言為例，學(xué)習(xí)外星語(yǔ)言的過(guò)程通常是觀察他們的互動(dòng)以及構(gòu)建學(xué)習(xí)模型——關(guān)于他們的互動(dòng)和語(yǔ)言文本關(guān)系的模型，但僅僅憑零碎的單詞或者詞組信息是不夠的，必須理解它們的語(yǔ)境和意圖。

解決的方法是通過(guò)結(jié)合語(yǔ)境升級(jí)訓(xùn)練模型，把信息的前因后果考慮進(jìn)去。但這將會(huì)是難度極高的語(yǔ)言學(xué)習(xí)模型！因?yàn)槲覀冞€需要去理解外星人的社會(huì)形態(tài)。

基于這個(gè)邏輯，需要首先搭建模擬外部世界的學(xué)習(xí)模型，用于理解人與人之間的互動(dòng)行為，理解外部世界是如何運(yùn)作的，最后再回到語(yǔ)言學(xué)習(xí)的部分，最終將模糊語(yǔ)言與實(shí)體世界結(jié)合起來(lái)。

外部世界模型和語(yǔ)言學(xué)習(xí)模型的搭建應(yīng)同步進(jìn)行，原因是來(lái)自人類文明史的啟發(fā)，在人類發(fā)展的進(jìn)程中文明和語(yǔ)言密不可分，初級(jí)社會(huì)向高級(jí)社會(huì)演變的同時(shí)，語(yǔ)言也從個(gè)體化走向社區(qū)化，語(yǔ)言的體系也變得更加的復(fù)雜多樣，反過(guò)來(lái)也促進(jìn)著人類社會(huì)的進(jìn)步。

機(jī)器也要“快思慢想”：構(gòu)造仿人腦的認(rèn)知系統(tǒng)

諾貝爾經(jīng)濟(jì)學(xué)家Kahenman在《快思慢想》中提出人腦的認(rèn)知系統(tǒng)分為一類認(rèn)知系統(tǒng)和二類認(rèn)知系統(tǒng)。

一類認(rèn)知系統(tǒng)負(fù)責(zé)完成可以快速完成的、無(wú)意識(shí)的動(dòng)作，比如口渴時(shí)把水杯拿起來(lái)喝水，但某些情況下可能導(dǎo)致結(jié)果不嚴(yán)謹(jǐn)，由于一類認(rèn)知系統(tǒng)不處理語(yǔ)言信息，只能識(shí)別出眼前的電話，而不能解釋為什么認(rèn)為它是電話。

二類認(rèn)知系統(tǒng)則相反，負(fù)責(zé)耗時(shí)長(zhǎng)、有意識(shí)的動(dòng)作，所以下至語(yǔ)言，上至編程，它都能Hold得住。人類在學(xué)習(xí)計(jì)算機(jī)科學(xué)和邏輯學(xué)當(dāng)中正是大量的用到了二類認(rèn)知系統(tǒng)，而基于符號(hào)學(xué)的人工智能正往二類認(rèn)知系統(tǒng)的方向靠攏。

兼具兩個(gè)系統(tǒng)優(yōu)點(diǎn)的人工智能是我們要實(shí)現(xiàn)的，這樣的系統(tǒng)是接地氣的語(yǔ)言學(xué)習(xí)模型，它將是未來(lái)研究的主要方向，簡(jiǎn)單來(lái)說(shuō)，這樣的學(xué)習(xí)模型在信息覆蓋面方面是無(wú)死角的，通過(guò)細(xì)致入微的觀察周邊環(huán)境以及人的活動(dòng)，將這些外部信息和語(yǔ)言聯(lián)系在一起。

圖片來(lái)源：論文《Grounded Language Learning in a Simulated 3D World》（如圖：人工智能體接收到文本指令后，在不同的場(chǎng)景中嘗試完成指定任務(wù)）

大家?guī)缀醵荚谔剿鳌白罱拥貧狻钡恼Z(yǔ)言學(xué)習(xí)模型，比如通過(guò)深度強(qiáng)化學(xué)習(xí)模型，人工智能體在虛擬場(chǎng)景下接受指令完成各類任務(wù)，智能體將模糊語(yǔ)言和具體實(shí)體場(chǎng)景聯(lián)系起來(lái)的能力越來(lái)越強(qiáng)，意味著語(yǔ)言能力也越來(lái)越強(qiáng)。

人工智能體在訓(xùn)練中會(huì)主動(dòng)觀察，而且它的行為基本不被干預(yù)，訓(xùn)練的效果只是被實(shí)驗(yàn)者持續(xù)觀察，這樣的框架將是未來(lái)語(yǔ)言學(xué)習(xí)模型的主流方向。

但這方面的語(yǔ)言學(xué)習(xí)研究因?yàn)檫€停留在虛擬環(huán)境實(shí)施而備受質(zhì)疑，批評(píng)者認(rèn)為不在真實(shí)環(huán)境中測(cè)試的研究都是耍流氓。

實(shí)際上很多人操之過(guò)急了，真正懂“人話”的人工智能離我們還十分遙遠(yuǎn)，這可是人類的終極目的呀。

我們步子不應(yīng)該邁太大，小目標(biāo)是搭建通用的學(xué)習(xí)機(jī)制和框架，讓人工智能在虛擬環(huán)境中應(yīng)對(duì)自如之后（走路），長(zhǎng)遠(yuǎn)再考慮于實(shí)際環(huán)境中執(zhí)行（跑步）的分步走實(shí)施才是上上策。

1 2 下一頁(yè)>