AI新貴上位 圖網(wǎng)絡(luò)是怎么火起來的?
誰是2018年AI圈最靚的仔?
這頂“桂冠”只有兩位候選人:俗話說,前端能打看BERT,底層深度看圖網(wǎng)絡(luò)。其實(shí)并沒有這句俗話……但是BERT和圖網(wǎng)絡(luò)在今天的AI界并駕齊驅(qū),堪稱被討論最多的兩種技術(shù),這一點(diǎn)是毫無疑問的。谷歌的BERT作為一種算法模型,在語言任務(wù)上展現(xiàn)出了不講道理的應(yīng)用效果,熠熠奪目自然很容易理解。
但另一個最近大家聽到很多次的詞,圖網(wǎng)絡(luò),可能就沒那么容易理解了。相比某種算法,圖網(wǎng)絡(luò)更像是一個學(xué)術(shù)思考下若干種技術(shù)解決思路的集合,非常抽象和底層。它的價值到底在哪?為什么甚至能被抬高到“深度學(xué)習(xí)的救星”這種程度?我們發(fā)現(xiàn),目前關(guān)于圖網(wǎng)絡(luò)的解釋,大多都是從論文出發(fā)。非技術(shù)背景的讀者可能會看得有點(diǎn)暈。所以這里想用一些“大白話”,來描述一下:風(fēng)口浪尖上的圖網(wǎng)絡(luò),究竟有什么秘密?
想讓自己在AI圈潮酷起來嗎?聊Graph和GNN吧
所謂圖網(wǎng)絡(luò),并不是指有圖片的網(wǎng)站……而是指基于圖(Graph)數(shù)據(jù)進(jìn)行工作的神經(jīng)網(wǎng)絡(luò)。
Graph,翻譯成“圖”,或者“圖譜”。這是一個數(shù)學(xué)概念,指由頂點(diǎn)(nodes)和邊(edges)構(gòu)成的一種數(shù)學(xué)關(guān)系。后來這個概念引申到了計(jì)算機(jī)科學(xué)中,成為了一種重要的數(shù)據(jù)形式,用來表示單元間相互有聯(lián)系的數(shù)據(jù)網(wǎng)絡(luò)。此外,這個概念還引申到了生物學(xué)、社會科學(xué)和歷史學(xué)等無數(shù)學(xué)科,甚至變成了我們生活中的常見概念。在警匪片里,警局或者偵探辦公室的墻上,往往掛著罪犯的關(guān)系網(wǎng)絡(luò)圖,這大概是我們生活中最常見的Graph。
回到計(jì)算機(jī)科學(xué)領(lǐng)域,圖數(shù)據(jù)和基于圖的分析,廣泛應(yīng)用于各種分類、鏈路、聚類任務(wù)里。人工智能領(lǐng)域有個重要的分支,叫做知識圖譜;具壿嬀褪菍⒅R進(jìn)行Graph化,從而在我們尋找知識時,可以依據(jù)圖譜關(guān)系進(jìn)行追蹤和定位。比如我們在搜索引擎中搜某個名人時,相關(guān)推薦會跳出來跟這個人字面意義上無關(guān)的其他人。這就是知識圖譜在起作用。
那么圖網(wǎng)絡(luò)是怎么搞出來的呢?
大家可能知道這樣一個“唱衰AI”的小故事:用機(jī)器視覺技術(shù),AI今天可以很輕松識別出來一張照片上的幾張人臉。但它無法像真人一樣,一眼看出來圖上是朋友、戀人還是家庭聚會。換句話說,一般意義上AI無法獲得和增強(qiáng)用人類常識去進(jìn)行邏輯推理的能力。很多人以此判斷,今天的AI并不怎么智能。
AI科學(xué)家們琢磨了一下,表示這事兒有辦法搞定。如果把圖/圖譜作為AI的一部分,將深度學(xué)習(xí)帶來的學(xué)習(xí)能力,和圖譜代表的邏輯關(guān)系結(jié)合起來,是不是就好很多?
事實(shí)上,Graph+Deeplearning并不是一個全新概念。最早在2009年,就有研究提出了二者的結(jié)合。近幾年這個領(lǐng)域陸續(xù)在有研究出來。對于這個組合產(chǎn)物,學(xué)術(shù)界有人稱之為圖卷積網(wǎng)絡(luò)(GCN),也有人稱呼其為圖神經(jīng)網(wǎng)絡(luò)(GNN)或者圖網(wǎng)絡(luò)(GN,Graph Networks),其技術(shù)內(nèi)涵和命名思路也各不相同。這里暫且使用圖網(wǎng)絡(luò)這個籠統(tǒng)稱呼。
圖網(wǎng)絡(luò)作為一種新的AI研究思路,之所以能夠在2018年被點(diǎn)燃,很大程度還是號稱AI扛把子的DeepMind的功勞。在火種拋出、全球跟進(jìn)以及反復(fù)爭論之后,圖網(wǎng)絡(luò)變成了AI學(xué)術(shù)圈最靚仔的那個關(guān)鍵詞。今天大有一種,聊深度學(xué)習(xí)不說圖網(wǎng)絡(luò)就很low的感覺……
從識別小能手到推理專家:AI新貴求職記
有種論調(diào)是這么說的:深度學(xué)習(xí)已死,圖網(wǎng)絡(luò)才是未來。這句話怎么琢磨都有問題。因?yàn)閺膱D網(wǎng)絡(luò)在去年被“翻新”出來那一刻,它在本質(zhì)上還是對流行的多層神經(jīng)網(wǎng)絡(luò)的一種補(bǔ)充。讓我們來打個比方,看一下跟傳統(tǒng)深度學(xué)習(xí)相比,圖網(wǎng)絡(luò)應(yīng)該是如何工作的。
舉個例子,假如我們想讓教育我們的孩子,讓他認(rèn)識新來的鄰居一家人。我們應(yīng)該怎么辦呢?可以選擇給他講,隔壁新來了某個小朋友,他爸爸是誰媽媽是誰。但是這樣不直觀,孩子很容易記不住。而更快的方式或許是拿著照片給他看,告訴他照片上的人都是什么關(guān)系。而在這個工作之前,其實(shí)我們已經(jīng)完成了一個先覺條件:我們已經(jīng)告訴過孩子,爸爸媽媽爺爺奶奶這些稱呼,分別指代的是什么意思。他理解這些“邊”,然后再代入新鄰居一家人具體的樣貌性格交談作為“頂點(diǎn)”,最終構(gòu)成了對鄰居一家這個“圖”的網(wǎng)絡(luò)化認(rèn)識。
而我們在用深度學(xué)習(xí)教導(dǎo)AI時,往往是省略掉第一步。直接給出大量照片和語音文字資料進(jìn)行訓(xùn)練,強(qiáng)迫AI去“記住”這一家人的關(guān)系。然而在AI缺乏對家庭關(guān)系的基本常識情況下,它到底能不能記住,是怎么記住的,會不會出現(xiàn)偏差,其實(shí)我們都是不知道的。
某種程度上,這就是深度學(xué)習(xí)的黑箱性來源之一。
所以圖網(wǎng)絡(luò)的思路是,首先讓AI構(gòu)建一個“圖”數(shù)據(jù),先理解爸爸媽媽這一類關(guān)系的含義,再去學(xué)習(xí)具體的家庭數(shù)據(jù)。這樣AI就可以依靠已經(jīng)積累的節(jié)點(diǎn)間的消息傳遞性,來自己推理下一個要認(rèn)識的家庭究竟誰是爸爸誰是兒子。這也就意味著,圖網(wǎng)絡(luò)某種程度上有了自己推理的能力。如果將這種能力推而廣之,AI就將可能在非常復(fù)雜的聯(lián)系和推理中完成智能工作。
前面說了,這個領(lǐng)域的工作其實(shí)一直沒有停止。但是之所以沒有廣泛流行,一方面是因?yàn)檫@個領(lǐng)域相對小眾,缺少重磅研究來引發(fā)大家的關(guān)注;另一方面也是因?yàn)榭床灰娒恢,缺少開源模型來檢驗(yàn)理論的正誤。
去年6月,DeepMind聯(lián)合谷歌大腦、麻省理工等機(jī)構(gòu)的27位學(xué)者,共同發(fā)表了關(guān)于圖網(wǎng)絡(luò)的論文《Relational inductive biases, deep learning, and graph networks.》,接著開源了相關(guān)的算法包GraphNet。這篇文章中,DeepMind不僅提出了新的算法模型,希望能用圖網(wǎng)絡(luò)實(shí)現(xiàn)端到端的學(xué)習(xí);同時也總結(jié)歸納了此前圖網(wǎng)絡(luò)各個流派的研究方法,并將其在新算法上進(jìn)行了融合。
在這個有點(diǎn)承上啟下意味的研究出來后,大量關(guān)于圖網(wǎng)絡(luò)的綜述、應(yīng)用檢驗(yàn),以及新算法的探討開始在學(xué)術(shù)界萌生。隨著全球AI圈的共同發(fā)力,這門AI技術(shù)新貴正在嘗試走向臺前。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?