老焦專欄 | 解開(kāi)知識(shí)圖譜神秘的面紗
1知識(shí)圖譜與人工智能的關(guān)系
在人工智能應(yīng)用層出不窮的今天,作為軟件從業(yè)者,我們都非常關(guān)注如何在自己研發(fā)的應(yīng)用中使用人工智能技術(shù),以提高軟件的智能化水平。
回顧過(guò)往人工智能應(yīng)用,主要利用了語(yǔ)音識(shí)別、圖像識(shí)別方面的成果,但是不如想象般遍地開(kāi)花。究其原因,我們發(fā)現(xiàn),以機(jī)器學(xué)習(xí)為基礎(chǔ)的人工智能應(yīng)用往往需要滿足以下幾個(gè)特點(diǎn):
1)必須具備充足的數(shù)據(jù),而且這些數(shù)據(jù)是準(zhǔn)確可靠的;2)需要具備完整的信息,例如下棋,是完整信息博弈,只要算的快就可以,而人的決策往往是在不具備完整信息的情況下做出的;3)結(jié)果是明確的,人很容易確定結(jié)果是否正確,即使暫時(shí)不能確定,確定的代價(jià)也不高;4)過(guò)程往往是靜態(tài)的,缺乏動(dòng)態(tài)的可預(yù)測(cè)性。
這些特點(diǎn)導(dǎo)致很多情況下無(wú)法采用機(jī)器學(xué)習(xí)方式,進(jìn)行人工智能的應(yīng)用。例如在大型裝備的故障診斷中,我們無(wú)法具備大量準(zhǔn)確的故障數(shù)據(jù)進(jìn)行學(xué)習(xí),因?yàn)楹芏喙收蠜](méi)有發(fā)生過(guò)或者很少發(fā)生;故障發(fā)生后對(duì)故障原因的判定,也不是一個(gè)很容易判定的結(jié)果,因?yàn)楣收犀F(xiàn)象難以重現(xiàn);故障發(fā)生后應(yīng)急方案的制訂,目前深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)的方式,由于人無(wú)法了解其推理過(guò)程,產(chǎn)生的預(yù)案也往往不敢使用。
上述四點(diǎn)只要能夠改善某一點(diǎn),就可以給人工智能的應(yīng)用帶來(lái)更廣闊的空間,這也是知識(shí)圖譜作為人工智能一個(gè)重要方向的原因。
知識(shí)圖譜(KG Knowledge Graph)是 Google 2012 年提出的概念,并成功應(yīng)用于搜索引擎當(dāng)中。但什么是知識(shí)圖譜,Google并沒(méi)有給出明確的定義,目前業(yè)界的定義例如維基百科、百度百科都是從 Google 搜索引擎中知識(shí)圖譜的運(yùn)用出發(fā),進(jìn)行相關(guān)的功能描述。
我們可以把知識(shí)圖譜,理解為對(duì)知識(shí)的一種結(jié)構(gòu)化描述,它以結(jié)構(gòu)化的形式描述客觀世界中概念、實(shí)體及其之間的關(guān)系,便于計(jì)算機(jī)更好的管理、計(jì)算和理解信息。它是新一代的知識(shí)庫(kù)技術(shù),通過(guò)結(jié)構(gòu)化、語(yǔ)義化的處理將信息轉(zhuǎn)換為知識(shí),加以應(yīng)用。
通常結(jié)構(gòu)化知識(shí)是以圖的形式進(jìn)行表示,學(xué)術(shù)術(shù)語(yǔ)可以成為語(yǔ)義網(wǎng)絡(luò)。圖的節(jié)點(diǎn)表示概念和實(shí)體(學(xué)術(shù)術(shù)語(yǔ)稱為語(yǔ)義符號(hào)),圖的邊表示節(jié)點(diǎn)之間的關(guān)系(學(xué)術(shù)術(shù)語(yǔ)稱為語(yǔ)義關(guān)系),此外每個(gè)節(jié)點(diǎn)還有屬性。
例如:人物、娛樂(lè)人物、歌手、影視演員都是概念,這幾個(gè)概念之間有從屬關(guān)系,周杰倫是一個(gè)實(shí)體,周杰倫是歌手,也是影視演員,周杰倫的出生日期等就是屬性,周杰倫的妻子是昆凌,昆凌的丈夫是周杰倫,這就是關(guān)系,從上述關(guān)系可以推理出昆凌的丈夫是一個(gè)娛樂(lè)人物。
這個(gè)簡(jiǎn)單的示例表明,通過(guò)概念、實(shí)體以及之間的關(guān)系進(jìn)行知識(shí)結(jié)構(gòu)化表示,就可以讓計(jì)算機(jī)具備推理能力,這種推理能力:
1)可以不需要大量數(shù)據(jù)基礎(chǔ)就可以建立起來(lái);2)不一定需要完備的信息就可以進(jìn)行推理;3)推理的過(guò)程是可以評(píng)估的,人可以通過(guò)推理過(guò)程判斷結(jié)果是否準(zhǔn)確;4)可以進(jìn)行對(duì)未來(lái)的預(yù)測(cè)。這就可以在一定程度上解決目前機(jī)器學(xué)習(xí)方式面臨的問(wèn)題。
研究知識(shí)圖譜、人工智能的時(shí)候,我們經(jīng)常遇到很多專業(yè)術(shù)語(yǔ),例如語(yǔ)義網(wǎng)絡(luò)、本體、知識(shí)庫(kù)等等,理解起來(lái)非常費(fèi)力。實(shí)際上如上例而言,用圖的結(jié)構(gòu)來(lái)表示知識(shí)就是語(yǔ)義網(wǎng)絡(luò),圖的節(jié)點(diǎn)表示概念和實(shí)體,學(xué)術(shù)術(shù)語(yǔ)稱為語(yǔ)義符號(hào),圖的邊表示節(jié)點(diǎn)之間的關(guān)系,學(xué)術(shù)術(shù)語(yǔ)稱為語(yǔ)義關(guān)系。
本體(Ontology)的源自于哲學(xué)領(lǐng)域,在哲學(xué)中的定義為“對(duì)世界上客觀事物的系統(tǒng)描述”。哲學(xué)中的本體關(guān)心的是客觀現(xiàn)實(shí)的抽象本質(zhì),而在計(jì)算機(jī)領(lǐng)域,本體是一種描述知識(shí)的方式。自從本體的概念引進(jìn)后,就出現(xiàn)了資源描述框架 RDF(Resource Description Framework)、網(wǎng)絡(luò)本體語(yǔ)言 OWL(Ontology Web Language)這樣的語(yǔ)言進(jìn)行標(biāo)準(zhǔn)化的知識(shí)表示。
其實(shí)本體也是基于圖、概念、實(shí)體、屬性、關(guān)系這些來(lái)描述知識(shí)的。傳統(tǒng)人工智能領(lǐng)域采用了大量的學(xué)術(shù)術(shù)語(yǔ),而Google的一個(gè)創(chuàng)新就是利用“知識(shí)圖譜”這樣直白的語(yǔ)言,形象的表述了一個(gè)復(fù)雜事物,用 AlphaGo 這樣直觀的示例,普及了人工智能的概念。而本文也希望盡可能用類比的方式,采用易于軟件研發(fā)理解的語(yǔ)言來(lái)介紹使用知識(shí)圖譜的過(guò)程,這也是取名“解開(kāi)知識(shí)圖譜神秘面紗”的初衷。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
6月20日立即下載>> 【白皮書(shū)】精準(zhǔn)測(cè)量 安全高效——福祿克光伏行業(yè)解決方案
-
7月3日立即報(bào)名>> 【在線會(huì)議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會(huì)
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身機(jī)器人動(dòng)力電池技術(shù)應(yīng)用大會(huì)
-
免費(fèi)參會(huì)立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
推薦專題
- 1 AI 眼鏡讓百萬(wàn) APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語(yǔ)權(quán)
- 3 深度報(bào)告|中國(guó)AI產(chǎn)業(yè)正在崛起成全球力量,市場(chǎng)潛力和關(guān)鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級(jí)獨(dú)角獸:獲上市公司戰(zhàn)投,干人形機(jī)器人
- 5 國(guó)家數(shù)據(jù)局局長(zhǎng)劉烈宏調(diào)研格創(chuàng)東智
- 6 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 7 百億AI芯片訂單,瘋狂傾銷中東?
- 8 Robotaxi新消息密集釋放,量產(chǎn)元年誰(shuí)在領(lǐng)跑?
- 9 一文看懂視覺(jué)語(yǔ)言動(dòng)作模型(VLA)及其應(yīng)用
- 10 格斗大賽出圈!人形機(jī)器人致命短板曝光:頭腦過(guò)于簡(jiǎn)單