訂閱
糾錯(cuò)
加入自媒體

百度ai系列研究之自研圖數(shù)據(jù)庫(kù)BGraph

2021-08-16 10:17
智先聲
關(guān)注

每周一篇原創(chuàng),關(guān)注5G、物聯(lián)網(wǎng)、人工智能,跟著我堅(jiān)持利用碎片時(shí)間學(xué)習(xí)

簡(jiǎn)介

今天我們進(jìn)入知識(shí)圖譜的學(xué)習(xí),知識(shí)圖譜是人工智能的一個(gè)重要分支,當(dāng)前場(chǎng)景應(yīng)用正在不斷豐富。其中最核心的是圖數(shù)據(jù)庫(kù),百度自研商業(yè)圖數(shù)據(jù)庫(kù) BGraph 支持業(yè)界流行 Property Graph 模型和Gremlin語言(并進(jìn)行擴(kuò)展),在檢索和實(shí)時(shí)深度連接分析上具有極高的性能。BGraph 具有高可用性,提供復(fù)制和分片技術(shù)進(jìn)行分布式擴(kuò)展,支持批量加載和實(shí)時(shí)更新,從而使您能夠輕松構(gòu)建基于圖數(shù)據(jù)庫(kù)的企業(yè)級(jí)應(yīng)用,實(shí)時(shí)分析關(guān)聯(lián)數(shù)據(jù),挖掘數(shù)據(jù)價(jià)值。

圖來自百度官網(wǎng)

應(yīng)用場(chǎng)景

欺詐檢測(cè):通過深度關(guān)聯(lián)分析實(shí)時(shí)的檢測(cè)欺詐模式,從而構(gòu)建反欺詐應(yīng)用。例如分析購(gòu)買和轉(zhuǎn)賬關(guān)系是否有環(huán),判斷是否刷單作弊或惡意套現(xiàn)

企業(yè)圖譜:企業(yè)圖譜應(yīng)用將企業(yè)的董監(jiān)高等信息以及企業(yè)之間關(guān)系存儲(chǔ)在圖數(shù)據(jù)庫(kù)中,然后使用圖查詢?nèi)娴姆治錾虡I(yè)機(jī)會(huì)和商業(yè)風(fēng)險(xiǎn)

公共安全:構(gòu)建公共安全領(lǐng)域知識(shí)圖譜,挖掘人物、事件、地點(diǎn)及其關(guān)聯(lián)數(shù)據(jù),利用專家經(jīng)驗(yàn)和機(jī)器學(xué)習(xí)技術(shù),支撐公安機(jī)關(guān)開展嫌犯追蹤、案件分析和重大事件預(yù)警等工作

智能運(yùn)維:智能運(yùn)維平臺(tái)將網(wǎng)絡(luò)設(shè)備和服務(wù)關(guān)聯(lián)等信息存儲(chǔ)在圖數(shù)據(jù)庫(kù)中,可以通過圖查詢和圖計(jì)算來規(guī)劃路由、診斷故障和收斂報(bào)警等

技術(shù)特點(diǎn)

高性能:自研的圖存儲(chǔ)和計(jì)算引擎,針對(duì)檢索和深度連接分析做優(yōu)化,并用C++ 實(shí)現(xiàn),具有毫秒級(jí)查詢響應(yīng),并能支持?jǐn)?shù)萬的QPS

高擴(kuò)展:能支持?jǐn)?shù)億級(jí)頂點(diǎn)的圖數(shù)據(jù),能通過分片和副本分布式可擴(kuò)展,滿足業(yè)務(wù)的快速增長(zhǎng)

高可用:BGraph 支持多實(shí)例副本,具有實(shí)時(shí)容錯(cuò)能力,單實(shí)例的故障不會(huì)影響查詢服務(wù),旨在提供超過 99.99% 的可用性

開放性:支持業(yè)界流行的 Property Graph 數(shù)據(jù)模型和 Gremlin查詢語言,并對(duì)Gremlin進(jìn)行擴(kuò)展,支持特色的高性能圖算法

常見圖數(shù)據(jù)庫(kù)

Neo4j是一個(gè)流行的圖形數(shù)據(jù)庫(kù),它是開源的。最近,Neo4j的社區(qū)版已經(jīng)由遵循AGPL許可協(xié)議轉(zhuǎn)向了遵循GPL許可協(xié)議。盡管如此,Neo4j的企業(yè)版依然使用AGPL許可。Neo4j基于Java實(shí)現(xiàn),兼容ACID特性,也支持其他編程語言,如Ruby和Python。

FlockDB是Twitter為進(jìn)行關(guān)系數(shù)據(jù)分析而構(gòu)建的。FlockDB迄今為止還沒有穩(wěn)定的版本,對(duì)于它是否是一個(gè)真正的圖形數(shù)據(jù)庫(kù),尚有爭(zhēng)議。FlockDB和其它圖形數(shù)據(jù)庫(kù)(如Neo4j、OrientDB)的區(qū)別在于圖的遍歷,Twitter的數(shù)據(jù)模型不需要遍歷社交圖譜。盡管如此,由于FlockDB應(yīng)用于Twitter這樣的大型站點(diǎn),以及它相比其它圖形數(shù)據(jù)庫(kù)的簡(jiǎn)潔性,仍然值得我們值得關(guān)注。

AllegroGrap是一個(gè)基于W3c標(biāo)準(zhǔn)的為資源描述框架構(gòu)建的圖形數(shù)據(jù)庫(kù)。它為處理鏈接數(shù)據(jù)和Web語義而設(shè)計(jì),支持SPARQL、RDFS++和Prolog。

GraphDB是德國(guó)sones公司在.NET基礎(chǔ)上構(gòu)建的。Sones公司于2007年成立,近年來陸續(xù)進(jìn)行了幾輪融資。GraphDB社區(qū)版遵循AGPL v3許可協(xié)議,企業(yè)版是商業(yè)化的。GraphDB托管在Windows Azure平臺(tái)上。

InfiniteGraph基于Java實(shí)現(xiàn),它的目標(biāo)是構(gòu)建“分布式的圖形數(shù)據(jù)庫(kù)”,已被美國(guó)國(guó)防部和美國(guó)中央情報(bào)局所采用。除此之外,還有其他一些圖形數(shù)據(jù)庫(kù),如OrientDB、InfoGrid和HypergraphDB。Ravel構(gòu)建在開源的Pregel實(shí)現(xiàn)之上,微軟研究院的Trinity項(xiàng)目也是一個(gè)圖形數(shù)據(jù)庫(kù)項(xiàng)目。

百度開源的分布式圖數(shù)據(jù)庫(kù)。支持標(biāo)準(zhǔn)的Apache Tinkerpop Gremlin圖查詢語言,支持屬性圖,可支持千億級(jí)規(guī)模關(guān)系數(shù)據(jù);支持多種后端存儲(chǔ)(Cassandra,HBase,RocksDB,MySQL,PostgreSQL,ScyllaDB);支持各類索引(二級(jí)索引、范圍索引、全文索引、聯(lián)合索引,均無需依賴第三方索引庫(kù));提供可視化的Web界面,可用于圖建模、數(shù)據(jù)導(dǎo)入、圖分析;提供導(dǎo)入工具支持從多種數(shù)據(jù)源中導(dǎo)入數(shù)據(jù)到圖中,支持的數(shù)據(jù)源包括:CSV、HDFS、關(guān)系型數(shù)據(jù)庫(kù)(MySQL、Oracle、SQL Server、PostgreSQL);支持REST接口,并提供10+種通用的圖算法;支持與Hadoop、Spark GraphX等大數(shù)據(jù)系統(tǒng)集成。

免責(zé)聲明:

本公眾號(hào)為個(gè)人研究專題學(xué)習(xí)分享,非商業(yè)公眾號(hào)無任何商業(yè)目的,如果文章內(nèi)容有侵權(quán)或者非法信息,請(qǐng)立即與本號(hào)聯(lián)系刪除謝謝

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)