多模數(shù)據(jù)庫驅(qū)動(dòng)下,助力AI逼近“人類智能”
面對(duì)新基建驅(qū)動(dòng)而即將造成的數(shù)據(jù)量井噴現(xiàn)象,當(dāng)下的數(shù)據(jù)庫模式將不能夠足以支撐,尤其考慮到AI正逐步落地的情況。
--全球每天生產(chǎn)的數(shù)據(jù)有多少?
--非常多。
依據(jù)Raconteur統(tǒng)計(jì)的數(shù)據(jù),到2025年,全球每天預(yù)計(jì)有463 EB數(shù)據(jù)產(chǎn)生,相當(dāng)于每天產(chǎn)出約2.1億張DVD碟;IDC發(fā)布的《數(shù)據(jù)時(shí)代2025》報(bào)告中也預(yù)測(cè),全球每年產(chǎn)生的數(shù)據(jù)從2018年的33 ZB增長到175 ZB(1 ZB=1024 EB),以25 MB/秒的網(wǎng)速進(jìn)行下載,需要的時(shí)間為18億年。
隨著數(shù)據(jù)量的暴增,問題逐漸暴露。
數(shù)據(jù)規(guī)模大、類型多,一站式服務(wù)需求激增
截至目前,針對(duì)海量數(shù)據(jù)的處理,業(yè)內(nèi)既有的數(shù)據(jù)產(chǎn)品多只能解決某一類問題,譬如Hive應(yīng)用于結(jié)構(gòu)化數(shù)據(jù)、面向數(shù)據(jù)存儲(chǔ)的文檔數(shù)據(jù)庫MongDB、專注于復(fù)雜搜索需求的ElasticSearch以及圖數(shù)據(jù)庫Neo4J等等。與此同時(shí),圍繞多種數(shù)據(jù)類型的存儲(chǔ)與處理需求,業(yè)內(nèi)也搭建了一種混搭架構(gòu),涉及多種不同的數(shù)據(jù)庫技術(shù),以解決不同的數(shù)據(jù)問題。
只不過,我們也可以注意到,各個(gè)數(shù)據(jù)庫可以說是各自為政的,這也使得客戶在需要使用多種數(shù)據(jù)庫產(chǎn)品時(shí),需要自己重新架設(shè)一層,以解決需求被滿足時(shí)所產(chǎn)生的附加問題,包括數(shù)據(jù)如何在不同數(shù)據(jù)庫之間導(dǎo)進(jìn)導(dǎo)出、數(shù)據(jù)在不同庫中的一致性保持、整體運(yùn)維等等。
僅從文字的描述來看,就可以知道,數(shù)據(jù)庫的單一獨(dú)立使用和混合使用各有優(yōu)劣,前者操作簡單但供給不足以滿足實(shí)際應(yīng)用場(chǎng)景的多樣化需求,后者雖然能夠滿足客戶圍繞數(shù)據(jù)產(chǎn)生的多樣化需求,但是操作不便、運(yùn)維復(fù)雜等問題也是不可忽視的。
就當(dāng)下而言,混合架構(gòu)或許尚能夠應(yīng)對(duì)來自產(chǎn)業(yè)內(nèi)的多樣化數(shù)據(jù)需求,但是長久以往下去并不是一個(gè)辦法,尤其是隨著新基建的到來,于國內(nèi)數(shù)據(jù)庫的發(fā)展也帶來了極大的挑戰(zhàn)。針對(duì)這個(gè)問題,騰訊云數(shù)據(jù)庫副總經(jīng)理王義成指出了三點(diǎn):
1、數(shù)據(jù)量出現(xiàn)全面井噴,如何滿足相應(yīng)運(yùn)算與分析的實(shí)時(shí)進(jìn)行?
2、業(yè)務(wù)融合多樣化發(fā)出挑戰(zhàn),數(shù)據(jù)庫是否能夠接受在不同的業(yè)務(wù)中心、數(shù)據(jù)中心、基礎(chǔ)設(shè)施之間去做相應(yīng)的部署和融合?
3、老齡化逐步演進(jìn),數(shù)據(jù)庫人才缺口可能更大,數(shù)據(jù)庫供應(yīng)商如何為用戶提供多種自動(dòng)化服務(wù),以及能否為用戶的多種服務(wù)需求提供自動(dòng)運(yùn)維服務(wù),實(shí)現(xiàn)整個(gè)數(shù)據(jù)的自動(dòng)化治理?
從這些挑戰(zhàn)來看,鑒于數(shù)據(jù)庫與數(shù)據(jù)庫之間的不兼容,為了避免復(fù)雜操作性、實(shí)現(xiàn)成本有效降低等目的,一個(gè)面向數(shù)據(jù)層面的一站式服務(wù)平臺(tái)顯然成為一個(gè)剛需。簡單來講,在這個(gè)一站式數(shù)據(jù)服務(wù)平臺(tái)或數(shù)據(jù)庫中,用戶希望能夠以簡單的操作方式調(diào)用多數(shù)據(jù)庫的資源,并處理多種數(shù)據(jù)模型等等。
數(shù)據(jù)庫未來趨勢(shì)?提名“多模數(shù)據(jù)庫”
在提及數(shù)據(jù)庫在新基建背景下將面臨的挑戰(zhàn)時(shí),他也指出了這一產(chǎn)品的兩點(diǎn)趨勢(shì),一點(diǎn)關(guān)乎數(shù)據(jù)庫分配模式,“在數(shù)據(jù)量再擴(kuò)幾倍的情況下,還能保持TP與AP的整體穩(wěn)定性和性能,這是一個(gè)大趨勢(shì),大家也會(huì)在這個(gè)點(diǎn)上繼續(xù)去深耕!
第二點(diǎn)上,王義成則表示隨著5G的到來,可能會(huì)有更多模式的數(shù)據(jù)庫會(huì)出來,包括圖數(shù)據(jù)庫或是更為稀奇的數(shù)據(jù)模式。
“數(shù)據(jù)庫的下一個(gè)模式會(huì)向多模方向發(fā)展。數(shù)據(jù)庫的存儲(chǔ)模式是不同的,但真正對(duì)于應(yīng)用訪問來說,或者對(duì)于應(yīng)用處理來說,需要一個(gè)更加經(jīng)典化、更加統(tǒng)一的標(biāo)準(zhǔn)接口讓上層應(yīng)用能夠去訪問!蓖趿x成表示,“我認(rèn)為,應(yīng)對(duì)5G帶來的應(yīng)用爆發(fā)、數(shù)據(jù)爆發(fā),多?赡苁且粋(gè)大的趨勢(shì)點(diǎn)!
多模數(shù)據(jù)庫究竟是怎樣的?與現(xiàn)有的混合架構(gòu)模式而言,它的優(yōu)勢(shì)體現(xiàn)在哪里?
簡單來講,多模數(shù)據(jù)庫最終體現(xiàn)的是一種數(shù)據(jù)模式的統(tǒng)一,主要形式有兩種:
一種是數(shù)據(jù)存儲(chǔ)為統(tǒng)一模式,可以在這一層面暴露多種協(xié)議接口類型,比如一套數(shù)據(jù)存儲(chǔ),可以暴露Mongo的訪問模式,暴露MySQL的訪問模式;
另一種則是集中存儲(chǔ),將不同類型的數(shù)據(jù)庫存儲(chǔ)道一個(gè)整體通用的數(shù)據(jù)平臺(tái),再用一個(gè)up層,或者用一個(gè)接口層去兼容多種協(xié)議,讓所有的應(yīng)用都能夠更為方便的集中于自身的數(shù)據(jù)處理跟統(tǒng)一。
相較于混合架構(gòu)而言,多模數(shù)據(jù)庫在進(jìn)行統(tǒng)一整合、將操作極簡化的同時(shí),也降低了數(shù)據(jù)在不同庫之間來回遷移的成本和風(fēng)險(xiǎn)等!岸嗄(shù)據(jù)庫有可能是未來中長期相對(duì)比較的趨勢(shì)!蓖趿x成說到。
多模數(shù)據(jù)庫驅(qū)動(dòng)下,助力AI逼近“人類智能”
從前面行業(yè)內(nèi)人士的講解來看,在數(shù)據(jù)庫賽道中,利好多多的多模數(shù)據(jù)庫已然成為被看好的下一個(gè)趨勢(shì)。當(dāng)前,在多模數(shù)據(jù)庫賽道中,包括騰訊在內(nèi),華為、阿里等大型云服務(wù)商也已經(jīng)推出或即將推出有關(guān)產(chǎn)品。
在一些行業(yè)賽道中,尤其是那些傳統(tǒng)行業(yè),他們的數(shù)據(jù)多是分散在各個(gè)業(yè)務(wù)系統(tǒng)中,這也為他們的數(shù)據(jù)化、智能化變革道路中增添了難度。如果一個(gè)產(chǎn)品能夠幫助他們更快地整合數(shù)據(jù),并能夠提供抽象化的應(yīng)用接口,這必然是利好的。
用王義成的話來說,使用多模數(shù)據(jù)庫的目的之一,是解決用戶不同調(diào)用的使用習(xí)慣,助力用戶使用。而當(dāng)談及落地,“多模數(shù)據(jù)庫”于AI的智能提升而言可謂一大助力。
眾所周知,AI與人類智能差距之一就是“多模態(tài)信息的智能化理解”,這其中包括視覺、聲音、符號(hào)語言、嗅覺和觸覺等信息。如果能夠像人類利用多模態(tài)數(shù)據(jù)學(xué)習(xí)知識(shí)一樣,讓AI也擁有多模態(tài)數(shù)據(jù)的學(xué)習(xí)能力,AI的智能程度必然將大大獲得提升。
然而,就目前而言,多模態(tài)AI還存在不少技術(shù)難點(diǎn),其中就涉及到多模態(tài)數(shù)據(jù)的融合。具體來看,一個(gè)軟件或算法模型的進(jìn)步是較為容易的,但當(dāng)多個(gè)算法疊加在一起,難度的升級(jí)將會(huì)是成倍的,尤其在面對(duì)圖像、語音、觸感等非文本數(shù)據(jù)時(shí)。
就這一點(diǎn)來看,多模數(shù)據(jù)庫與AI可以看作是相輔相成的:利用AI算法,數(shù)據(jù)庫將能夠在現(xiàn)有基礎(chǔ)上獲得進(jìn)一步的優(yōu)化;反過來,正是因?yàn)槟軌蛘{(diào)用多個(gè)數(shù)據(jù)庫,以及兼具的統(tǒng)一性,多模數(shù)據(jù)庫將能夠?yàn)锳I算法模型提供訓(xùn)練平臺(tái),以及融合數(shù)據(jù)處理平臺(tái),讓AI系統(tǒng)的決策更為全面和智能。
作者:韓璐

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車】汽車E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺(tái)
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?