大數(shù)據(jù)和大數(shù)據(jù)時(shí)代是兩個(gè)概念?該怎么分清它們
隨著計(jì)算機(jī)互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、車聯(lián)網(wǎng)的大眾化和博客、論壇、微信等網(wǎng)絡(luò)交流方式的日益紅火,數(shù)據(jù)資料的增長正發(fā)生著“秒新分異”的變化。在商業(yè)、經(jīng)濟(jì)及其他領(lǐng)域,管理者決策越來越依靠數(shù)據(jù)分析,而不是依靠經(jīng)驗(yàn)和直覺。毋庸置疑,大數(shù)據(jù)時(shí)代已經(jīng)到來。不過大數(shù)據(jù)和大數(shù)據(jù)時(shí)代是兩個(gè)完全不同的概念,你分的清嗎?
1.大數(shù)據(jù)
作為一個(gè)較為抽象且新興的概念,有關(guān)大數(shù)據(jù)的概念眾說紛紜。對大數(shù)據(jù)的理解取決于定義者的態(tài)度和學(xué)科背景。我們認(rèn)為,大數(shù)據(jù)定義之所以眾說紛紜,主要是因?yàn)榇髷?shù)據(jù)如其名一樣,所涉內(nèi)容太“大”,大家看它的角度不一樣,于是出現(xiàn)了仁者見仁、智者見智的局面。
大數(shù)據(jù)的核心是數(shù)據(jù),而數(shù)據(jù)是統(tǒng)計(jì)研究的對象,從大數(shù)據(jù)中尋找有價(jià)值信息的關(guān)鍵在于對數(shù)據(jù)進(jìn)行正確的統(tǒng)計(jì)分析。從統(tǒng)計(jì)學(xué)與計(jì)算機(jī)科學(xué)出發(fā),我們可以這樣來定義“大數(shù)據(jù)”:大數(shù)據(jù)指那些超過傳統(tǒng)數(shù)據(jù)系統(tǒng)處理能力、超越經(jīng)典統(tǒng)計(jì)思想研究范圍、不借用網(wǎng)絡(luò)無法用主流軟件工具及技術(shù)進(jìn)行單機(jī)分析的復(fù)雜數(shù)據(jù)的集合。對于這一數(shù)據(jù)集合,在一定的條件下和合理的時(shí)間內(nèi),我們可以通過現(xiàn)代計(jì)算機(jī)技術(shù)和創(chuàng)新統(tǒng)計(jì)方法,有目的地進(jìn)行設(shè)計(jì)、獲取、管理、分析,揭示隱藏在其中的有價(jià)值的模式和知識。
大數(shù)據(jù)具有以下基本特征:
(1)大量性。
大數(shù)據(jù)的數(shù)據(jù)量巨大。隨著高度發(fā)達(dá)的網(wǎng)絡(luò)技術(shù)和承載數(shù)據(jù)資料的個(gè)人電腦、手機(jī)、平板電腦等網(wǎng)絡(luò)工具的普及,數(shù)據(jù)資料的來源范圍在不斷拓展。
(2)多樣性。
大數(shù)據(jù)的類型繁多,不僅包括以文本資料為主的結(jié)構(gòu)化數(shù)據(jù),還包括網(wǎng)絡(luò)日志、音頻、視頻、圖片、地理位置等半結(jié)構(gòu)或非結(jié)構(gòu)化的數(shù)據(jù)資料。
(3)價(jià)值性。
大數(shù)據(jù)價(jià)值巨大,但價(jià)值密度低。由于大數(shù)據(jù)規(guī)模巨大,數(shù)據(jù)在不斷更新變化,這些有價(jià)值的信息可能轉(zhuǎn)瞬即逝。因此,如何通過強(qiáng)大的機(jī)器算法更迅速地完成數(shù)據(jù)的價(jià)值“提純”成為目前大數(shù)據(jù)背景下亟待解決的難題。
(4)高速性。
由于大數(shù)據(jù)有價(jià)值信息存在時(shí)間短,要求能迅速有效地提取大量復(fù)雜數(shù)據(jù)中的有價(jià)值信息。
2.大數(shù)據(jù)時(shí)代
大數(shù)據(jù)時(shí)代是建立在通過互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等現(xiàn)代網(wǎng)絡(luò)渠道廣泛大量數(shù)據(jù)資源收集基礎(chǔ)上的數(shù)據(jù)存儲、價(jià)值提煉、智能處理和展示的信息時(shí)代。在這個(gè)時(shí)代,人們幾乎能夠從任何數(shù)據(jù)中獲得可轉(zhuǎn)換為推動(dòng)人們生活方式變化的有價(jià)值的知識。
大數(shù)據(jù)時(shí)代具有以下基本特征:
(1)社會性。
在大數(shù)據(jù)時(shí)代,世界范圍的計(jì)算機(jī)聯(lián)網(wǎng)使越來越多的領(lǐng)域以數(shù)據(jù)流通取代產(chǎn)品流通,將生產(chǎn)演變成服務(wù),將工業(yè)勞動(dòng)演變成信息勞動(dòng)。信息勞動(dòng)產(chǎn)品不需要離開它的原始占有者就能夠被買賣和交換,這類產(chǎn)品能夠通過計(jì)算機(jī)網(wǎng)絡(luò)大量復(fù)制和分配而不需要額外增加費(fèi)用,其價(jià)值增加是通過知識而不是手工勞動(dòng)來實(shí)現(xiàn)的。
(2)廣泛性。
在大數(shù)據(jù)時(shí)代,計(jì)算機(jī)技術(shù)不僅促進(jìn)自然科學(xué)、人文社會科學(xué)各個(gè)領(lǐng)域的發(fā)展,而且全面融入到了人們的社會生活中。人們在不同領(lǐng)域采集到的數(shù)據(jù)量之大,達(dá)到了前所未有的程度。同時(shí),人們的工作和生活方式已發(fā)生了一定程度的改變。
(3)公開性。
大數(shù)據(jù)產(chǎn)生于一個(gè)開放的、公共的網(wǎng)絡(luò)環(huán)境中。雖然考慮到對用戶隱私的保護(hù),但在大數(shù)據(jù)時(shí)代會有越來越多的數(shù)據(jù)被開放、被交叉使用。這種公開性、公共性的實(shí)現(xiàn)以若干個(gè)網(wǎng)絡(luò)開放平臺或云計(jì)算服務(wù)為基礎(chǔ),并受到一系列法律或社會公認(rèn)的數(shù)據(jù)標(biāo)準(zhǔn)、規(guī)范的約束。
(4)動(dòng)態(tài)性。
在大數(shù)據(jù)時(shí)代,數(shù)據(jù)資料可以隨時(shí)隨地產(chǎn)生,不僅數(shù)據(jù)資料的收集具有動(dòng)態(tài)性,而且數(shù)據(jù)存儲技術(shù)、數(shù)據(jù)處理技術(shù)也隨時(shí)更新,即處理數(shù)據(jù)的工具也具有動(dòng)態(tài)性。
想要在大數(shù)據(jù)時(shí)代熟練運(yùn)用大數(shù)據(jù)技術(shù),一定要分清它們各自有什么特點(diǎn),尤其是大數(shù)據(jù)時(shí)代這個(gè)大環(huán)境,到底有哪些需求痛點(diǎn)。牢牢抓住這些需求痛點(diǎn),才能更好對癥下藥。更多大數(shù)據(jù)相關(guān)資訊,關(guān)注微信公眾號成都科多大數(shù)據(jù)即可獲取。
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會
-
4月30日立即下載>> 【村田汽車】汽車E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
限時(shí)免費(fèi)下載立即下載 >>> 2024“機(jī)器人+”行業(yè)應(yīng)用創(chuàng)新發(fā)展藍(lán)皮書
-
即日-5.15立即報(bào)名>>> 【在線會議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評 >> 【評選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評選