訂閱
糾錯
加入自媒體

大數(shù)據(jù)和大數(shù)據(jù)時代是兩個概念?該怎么分清它們

隨著計算機互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、車聯(lián)網(wǎng)的大眾化和博客、論壇、微信等網(wǎng)絡交流方式的日益紅火,數(shù)據(jù)資料的增長正發(fā)生著“秒新分異”的變化。在商業(yè)、經(jīng)濟及其他領域,管理者決策越來越依靠數(shù)據(jù)分析,而不是依靠經(jīng)驗和直覺。毋庸置疑,大數(shù)據(jù)時代已經(jīng)到來。不過大數(shù)據(jù)和大數(shù)據(jù)時代是兩個完全不同的概念,你分的清嗎?

1.大數(shù)據(jù)

作為一個較為抽象且新興的概念,有關大數(shù)據(jù)的概念眾說紛紜。對大數(shù)據(jù)的理解取決于定義者的態(tài)度和學科背景。我們認為,大數(shù)據(jù)定義之所以眾說紛紜,主要是因為大數(shù)據(jù)如其名一樣,所涉內容太“大”,大家看它的角度不一樣,于是出現(xiàn)了仁者見仁、智者見智的局面。

大數(shù)據(jù)的核心是數(shù)據(jù),而數(shù)據(jù)是統(tǒng)計研究的對象,從大數(shù)據(jù)中尋找有價值信息的關鍵在于對數(shù)據(jù)進行正確的統(tǒng)計分析。從統(tǒng)計學與計算機科學出發(fā),我們可以這樣來定義“大數(shù)據(jù)”:大數(shù)據(jù)指那些超過傳統(tǒng)數(shù)據(jù)系統(tǒng)處理能力、超越經(jīng)典統(tǒng)計思想研究范圍、不借用網(wǎng)絡無法用主流軟件工具及技術進行單機分析的復雜數(shù)據(jù)的集合。對于這一數(shù)據(jù)集合,在一定的條件下和合理的時間內,我們可以通過現(xiàn)代計算機技術和創(chuàng)新統(tǒng)計方法,有目的地進行設計、獲取、管理、分析,揭示隱藏在其中的有價值的模式和知識。
大數(shù)據(jù)具有以下基本特征:

(1)大量性。

大數(shù)據(jù)的數(shù)據(jù)量巨大。隨著高度發(fā)達的網(wǎng)絡技術和承載數(shù)據(jù)資料的個人電腦、手機、平板電腦等網(wǎng)絡工具的普及,數(shù)據(jù)資料的來源范圍在不斷拓展。

(2)多樣性。

大數(shù)據(jù)的類型繁多,不僅包括以文本資料為主的結構化數(shù)據(jù),還包括網(wǎng)絡日志、音頻、視頻、圖片、地理位置等半結構或非結構化的數(shù)據(jù)資料。

(3)價值性。

大數(shù)據(jù)價值巨大,但價值密度低。由于大數(shù)據(jù)規(guī)模巨大,數(shù)據(jù)在不斷更新變化,這些有價值的信息可能轉瞬即逝。因此,如何通過強大的機器算法更迅速地完成數(shù)據(jù)的價值“提純”成為目前大數(shù)據(jù)背景下亟待解決的難題。

(4)高速性。

由于大數(shù)據(jù)有價值信息存在時間短,要求能迅速有效地提取大量復雜數(shù)據(jù)中的有價值信息。

2.大數(shù)據(jù)時代

大數(shù)據(jù)時代是建立在通過互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等現(xiàn)代網(wǎng)絡渠道廣泛大量數(shù)據(jù)資源收集基礎上的數(shù)據(jù)存儲、價值提煉、智能處理和展示的信息時代。在這個時代,人們幾乎能夠從任何數(shù)據(jù)中獲得可轉換為推動人們生活方式變化的有價值的知識。
大數(shù)據(jù)時代具有以下基本特征:

(1)社會性。

在大數(shù)據(jù)時代,世界范圍的計算機聯(lián)網(wǎng)使越來越多的領域以數(shù)據(jù)流通取代產(chǎn)品流通,將生產(chǎn)演變成服務,將工業(yè)勞動演變成信息勞動。信息勞動產(chǎn)品不需要離開它的原始占有者就能夠被買賣和交換,這類產(chǎn)品能夠通過計算機網(wǎng)絡大量復制和分配而不需要額外增加費用,其價值增加是通過知識而不是手工勞動來實現(xiàn)的。

(2)廣泛性。

在大數(shù)據(jù)時代,計算機技術不僅促進自然科學、人文社會科學各個領域的發(fā)展,而且全面融入到了人們的社會生活中。人們在不同領域采集到的數(shù)據(jù)量之大,達到了前所未有的程度。同時,人們的工作和生活方式已發(fā)生了一定程度的改變。

(3)公開性。

大數(shù)據(jù)產(chǎn)生于一個開放的、公共的網(wǎng)絡環(huán)境中。雖然考慮到對用戶隱私的保護,但在大數(shù)據(jù)時代會有越來越多的數(shù)據(jù)被開放、被交叉使用。這種公開性、公共性的實現(xiàn)以若干個網(wǎng)絡開放平臺或云計算服務為基礎,并受到一系列法律或社會公認的數(shù)據(jù)標準、規(guī)范的約束。

(4)動態(tài)性。

在大數(shù)據(jù)時代,數(shù)據(jù)資料可以隨時隨地產(chǎn)生,不僅數(shù)據(jù)資料的收集具有動態(tài)性,而且數(shù)據(jù)存儲技術、數(shù)據(jù)處理技術也隨時更新,即處理數(shù)據(jù)的工具也具有動態(tài)性。

想要在大數(shù)據(jù)時代熟練運用大數(shù)據(jù)技術,一定要分清它們各自有什么特點,尤其是大數(shù)據(jù)時代這個大環(huán)境,到底有哪些需求痛點。牢牢抓住這些需求痛點,才能更好對癥下藥。更多大數(shù)據(jù)相關資訊,關注微信公眾號成都科多大數(shù)據(jù)即可獲取。

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號