“大數據時代”一書中的大數據是指“全體數據或所有數據”,又稱“巨量資料”,指的是所涉及的資料量規模巨大到無法通過目前主流軟體工具,在合理時間內達到擷取、管理、處理、並整理成為幫助企業經營決策更積極目的的資訊。
本教學操作環境:windows7系統、Dell G3電腦。
《大數據時代》一書中的大數據是指「全體資料或所有資料」。
大數據(big data),或稱巨量資料,指的是所涉及的資料量規模巨大到無法通過目前主流軟體工具,在合理時間內達到擷取、管理、處理、並整理成為幫助企業經營決策更積極目的的資訊。
在維克多·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大數據時代》中大數據指不用隨機分析法(抽樣調查)這樣的捷徑,而採用所有數據的方法)大數據的4V特點:Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值)。
大數據概念的發展歷史:
「大數據」這個術語最早期的引用可追溯到apache org的開源專案Nutch。當時,大數據被用來描述為更新網路搜尋索引需要同時進行大量處理或分析的大量資料集。隨著GoogleMapReduce和Google File System (GFS)的發布,大數據不再只用來描述大量的數據,還涵蓋了處理數據的速度。
早在1980年,著名未來學家阿爾文·托夫勒便在《第三波》一書中,將大數據熱情地讚頌為“第三波的華彩樂章” 。
不過,大約從2009年開始,「163大數據」才成為網路資訊科技產業的流行詞彙。美國網路資料中心指出,網路上的資料每年將成長50%,每兩年便將翻一番,而目前全球90%以上的資料是最近幾年才產生的。此外,數據並非單純指人們在網路上發布的訊息,全世界的工業設備、汽車、電錶上有著無數的數位感測器,隨時測量並傳遞著有關位置、運動、震動、溫度、濕度乃至空氣中化學物質的變化,也產生了海量的數據資訊。
大數據概念結構:
大數據就是網路發展到現今階段的一種表像或特徵而已,沒有必要神話它或對它保持敬畏之心,在以雲端運算為代表的技術創新大幕的襯托下,這些原本很難收集和使用的數據開始容易被利用起來了,透過各行各業的不斷創新,大數據會逐步為人類創造更多的價值。
其次,想要係統的認知大數據,必須要全面而細緻的分解它,我著手從三個層面來展開:
第一層面是理論,理論是認知的必經途徑,也是廣為認同與傳播的基線。我會從大數據的特徵定義理解產業對大數據的整體描繪和定性;從對大數據價值的探討來深入解析大數據的珍貴所在;洞悉大數據的發展趨勢;從大數據隱私這個特別而重要的視角審視人和數據之間的長久博弈。
第二層面是技術,技術是大數據價值體現的手段和前進的基石。我將分別從雲端運算、分散式處理技術、儲存技術和感知技術的發展來說明大數據從採集、處理、儲存到形成結果的整個過程。
第三層面是實踐,實踐是大數據的最終價值體現。我將分別從網路的大數據,政府的大數據,企業的大數據和個人的大數據四個面向來描繪大數據已經展現的美好景象及即將實現的藍圖。
大數據概念的特點:
大數據分析比起傳統的資料倉儲應用,具有資料量大、查詢分析複雜等特點。 《電腦學報》刊登的「架構大數據:挑戰、現況與展望」一文列舉了大數據分析平台需要具備的幾個重要特性,對當前的主流實現平台——並行資料庫、MapReduce及基於兩者的混合架構進行了分析歸納,指出了各自的優勢及不足,同時也對各個方向的研究現狀及作者在大數據分析方面的努力進行了介紹,對未來研究做了展望。
大數據的4個“V”,或者說特點有四個層面:第一,資料體積龐大。從TB級別,躍升到PB級別;第二,資料類型繁多。前文提到的網誌、影片、圖片、地理位置資訊等等。第三,處理速度快,1秒定律,可從各種類型的資料中快速獲得高價值的訊息,這一點也是和傳統的資料探勘技術有著本質的不同。第四,只要合理利用數據並進行正確、準確的分析,將會帶來很高的價值回報。業界將其歸納為4個「V」-Volume(大量)、Variety(多元)、Velocity(高速)、Value(價值)。
從某種程度上說,大數據是資料分析的尖端技術。簡言之,從各種類型的數據中,快速獲得有價值資訊的能力,就是大數據技術。明白這一點至關重要,也正是這一點促使該技術具備走向眾多企業的潛力。
大數據概念的用途:
大數據可分成大數據科技、大數據工程、大數據科學和大數據應用等領域。目前人們談論最多的是大數據技術和大數據應用。工程和科學問題尚未被重視。大數據工程指大數據的規劃建設運營管理的系統工程;大數據科學關注大數據網絡發展和運營過程中發現和驗證大數據的規律及其與自然和社會活動之間的關係。
物聯網、雲端運算、行動互聯網、車聯網、手機、平板電腦、PC以及遍布地球各個角落的各種各樣的傳感器,無一不是數據來源或者承載的方式。
有些例子包括網絡日誌,RFID,感測器網絡,社會網絡,社會數據(由於數據革命的社會),互聯網文本和文件;互聯網搜索索引;呼叫詳細記錄,天文學,大氣科學,基因組學,生物地球化學,生物,和其他複雜和/或跨學科的科研,軍事偵察,醫療記錄;攝影檔案館視頻檔案;和大規模的電子商務。
大數據的作用
對於一般的企業而言,大數據的作用主要表現在兩個方面,分別是數據的分析使用與進行二次開發項目。透過對禧金資訊大數據進行分析,不僅能把隱藏的數據挖掘出來,還能透過這些隱藏的訊息,透過實體的銷售,提升自己的客戶來源。至於對資料進行二次開發,在網路服務專案中被運用的比較多,透過將這些資訊進行總結與分析,從而製定出符合客戶需求的個人化方案,並營造出一種全新的廣告行銷方式,在這裡,你需要明白的是,透過大數據的分析,將產品與服務結合起來的並不是偶然事件,而實現這種的往往是數據時代的領導者。
綜上所述,大數據的運用,不僅標誌著時代的進步,同時也激勵人們進行更深層領域的探究。此外,針對大數據的研究,除了上述內容外,還需要了解大數據的三個特徵,分別是規模大、運轉速度快及資料多樣性。透過這三個面向的研究,不僅可以更容易的觀察到資料的本質嗎,有利於軟體處理平台的有效運作。
更多相關知識,請造訪常見問題欄位!
以上是《大數據時代》一書中的大數據是指什麼的詳細內容。更多資訊請關注PHP中文網其他相關文章!