首頁  >  文章  >  大數據的4v特徵分別是什麼?

大數據的4v特徵分別是什麼?

青灯夜游
青灯夜游原創
2020-12-09 13:50:26173511瀏覽

大數據的4v特徵分別是:1、規模性(Volume);隨著資訊化技術的高速發展,資料開始爆發性成長。 2、高速性(Velocity)。 3.多樣性(Variety);主要體現在資料來源多、資料型別多、資料之間關聯性強;4、價值性(Value)。

大數據的4v特徵分別是什麼?

本文操作環境:windows10系統、thinkpad t480電腦。

大數據(big data),IT行業術語,是指無法在一定時間範圍內用常規軟體工具進行捕捉、管理和處理的資料集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高成長率和多樣化的資訊資產。

大數據的4v特徵

大數據的特徵,由維克托邁爾-舍恩伯格和肯尼斯克耶編寫的《大數據時代》中提出,大數據的4V特徵:規模性(Volume)、高速性(Velocity)、多樣性(Variety)、價值性(Value)。

(1)規模性

隨著資訊化技術的快速發展,資料開始爆發性成長。大數據中的數據不再以幾個GB或幾個TB為單位來衡量,而是以PB(1千個T)、EB(1百萬個T)或ZB(10億個T)為計量單位。

(2)多樣性

多樣性主要體現在資料來源多、資料型別多、資料之間關聯性強這三個面向。

①數據來源多,企業面對的傳統數據主要是交易數據,而互聯網和物聯網的發展,帶來了社交網站、感測器等多種來源的數據。

而由於數據來自不同的應用系統和不同的設備,決定了大數據形式的多樣性。大體可分為三類:一是結構化數據,如財務系統數據、資訊管理系統數據、醫療系統數據等,其特點是數據間因果關係強;二是非結構化的數據,如視頻、圖片、音頻等,其特徵是數據間沒有因果關係;三是半結構化數據,如HTML文檔、郵件、網頁等,其特徵是數據間的因果關係較弱。

②資料型別多,且以非結構化資料為主。傳統的企業中,資料都是以表格的形式保存。而大數據中有70%-85%的數據是如圖片、音訊、視訊、網路日誌、連結資訊等非結構化和半結構化的資料。

③資料之間關聯性強,頻繁交互,如遊客在旅遊途中上傳的照片和日誌,就與遊客的位置、行程等資訊有很強的關聯性。

(3)高速性

這是大數據區分於傳統資料探勘最顯著的特徵。大數據與大量資料的重要差異在兩方面:一方面,大數據的資料規模更大;另一方面,大數據對處理資料的回應速度有更嚴格的要求。即時分析而非批次分析,資料輸入、處理與丟棄立刻見效,幾乎無延遲。資料的成長速度和處理速度是大數據高速性的重要體現。

(4)價值性

儘管企業擁有大量數據,但是發揮價值的僅是其中非常小的部分。大數據背後潛藏的價值龐大。由於大數據中有價值的數據所佔比例很小,而大數據真正的價值體現在從大量不相關的各種類型的數據中。挖掘出對未來趨勢與模式預測分析有價值的數據,並透過機器學習方法、人工智慧方法或資料探勘方法深度分析,並運用於農業、金融、醫療等各個領域,以期創造更大的價值。

想要查閱更多相關文章,請造訪PHP中文網! !

以上是大數據的4v特徵分別是什麼?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn