首頁  >  文章  >  大數據的多樣性使得資料被分成三種資料結構,分別是什麼

大數據的多樣性使得資料被分成三種資料結構,分別是什麼

青灯夜游
青灯夜游原創
2021-01-30 14:49:3230161瀏覽

大數據的多樣性使得數據被分成三種數據結構,分別是:1、結構化數據,是由二維表結構來邏輯表達和實現的數據;2、非結構化數據是資料結構不規則或不完整,沒有預先定義的資料模型,不方便用資料庫二維邏輯表來表現的資料;3、半結構化資料。

大數據的多樣性使得資料被分成三種資料結構,分別是什麼

本教學操作環境:windows7系統、Dell G3電腦。

大資料的多樣性使得資料被分成三種資料結構,分別是:結構化資料、非結構化資料和半結構化資料。

結構化資料

結構化資料也稱為行數據,是由二維表結構來邏輯表達和實現的數據,簡單來說就是資料庫。嚴格遵循資料格式與長度規範,主要透過關係型資料庫進行儲存與管理。

結構化資料標記,是一種能讓網站以更好的姿態展示在搜尋結果當中的方式。做了結構化資料標記,可讓網站在搜尋結果中很好地展示豐富網頁摘要。

搜尋引擎都支援標準的結構化資料標記,以便為使用者提供更好的上網體驗。網頁內微資料標記可以幫助搜尋引擎理解網頁上的信息,能更方便搜尋引擎辨識分類,判斷相關性。

同時結構化微數據可以讓搜尋引擎提供更豐富的搜尋結果摘要展現,也就是為用戶的具體查詢提供幫助的詳細信息,讓用戶直接在搜尋結果中看見你商品的重要信息。例如:商品的價格、名稱、庫存狀況(商品是否有貨)、評論者評分和評論等都可以在搜尋結果摘要直接看到。

這些豐富網頁摘要可協助使用者了解網站與他們的搜尋內容是否相關,並可讓網頁獲得更多點擊。

如在搜尋結果中,部分顯示了更多的星級評分、評論條數以及價格等因素,這無疑增加了網站的專業程度,且提高了客戶對網站的信任度,網站良好的曝光度無形中就提高了網站的點擊率與轉換率。

非結構化資料

與結構化資料相對的是不適於由資料庫二維表來表現的非結構化資料。

非結構化資料是資料結構不規則或不完整,沒有預先定義的資料模型,不方便用資料庫二維邏輯表來表現的資料。

包括所有格式的辦公室文件、XML、HTML、各類報表、圖片和音訊、視訊資訊等。支援非結構化資料的資料庫採用多值欄位、了欄位和變長欄位機制進行資料項目的建立和管理,廣泛應用於全文檢索和各種多媒體資訊處理領域

半結構化資料

半結構化資料(semi-structured data)。在做一個資訊系統設計時肯定會涉及到資料的存儲,一般我們都會將系統資訊保存在某個指定的關係資料庫中。我們會將資料依業務分類,並設計對應的表,然後將對應的資訊儲存到對應的表中。例如我們做一個業務系統,要保存員工基本資料:工號、姓名、性別、出生日期等等;我們就會建立一個對應的staff表。

但不是系統中所有資訊都可以這樣簡單的用一個表中的欄位就能對應的。

半結構化資料(semi-structured data)模型在資料庫系統中有著獨特的地位:

(1)它是一種適於資料庫整合的資料模型,也就是說,適於描述包含在兩個或多個資料庫(這些資料庫含有不同模式的相似資料)中的資料。

(2)它是一種標記服務的基礎模型,用於Web上共享資訊。

半結構化資料中結構模式附著或相融與資料本身,資料本身就描述了其對應結構模式。具體來說,半結構化資料具有下述特徵:

(1)資料結構自描述性。結構與資料相交融,在研究與應用上不需要區分「元資料」與「一般資料」(兩者合而為一)。

(2)資料結構描述的複雜性。結構難以納入現有的各種描述框架,實際應用中不易進行清晰的理解與掌握。

(3)資料結構所描述的動態性。資料變化通常會導致結構模式變化,整體上具有動態得結構模式。

常規的資料模型例如E-R模型、關係模型和物件模型恰恰與上述特徵相反,因此可以成為結構化資料模型。而相對於結構化數據,半結構化數據的組成更為複雜和不確定,從而也具有更高的靈活性,能夠適應更廣泛的應用需求。

想要查閱更多相關文章,請造訪PHP中文網! !

以上是大數據的多樣性使得資料被分成三種資料結構,分別是什麼的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn