首頁  >  文章  >  資料倉儲相對於操作型資料庫來說其突出特點是什麼

資料倉儲相對於操作型資料庫來說其突出特點是什麼

青灯夜游
青灯夜游原創
2022-07-19 16:15:493502瀏覽

突出特點是「海量資料支援」和「快速檢索技術」。資料倉儲是決策支援系統和線上分析應用資料來源的結構化資料環境,而資料庫是整個資料倉儲環境的核心,是資料存放的地方和提供對資料檢索的支援;相對於操縱型資料庫來說其突出的特點是對大量資料的支援和快速的檢索技術。

資料倉儲相對於操作型資料庫來說其突出特點是什麼

本教學操作環境:windows7系統、Dell G3電腦。

資料倉儲相對於操作型資料庫來說其突出特點是「海量資料支援」和「快速檢索技術」。

資料倉儲,英文名稱為Data Warehouse,可簡寫為DW或DWH。資料倉儲,是為企業所有層級的決策制定過程,提供所有類型資料支援的策略集合。它是單一資料存儲,出於分析性報告和決策支援目的而創建。為需要業務智慧的企業,提供指導業務流程改善、監視時間、成本、品質以及控制。

資料倉儲是決策支援系統(dss)和線上分析應用資料來源的結構化資料環境。資料倉儲研究並解決從資料庫中獲取資訊的問題。資料倉儲的特徵在於面向主題、整合性、穩定性和時變性。

資料倉儲的特點

資料倉儲,是在資料庫已經大量存在的情況下,為了進一步挖掘資料資源、為了決策需要而產生的,它並不是所謂的「大型資料庫」。資料倉儲的方案建置的目的,是為前端查詢和分析作為基礎,由於有較大的冗餘,所以需要的儲存也較大。為了更好地為前端應用服務,資料倉儲往往有以下幾點特點:

1、效率夠高。

資料倉儲的分析資料一般分為日、週、月、季、年等,可以看出,日為週期的資料要求的效率最高,要求24小時甚至12小時內,客戶能看到昨天的數據分析。由於有的企業每日的資料量很大,設計不好的資料倉儲常常會出問題,延遲1-3日才能給出數據,顯然不行的。

2、資料品質。

資料倉儲所提供的各種信息,肯定要準確的數據,但由於資料倉儲流程通常分為多個步驟,包括資料清洗,裝載,查詢,展現等等,複雜的架構會更多層次,那麼由於資料來源有髒資料或程式碼不嚴謹,都可以導致資料失真,客戶看到錯誤的資訊就可能導致分析出錯誤的決策,造成損失,而不是效益。

3、擴充性。

之所以有的大型資料倉儲系統架構設計複雜,是因為考慮到了未來3-5年的擴展性,這樣的話,未來不用太快花錢去重建資料倉儲系統,就能很穩定運作。主要體現在資料建模的合理性,資料倉儲方案中多出一些中間層,使海量資料流有足夠的緩衝,不至於資料量大很多,就運作不起來了。

從上面的介紹可以看出,資料倉儲技術可以將企業多年累積的資料喚醒,不僅為企業管理好這些海量數據,而且挖掘資料潛在的價值,從而成為通訊企業營運維護系統的亮點之一。

廣義的說,基於資料倉儲的決策支援系統由三個元件組成:資料倉儲技術,線上分析處理技術和資料探勘技術,其中資料倉儲技術是系統的核心,在這個系列後面的文章裡,將圍繞資料倉儲技術,介紹現代資料倉儲的主要技術和資料處理的主要步驟,討論在通訊營運維護系統中如何使用這些技術為營運維護帶來幫助。

4、主題導向

操作型資料庫的資料組織面向事務處理任務,各個業務系統之間各自分離,而資料倉儲中的資料是依照一定的主題域進行組織的。主題是與傳統資料庫的面向應用相對應的,是一個抽象概念,是在較高層次上將企業資訊系統中的資料綜合、歸類並進行分析利用的抽象。每一個主題對應一個宏觀的分析領域。資料倉儲排除對於決策無用的數據,提供特定主題的簡明視圖。

資料倉儲的組成

資料擷取工具

將資料從各種各樣的儲存方式中拿出來,進行必要的轉換、整理,然後再存放到資料倉儲內。各種不同資料儲存方式的存取能力是資料抽取工具的關鍵,應能產生COBOL程式、MVS作業控制語言(JCL)、UNIX腳本、和SQL語句等,以存取不同的資料。資料轉換都包括,刪除對決策應用沒有意義的資料段;轉換到統一的資料名稱和定義;計算統計和衍生資料;給缺值資料賦給缺省值;把不同的資料定義方式統一。

資料庫

是整個資料倉儲環境的核心,是資料存放的地方和提供資料檢索的支援。相對於操縱型資料庫來說其突出的特點是對大量資料的支援和快速的檢索技術。

元資料

元資料是描述資料倉儲內資料的結構和建立方法的資料。可將其依用途的不同分為兩類,技術元資料和商業元資料。

技術元資料是資料倉儲的設計和管理人員用於開發和日常管理資料倉儲所使用的資料。包括:資料來源資訊;資料轉換的描述;資料倉儲內物件和資料結構的定義;資料清理和資料更新時使用的規則;來源資料到目的資料的對應;使用者存取權限,資料備份歷史記錄,資料匯入歷史記錄,資訊發布歷史記錄等。

商業元資料從商業業務的角度描述了資料倉儲中的資料。包括:業務主題的描述,包含的資料、查詢、報表;

元資料為存取資料倉儲提供了一個資訊目錄(informationdirectory),這個目錄全面描述了資料倉儲中都有什麼資料、這些數據怎麼得到的、怎麼存取這些數據。是資料倉儲運作和維護的中心,資料倉儲伺服器利用他來存貯和更新數據,使用者透過他來了解和存取資料。

資料集市

為了特定的應用目的或應用範圍,而從資料倉儲中獨立出來的一部分數據,也可稱為部門資料或主題數據(subjectarea)。在資料倉儲的實施過程中往往可以從一個部門的資料集市著手,以後再用幾個資料集市組成一個完整的資料倉儲。需要注意的就是在實施不同的資料集市時,同一意義的欄位定義一定要相容,這樣在以後實施資料倉儲時才不會造成大麻煩。

國外知名的Garnter關於資料集市產品報告中,位於第一象限的敏捷商業智慧產品有QlikView, Tableau和SpotView,都是全記憶體運算的資料集市產品,在大數據方面對傳統商業智慧產品巨頭形成了挑戰。國內BI產品起步較晚,知名的敏捷型商業智慧產品有PowerBI, 永洪科技的Z-Suite,SmartBI,FineBI商業智慧軟體等,其中永洪科技的Z-Data Mart是一款熱記憶體運算的數據集市產品。國內的德昂資訊也是一家資料集市產品的系統整合商。

資料倉儲管理

安全與特權管理;追蹤資料的更新;資料品質檢查;管理和更新元資料;稽核和報告資料倉儲的使用和狀態;刪除資料;複製、分割和分發資料;備份和復原;儲存管理。

資訊發布系統

把資料倉儲中的資料或其他相關的資料傳送給不同的地點或使用者。基於Web的資訊發布系統是對付多用戶存取的最有效方法。

存取工具

為使用者存取資料倉儲提供手段。有資料查詢和報表工具;應用開發工具;管理資訊系統(EIS)工具;線上分析(OLAP)工具;資料探勘工具。

更多相關知識,請造訪常見問題欄位!

以上是資料倉儲相對於操作型資料庫來說其突出特點是什麼的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn