データ ウェアハウスの基本機能には次のものが含まれます: 1. データの抽出と同期、データ クリーニング、データ変換を含む ETL 設計; 2. 一般に ODS レイヤー、CM レイヤー、CM レイヤーに分けられるデータの階層化ML レイヤー; 3.、データの予備モデリング。
このチュートリアルの動作環境: Windows 7 システム、Dell G3 コンピューター。
データ ウェアハウス、英語名は Data Warehouse で、DW または DWH と略されます。データ ウェアハウスは、企業のあらゆるレベルでの意思決定プロセスのためのあらゆる種類のデータのサポートを提供する戦略的なコレクションです。これは、分析レポートと意思決定支援の目的で作成された単一のデータ ストアです。ビジネス インテリジェンスを必要とする企業に、ビジネス プロセスの改善、監視時間、コスト、品質、管理に関するガイダンスを提供します。
データ ウェアハウスの基本機能
ETL 設計: データの抽出と同期、データ クリーニング、データ変換。リレーショナル データベース (mysql、mariadb、oracle など) とドキュメント データベース (mongodb、elasticsearch など) が含まれます。
データ階層化: 一般に、ODS 層、CM 層、ML 層に分かれます。 ODS レイヤーは未処理のデータを表します。 CM レイヤーは、クリーニングおよびマージ レイヤーのデータを表します。
予備的なデータ モデリング: データ階層 ML レイヤーに対応して、外部データ サポートを提供するための広いテーブルを形成するために、通常、リレーショナル モデル (スノーフレーク モデル) またはスター モデルが使用されます。
関連テクノロジー: HDFS、HIVE、HBASE、MR、SPARK、YARN など。
データ ウェアハウス アーキテクチャ
次の図は、参考として、多くの企業のデータ アーキテクチャを参考にして計画されたデータ アーキテクチャを示しています。
さらに関連する知識については、FAQ 列をご覧ください。
以上がデータ ウェアハウスの基本的な機能は何ですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。