ホームページ  >  記事  >  データベース  >  mysql 多次元データ ウェアハウス ガイドとは何ですか

mysql 多次元データ ウェアハウス ガイドとは何ですか

(*-*)浩
(*-*)浩オリジナル
2019-05-09 15:03:142503ブラウズ

MySQL 多次元データ ウェアハウス ガイドは実用的な本です。 MySQL データベースを使用しますが、この本は MySQL については説明しません。この本ではハードウェア アーキテクチャの問題については扱っていません。本書は主にデータ ウェアハウスの設計と開発テクノロジに関するものです。 mysql 多次元データ ウェアハウス ガイドへようこそ。

おすすめコース: MySQL チュートリアル

mysql 多次元データ ウェアハウス ガイドとは何ですか

データ ウェアハウスは、さまざまなデータ ソースを統合することで、現在の業務内容や経営情報などの情報を一元化できます。システムやさまざまな外部情報ソース。これらのソース データは統合、クリーンアップ、変換され、これらのデータ ソースからデータを直接読み取る必要がある場合、データはより運用しやすい方法でデータ ウェアハウスに保存されます。

データ ウェアハウスのデータ構造により、現在および過去のデータを保存できます。現在のデータは実際のトランザクション操作アクティビティに必要であり、通常は定期的なハードコピー (印刷されたレポートなど) またはオンライン レポートです。多くの場合、使用が簡単ではない履歴データは、追跡、推論分析、比較などの特定時点の分析に基づいたビジネス情報を提供します。これらはすべて、長期計画や戦略的な市場決定にとって重要です。

複数の情報ソースからの情報を統合する方法、ストレージを定期的に蓄積する方法、効果的な需要の設計と開発手法。これらはすべて、トランザクション管理情報システムで使用される手法とは大きく異なります。この本はデータ ウェアハウスの設計と開発テクニックに関するものであり、データ ウェアハウスの構築に関連する技術的な問題のほとんどをカバーしています。さらに重要なのは、この本は、実用的なデータ ウェアハウスを開発するためのわかりやすいハウツー ガイドを提供していることです。

本書の適用範囲

MySQL 多次元データ ウェアハウス ガイドは実用的な書籍です。 MySQL データベースを使用しますが、この本は MySQL については説明しません。この本ではハードウェア アーキテクチャの問題については扱っていません。

本書は主にデータ ウェアハウスの設計と開発テクノロジに関するものです。これには、開発プロジェクトの管理、理論、および開発をどのように主導するかなどの関連する技術的問題は含まれません。

この本では、データ ウェアハウス開発の例を使用して、テクノロジーがどのように適用されるかを示します。実際のデータ ウェアハウス開発に適したデータ モデルと SQL スクリプトを提供します。これらのスクリプトは、mysql バージョン 5.0.21 を使用して Windows XP professional sp2 プラットフォームでテストされています。

さらに、この本では特に次のトピックについては説明しません:

データ ウェアハウスの概念

Sql

MySQL データベース

この本を読んでいる人向け:

データ ウェアハウスは、政府部門や非営利団体から学校、製造業から小売店、金融機関から医療機関に至るまで、さまざまな組織や企業で使用されています。従来の企業からインターネット販売者まで。

本書は主にデータ ウェアハウス開発者を対象としています。ただし、IT マネージャーやその他の IT 専門家、特に MIS (ビジネス レポート) や DSS (意思決定支援アプリケーション) に興味のある人にとっては、この本は同様に役立つでしょう。一般に、本書は分析アプリケーション用のデータの準備に携わる人、および印刷レポートやオンライン レポートなどの情報を提出する必要がある人を対象としています。

この本は、データ ウェアハウスの初心者にも適しています。初めてのデータ ウェアハウスの開発を準備している人に、即座に支援を提供します。

教師と生徒は、この本を教科書として使用して、データ ウェアハウスの原則と概念についての理解を明確にすることができます。ほとんどの章は実験演習用にカスタマイズできます。

準備するスキル

この本は IT 初心者向けではありません。この本をより効果的に使用するには、読者がある程度のシステム開発経験を持っている必要があります。ただし、データ ウェアハウス構築の経験は必要ありません。

この本の例を実践する必要がある人は、RDBMS (リレーショナル データベース管理システム) と SQL の実践的なスキルを持っている必要があります。

この本から得られるもの

元は企業の販売関連データを保存していたデータ ウェアハウスを一例として使用し、データを磨き、実践することができます。そして実践的なスキル。この例は、実際のデータ ウェアハウスの機能を簡素化したバージョンであり、そのプロトタイプは多くの業種で見られます。

この例では、本書で紹介されている手法を使用して、MySQL データベースに基づいた販売関連のデータ ウェアハウスを段階的に開発します。これらの手法は、一般的なデータ ウェアハウス開発で遭遇する問題の分解手法です。この記事を読み、すべての演習を完了すると、関連する実務経験を積み、初めての実際のデータ ウェアハウス プロジェクトを担当する準備が整います。

各章の概要

この本には 25 の章と付録が含まれています。すべての章は 4 つの部分で構成されています。最初の部分では、データ ウェアハウスの基本について説明します。 2 番目の部分では、生データからデータ ウェアハウスへの移行について説明します。パート 3 では、データ ウェアハウスの進化を制御する方法について説明します。 4 番目の部分には、いくつかの高度な多次元テクニックが含まれます。次のセクションでは、各章のプレビューを示します。

パート 1 基本原則

パート 1 では、多次元データ ウェアハウスの基本原則について説明し、4 つの章で構成されています。

第 1 章「基本コンポーネント」では、スター スキーマ (ファクト テーブルが複数のディメンション テーブルで囲まれたデータベース スキーマ) を紹介し、スキーマの基本コンポーネントについて説明します。

第 2 章「ディメンション履歴」では、ディメンション メンバーの履歴レコードを維持するためのプロキシ キーの使用方法を紹介します。

第 3 章「加法性の測定」では、ディメンション データ ウェアハウスの最も重要な機能の 1 つである、データ ウェアハウスのファクト テーブルに格納されているメジャーの加法性について説明します。

第 4 章「ディメンション クエリ」では、スター スキーマに最適な SQL クエリを紹介します。ディメンション クエリを使用すると、ディメンション データ ウェアハウスに、シンプルと効率という 2 つの最も基本的な設計指標があるかどうかを証明できます。

パート 2: 抽出、変換、および読み込み

この記事の 5 つの章すべてには、データ統合、ファクト テーブル、およびディメンション テーブルが含まれます。

第 5 章「ソース データの抽出」では、さまざまな種類のデータの抽出について説明します。

第 6 章「時間ディメンションのインポート」では、時間ディメンションをロードするための 3 つの最も一般的な手法について説明します。

第 7 章「初期インポート」と第 8 章「定期インポート」では、初回と定期の 2 種類のインポート手法が説明されています。

第 9 章「定期的なインポート プラン」は、2 番目の記事の概要として、Windows タスク マネージャーを使用して定期的なインポート プランを実装する方法に関する高度なガイドを提供します。

パート 3: 成長

パート 3 では、さまざまな処理テクノロジを紹介します。主に、成功した多次元データ ウェアハウスの成長プロセスで遭遇する関連問題に対処します。この部分は 10 章から構成されています。

第 10 章「フィールドの追加」では、既存のデータ ウェアハウスのテーブルにフィールドを追加する際の技術的な問題について説明します。

第 11 章「オンデマンド ローディング」では、オンデマンド ローディング テクノロジーについて説明します。

第 12 章「ディメンション テーブル サブセット」では、ユーザーがディメンション テーブル サブセットの問題に対処するのに役立つ関連テクノロジを紹介します。

第 13 章「ディメンションのロール プレイング」では、ファクト テーブル内で同じディメンションを複数回使用する方法について説明します。

第 14 章「スナップショット」では、データを要約する必要がある場合に高速パフォーマンスのクエリを提供できます。

第 15 章「ディメンションのみの階層」と第 16 章「複数のパスと不規則なディメンション階層」では、集計とドリル分析に役立つシンプルなマルチパスのディメンション手法について説明します。

第 17 章「次元削減」では、次元削減手法を使用してデータ ウェアハウス スキーマの複雑さを軽減する方法を示します。

第 18 章「ガベージ ディメンション」では、ガベージ ディメンションのテクノロジについて説明します。つまり、一見無関係に見えるが、ユーザーによって分析が必要になることが多いデータをディメンションに編成します。

第 19 章「複数のスター スキーマ」では、複数のスター スキーマをスキーマに追加する方法を示します。

パート 4: 高度なテクノロジー

6 つの章で構成されています。

第 20 章「不完全なデータ ソース」では、構造がターゲット テーブルに直接マップできないデータ ウェアハウス内のデータ ソースを処理する方法を紹介します。

第 21 章「ファクトのないファクト テーブル」では、顧客が分析するための一種の補助データ、つまりファクト フィールドのないファクト テーブルを作成するのに役立ちます。このデータはデータ ソースから直接測定できません。

第 22 章「最新のファクト」には、データ ソース内の特定のファクトが計画されたロード時間より前に発生しない場合の状況を処理する手法が含まれています。

第 23 章「外部データ ソースとディメンションのマージ」には、外部データ ソースを処理する手法と、複数のディメンションに散在する属性を 1 つのディメンションにマージする方法という 2 つのトピックが含まれています。

第 24 章「累積測定」では、計算測定の非加法性と累積測定という 2 つの関連する問題について説明します。

第 25 章「セグメント化されたディメンション」では、ユーザーが連続値を持つ属性のデータ分析を実行するのに役立つ手法について説明します。

付録

付録 a「フォーマット ファイル データ ソース」では、本書の例でフォーマット ファイル データ ソースを使用する方法を紹介します。

最も人気のあるオープン ソース データベース ソフトウェアである Mysql をデータ ウェアハウス アプリケーションに使用することは、本書以前の多次元データ ウェアハウス作成入門ガイドでは一度も紹介されていませんでした。トピックには、スター スキーマ モデリング、データ ロード (データ抽出、変換、ロード: etl)、テスト検証、および多次元クエリが含まれます。この本では、最初から最後まで実践的で比較的単純な実際のプロジェクトを使用します。包括的でアクセスしやすい記述形式により、データ ウェアハウスを構築する必要があるプログラマーが関連する例や情報を利用できるようになります。

著者について

Djoni Darmawikarta は、かつて IBM に勤務していましたが、現在はカナダの保険会社のデータ ウェアハウスおよびビジネス インテリジェンス チームの技術専門家です。現在オンタリオ州トロント在住

以上がmysql 多次元データ ウェアハウス ガイドとは何ですかの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。