Maison >base de données >tutoriel mysql >Qu'est-ce que le guide de l'entrepôt de données multidimensionnel MySQL

Qu'est-ce que le guide de l'entrepôt de données multidimensionnel MySQL

(*-*)浩
(*-*)浩original
2019-05-09 15:03:142621parcourir

MySQL Multidimensionnel Data Warehouse Guide est un livre pratique. Vous utiliserez la base de données MySQL, mais ce livre ne concerne pas MySQL. Ce livre ne couvre aucun problème d'architecture matérielle. Ce livre concerne principalement la technologie de conception et de développement des entrepôts de données. Bienvenue dans le guide de l'entrepôt de données multidimensionnel MySQL.

Cours recommandés : Tutoriel MySQL

Qu'est-ce que le guide de l'entrepôt de données multidimensionnel MySQL

L'entrepôt de données peut unifier les informations en intégrant diverses sources de données, y compris les opérations commerciales actuelles et les informations de gestion. systèmes, ainsi que diverses sources d’informations externes. Ces données sources seront intégrées, nettoyées, transformées, et si les données doivent être lues directement à partir de ces sources de données, les données seront stockées dans un entrepôt de données d'une manière plus conviviale sur le plan opérationnel.

La façon dont les données sont structurées dans un entrepôt de données vous permet de stocker des données actuelles et historiques. Les données actuelles sont nécessaires aux activités opérationnelles réelles et constituent généralement une copie papier périodique (comme un rapport imprimé) ou un rapport en ligne. Les données historiques, qui ne sont souvent pas si faciles à utiliser, peuvent fournir des informations commerciales basées sur une analyse ponctuelle, telle que le suivi, l'analyse inférentielle et la comparaison, qui sont toutes importantes pour la planification à long terme et les décisions stratégiques de marché.

Comment intégrer des informations provenant de plusieurs sources d'informations, accumuler régulièrement du stockage, une conception efficace de la demande et une technologie de développement, qui sont toutes très différentes de la technologie utilisée dans les systèmes d'information de gestion transactionnelle. Ce livre traite des techniques de conception et de développement d'entrepôts de données et couvre la plupart des problèmes techniques liés à la création d'un entrepôt de données. Plus important encore, ce livre fournit un guide pratique facile à comprendre pour développer un entrepôt de données pratique.

Champ d'application de ce livre

MySQL Multidimensionnel Data Warehouse Guide est un livre pratique. Vous utiliserez la base de données MySQL, mais ce livre ne concerne pas MySQL. Ce livre ne couvre aucun problème d'architecture matérielle.

Ce livre concerne principalement la technologie de conception et de développement des entrepôts de données. Cela n'implique pas la gestion de projets de développement, la théorie et les questions techniques connexes telles que la manière de diriger le développement.

Ce livre utilise un exemple de développement d'entrepôt de données pour montrer comment la technologie est appliquée. Fournissez des modèles de données et des scripts SQL, qui conviendront au développement réel d'un entrepôt de données. Ces scripts ont été testés sur la plateforme Windows XP Professional SP2 en utilisant MySQL version 5.0.21.

De plus, cet ouvrage n'abordera plus notamment les sujets suivants :

La notion d'entrepôt de données

Sql

Base de données MySQL

Pour les personnes qui lisent ce livre :

Les entrepôts de données sont utilisés dans diverses organisations et entreprises, des ministères gouvernementaux, des organisations à but non lucratif aux écoles, de la fabrication aux magasins de détail, des institutions financières aux établissements de santé, des entreprises traditionnelles aux commerçants Internet.

Ce livre est principalement destiné aux développeurs d'entrepôts de données. Cependant, les responsables informatiques et autres professionnels de l'informatique, en particulier ceux intéressés par les MIS (reportages d'entreprise) et les DSS (applications d'aide à la décision), trouveront ce livre tout aussi utile. En général, ce livre est destiné à ceux qui participent à la préparation de données pour des applications analytiques et à ceux qui doivent soumettre des informations, telles que des rapports imprimés et des rapports en ligne.

Ce livre convient également aux débutants en entrepôt de données. Il aidera rapidement et directement ceux qui se préparent à développer leur premier entrepôt de données.

Les enseignants et les étudiants peuvent utiliser ce livre comme manuel pour clarifier leur compréhension des principes et concepts de l'entrepôt de données. La plupart des chapitres peuvent être personnalisés pour des exercices de laboratoire.

Compétences préparées

Ce livre n'est pas destiné aux nouveaux arrivants en informatique. Afin d'utiliser ce livre plus efficacement, les lecteurs doivent avoir une certaine expérience en développement de systèmes. Cependant, une expérience préalable dans la construction d’entrepôts de données n’est pas requise.

Ceux qui ont besoin de mettre en pratique les exemples de ce livre doivent avoir des compétences pratiques en SGBDR (système de gestion de bases de données relationnelles) et en SQL.

Ce que vous pouvez obtenir de ce livre

Vous serez en mesure d'affiner vos données en utilisant juste un exemple, un entrepôt de données qui stockait à l'origine les données relatives aux ventes de l'entreprise, et de les mettre en pratique. Connaissances et pratiques en entrepôt compétences. Cet exemple est une version allégée d'un véritable entrepôt de données, dont les prototypes peuvent être trouvés dans de nombreux types d'entreprises.

Vous utiliserez les techniques présentées dans ce livre pour développer l'entrepôt de données liées aux ventes dans cet exemple, étape par étape, sur la base de la base de données MySQL. Ces techniques sont des techniques de décomposition pour les problèmes qui seront rencontrés dans le développement d'un entrepôt de données commun. En complétant cet article et en complétant tous les exercices, vous acquerrez une expérience professionnelle pertinente et serez prêt à prendre en charge votre premier projet d'entrepôt de données réel.

Aperçu des chapitres

Ce livre contient 25 chapitres et une annexe. Tous les chapitres sont organisés en quatre parties. La première partie couvre les bases de l'entreposage de données. La deuxième partie décrit la migration des données brutes vers le datawarehouse. La troisième partie explique comment contrôler l'évolution des entrepôts de données. La quatrième partie implique quelques techniques multidimensionnelles avancées. Les sections suivantes donnent un aperçu de chaque chapitre.

Partie 1 Principes de base

La partie 1 couvre les principes de base de l'entrepôt de données multidimensionnel et comprend quatre chapitres.

Le chapitre 1, « Composants de base », présente le schéma en étoile (un schéma de base de données avec une table de faits entourée de plusieurs tables de dimensions) et explique les composants de base du schéma.

Chapitre 2, « Historique des dimensions » présente l'utilisation de clés proxy pour conserver les enregistrements historiques des membres de la dimension.

Le chapitre 3, « Mesurer l'additivité », couvre l'une des caractéristiques les plus importantes des entrepôts de données dimensionnelles, à savoir l'additivité des mesures stockées dans les tables de faits de l'entrepôt de données.

Le chapitre 4, « Requête de dimension », présente une requête SQL la plus adaptée au schéma en étoile. La requête de dimension peut être utilisée pour prouver si un entrepôt de données dimensionnelles possède les deux indicateurs de conception les plus fondamentaux : simple et efficace.

Partie 2 : Extraction, transformation et chargement

Les 5 chapitres de cet article impliquent l'intégration de données, les tables de faits et les tables de dimension.

Le Chapitre 5, « Extraction des données sources » présente l'extraction de différents types de données.

Le Chapitre 6 « Importation de dimensions temporelles » couvre les trois techniques les plus courantes pour charger les dimensions temporelles.

Le chapitre 7, « Importation initiale » et le chapitre 8, « Importation périodique » impliquent deux types de techniques d'importation, initiale et périodique.

Le chapitre 9, « Plan d'importation périodique », en tant que résumé du deuxième article, fournit un guide avancé sur la façon d'utiliser le Gestionnaire des tâches de Windows pour mettre en œuvre un plan d'importation régulier.

Partie 3 : Croissance

La partie 3 présente différentes technologies de traitement, qui traitent principalement des problèmes connexes rencontrés dans le processus de croissance d'un entrepôt de données multidimensionnel réussi. Cette partie comporte dix chapitres.

Le chapitre 10, « Ajout d'un champ » aborde les problèmes techniques liés à l'ajout d'un champ à une table dans un entrepôt de données existant.

Le chapitre 11, « Chargement à la demande » implique la technologie de chargement à la demande.

Le chapitre 12, « Sous-ensemble de table de dimension », présente les technologies associées pour aider les utilisateurs à résoudre les problèmes de sous-ensemble de table de dimension.

Chapitre 13, "Jeu de rôle dimensionnel", sur l'utilisation multiple de la même dimension dans une table de faits.

Chapitre 14, « Instantané » vous permet de fournir des requêtes de performances rapides lorsque vous avez besoin de résumer des données.

Le chapitre 15, « Hiérarchie dimensionnelle uniquement » et le chapitre 16, « Chemins multiples et hiérarchies dimensionnelles irrégulières » traitent des techniques dimensionnelles simples et multi-chemins. En conséquence, ces techniques aident les gens à agréger et à analyser.

Le chapitre 17, « Réduction de dimensionnalité », montre comment utiliser les techniques de réduction de dimensionnalité pour réduire la complexité d'un schéma d'entrepôt de données.

Le chapitre 18, "Garbage Dimension", concerne la technologie de la dimension poubelle, c'est-à-dire que les données qui ne semblent pas pertinentes mais qui doivent souvent être analysées par les utilisateurs sont organisées de manière dimensionnelle.

Le chapitre 19, « Schémas en étoile multiples » montre comment ajouter plusieurs schémas en étoile au schéma.

Partie 4 : Technologie avancée

Contient six chapitres.

Le chapitre 20, « Sources de données incomplètes », explique comment gérer les sources de données dans les entrepôts de données dont les structures ne peuvent pas être directement mappées aux tables cibles.

Chapitre 21, "Tableau de faits sans faits", vous aide à créer des données auxiliaires pour l'analyse pour les clients, un tableau de faits sans champs de faits. Ces données ne peuvent pas être mesurées directement à partir de la source de données.

Le chapitre 22, « Faits tardifs », contient une technique permettant de gérer les situations dans lesquelles un fait particulier dans la source de données n'est pas généré avant l'heure de chargement planifiée.

Le chapitre 23, « Sources de données externes et fusion de dimensions », comprend deux sujets : les techniques de traitement des sources de données externes et la manière de fusionner des attributs dispersés dans plusieurs dimensions en une seule dimension.

Le chapitre 24, « Mesures cumulatives », aborde deux questions liées : la non-additivité des mesures informatiques et des mesures cumulatives.

Le chapitre 25, « Dimension segmentée », décrit une technique qui peut aider les utilisateurs à effectuer une analyse de données sur des attributs avec des valeurs continues.

Annexe

L'annexe a, "Format de la source de données du fichier", explique comment utiliser la source de données du fichier de format dans les exemples de ce livre.

Utilisation de MySQL, le logiciel de base de données open source le plus populaire, pour les applications d'entrepôt de données Avant ce livre, cela n'a jamais été présenté dans ce guide d'introduction à la création d'un entrepôt de données multidimensionnel. Les sujets incluent la modélisation de schémas en étoile, le chargement de données (extraction, transformation et chargement de données : etl), la validation de tests et les requêtes multidimensionnelles. Ce livre utilise un projet réel, pratique et relativement simple, du début à la fin. Son format d'écriture complet et accessible met des exemples et des informations pertinents à la disposition des programmeurs qui ont besoin de créer des entrepôts de données.

À propos de l'auteur

Djoni Darmawikarta a déjà travaillé pour IBM et est maintenant un expert technique au sein de l'équipe d'entrepôt de données et de business intelligence d'une compagnie d'assurance canadienne. Vivant actuellement à Toronto, en Ontario

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn