Maison >Problème commun >Quelle est la couche de données pour le traitement etl des données ?
La couche de données qui effectue le traitement etl sur les données est : la couche de chargement des données. ETL est le processus de chargement des données du système d'entreprise dans l'entrepôt de données après extraction, nettoyage et conversion. Le but est d'intégrer des données dispersées, désordonnées et non standard dans l'entreprise afin de fournir une base analytique pour la prise de décision de l'entreprise.
L'environnement d'exploitation de ce tutoriel : Système Windows10, ordinateur Dell G3.
La couche de données qui effectue le traitement etl sur les données est : la couche de chargement des données.
ETL (Extract-Transform-Load, technologie d'entrepôt de données) est le processus d'extraction (extrait), de nettoyage et de transformation (transformation) des données du système d'entreprise, puis de leur chargement (chargement) dans l'entrepôt de données. Le but est d'intégrer des données dispersées, désordonnées et non standard dans l'entreprise pour fournir une base analytique à la prise de décision de l'entreprise. L'ETL est un maillon important du projet BI (Business Intelligence).
Description de chaque couche de l'entrepôt de données :
1. Couche de chargement des données : ETL (Extract-Transform-Load)
2. : ODS (Operational Data Store)
3. Couche d'entrepôt de données : DW (Data Warehouse)
Couche de détail des données : DWD (Data Warehouse Detail)
Couche intermédiaire de données : DWM (Data WareHouse Middle)
Couche de service de données : DWS (Data WareHouse Service)
4. Couche d'application de données : APP (Application)
5. Couche de surface de dimension : DIM (Dimension)
Avantages de la superposition :
Structure de données claire : chaque couche de données a sa portée et ses responsabilités, ce qui facilite la localisation et la compréhension lors de l'utilisation de tables
Réduire le développement répété : normaliser la stratification des données et développer des données communes de couche intermédiaire, ce qui peut réduire d'énormes calculs répétés
Unifier le calibre des données : grâce aux données superposées, fournissant des données unifiées calibre d'exportation et de sortie externe unifiée
Simplification des problèmes complexes : décomposez les tâches complexes en plusieurs étapes à terminer, et chaque couche n'en traite qu'une seule. Les étapes sont relativement simples et faciles à comprendre . Lorsqu'il y a un problème avec les données, vous n'avez pas besoin de réparer toutes les données, il vous suffit de commencer à les réparer à partir de l'étape problématique.
Protégez les exceptions dans les données originales : pas besoin de changer d'activité une seule fois avant de réaccéder aux données.
Pour plus de connaissances connexes, veuillez visiter la colonne FAQ !
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!