Die herausragenden Merkmale sind „massive Datenunterstützung“ und „Fast-Retrieval-Technologie“. Data Warehouse ist eine strukturierte Datenumgebung für Entscheidungsunterstützungssysteme und Datenquellen für Online-Analyseanwendungen. Die Datenbank ist der Kern der gesamten Data Warehouse-Umgebung, in der Daten gespeichert werden und der Datenabruf unterstützt wird. Sie ist im Vergleich zu manipulativen Datenbanken hervorragend Es zeichnet sich durch die Unterstützung großer Datenmengen und eine schnelle Abruftechnologie aus.
Die Betriebsumgebung dieses Tutorials: Windows 7-System, Dell G3-Computer.
Im Vergleich zu Betriebsdatenbanken sind die herausragenden Merkmale des Data Warehouse „massive Datenunterstützung“ und „schnelle Abruftechnologie“.
Data Warehouse, der englische Name ist Data Warehouse, das als DW oder DWH abgekürzt werden kann. Ein Data Warehouse ist eine strategische Sammlung, die alle Arten von Daten für Entscheidungsprozesse auf allen Ebenen eines Unternehmens unterstützt. Es handelt sich um einen einzelnen Datenspeicher, der für analytische Berichts- und Entscheidungsunterstützungszwecke erstellt wurde. Bietet Anleitungen zur Verbesserung von Geschäftsprozessen, zur Überwachung von Zeit, Kosten, Qualität und Kontrolle für Unternehmen, die Business Intelligence benötigen.
Data Warehouse ist eine strukturierte Datenumgebung für Entscheidungsunterstützungssysteme (DSS) und Datenquellen für Online-Analyseanwendungen. Data Warehousing untersucht und löst die Probleme der Informationsbeschaffung aus Datenbanken. Data Warehouses zeichnen sich durch Themenorientierung, Integration, Stabilität und Zeitvariabilität aus.
Eigenschaften des Data Warehouse
Data Warehouse wird für die weitere Ausbeutung von Datenressourcen und Entscheidungsanforderungen erstellt, wenn bereits eine große Anzahl von Datenbanken vorhanden ist. Es handelt sich nicht um eine sogenannte „große Datenbank“. Der Zweck des Aufbaus einer Data-Warehouse-Lösung besteht darin, als Grundlage für Front-End-Abfragen und -Analysen zu dienen. Aufgrund der großen Redundanz ist auch der erforderliche Speicher groß. Um Front-End-Anwendungen besser bedienen zu können, weisen Data Warehouses häufig die folgenden Merkmale auf:
1 Die Effizienz ist hoch genug.
Die Analysedaten des Data Warehouse sind im Allgemeinen in Tage, Wochen, Monate, Quartale, Jahre usw. unterteilt. Es ist ersichtlich, dass die täglichen Zyklusdaten die höchste Effizienz erfordern. Es ist erforderlich, dass Kunden die Daten von gestern sehen können 24 Stunden oder sogar 12 Stunden Datenanalyse. Da einige Unternehmen täglich über große Datenmengen verfügen, kommt es häufig zu Problemen mit schlecht konzipierten Data Warehouses und die Daten können erst mit einer Verzögerung von 1-3 Tagen bereitgestellt werden, was natürlich nicht möglich ist.
2. Datenqualität.
Bei den verschiedenen vom Data Warehouse bereitgestellten Informationen muss es sich um genaue Daten handeln. Da der Data Warehouse-Prozess jedoch normalerweise in mehrere Schritte unterteilt ist, einschließlich Datenbereinigung, Laden, Abfragen, Anzeigen usw., weist die komplexe Architektur mehrere Ebenen auf. Da die Datenquelle dann fehlerhafte Daten enthält oder der Code nicht streng ist, kann es zu Datenverzerrungen kommen. Wenn Kunden falsche Informationen sehen, können sie durch die Analyse falsche Entscheidungen treffen, was zu Verlusten anstelle von Vorteilen führt.
3. Erweiterbarkeit.
Der Grund, warum einige große Data-Warehouse-Systemarchitekturen komplex sind, liegt darin, dass sie die Skalierbarkeit in den nächsten 3-5 Jahren berücksichtigen. Auf diese Weise kann das Data-Warehouse-System stabil laufen, ohne zu viel Geld für den Neuaufbau auszugeben das Data-Warehouse-System in der Zukunft. Dies spiegelt sich hauptsächlich in der Rationalität der Datenmodellierung wider. In der Data-Warehouse-Lösung gibt es einige weitere mittlere Schichten, sodass der massive Datenfluss über genügend Puffer verfügt, sodass die Datenmenge nicht viel größer wird und nicht ausgeführt werden kann .
Wie aus der obigen Einführung hervorgeht, kann die Data-Warehouse-Technologie die von Unternehmen über viele Jahre hinweg gesammelten Daten erwecken. Sie verwaltet nicht nur diese riesigen Datenmengen für Unternehmen, sondern erschließt auch den potenziellen Wert der Daten und wird so zu einem der Highlights von Betriebs- und Wartungssystemen für Kommunikationsunternehmen.
Im Großen und Ganzen besteht ein auf Data Warehouse basierendes Entscheidungsunterstützungssystem aus drei Komponenten: Data Warehouse-Technologie, Online-Analyseverarbeitungstechnologie und Data-Mining-Technologie. In den folgenden Artikeln dieser Serie stellen wir dar Dieser Artikel konzentriert sich auf die Data-Warehouse-Technologie und stellt die Haupttechnologien moderner Data-Warehouses und die Hauptschritte der Datenverarbeitung vor. Außerdem wird erörtert, wie diese Technologien zur Unterstützung des Betriebs und der Wartung in Kommunikationsbetriebs- und -wartungssystemen eingesetzt werden können.
4. Themenorientiert
Die Datenorganisation operativer Datenbanken ist auf Transaktionsverarbeitungsaufgaben ausgerichtet und die Daten im Data Warehouse sind nach bestimmten Themenbereichen organisiert. Das Thema entspricht dem anwendungsorientierten Charakter traditioneller Datenbanken. Es handelt sich um ein abstraktes Konzept, das Daten in Unternehmensinformationssystemen auf einer höheren Ebene synthetisiert, klassifiziert, analysiert und nutzt. Jedes Thema entspricht einem Makroanalysebereich. Das Data Warehouse eliminiert Daten, die für die Entscheidungsfindung nicht nützlich sind, und bietet einen prägnanten Überblick über ein bestimmtes Thema.
Zusammensetzung des Data Warehouse
Datenextraktionstool
entnimmt Daten aus verschiedenen Speichermethoden, führt die erforderliche Transformation und Organisation durch und speichert sie dann im Data Warehouse. Die Fähigkeit, auf verschiedene Datenspeichermethoden zuzugreifen, ist der Schlüssel zu Datenextraktionstools. Sie sollten in der Lage sein, COBOL-Programme, MVS Job Control Language (JCL), UNIX-Skripte und SQL-Anweisungen zu generieren, um auf verschiedene Daten zuzugreifen. Die Datentransformation umfasst das Löschen von Datensegmenten, die für Entscheidungsanwendungen nicht von Bedeutung sind; das Berechnen von Statistiken und abgeleiteten Daten sowie das Vereinheitlichen verschiedener Datendefinitionsmethoden;
Datenbank
ist der Kern der gesamten Data Warehouse-Umgebung, in der Daten gespeichert werden und Unterstützung für den Datenabruf bieten. Im Vergleich zu manipulativen Datenbanken sind seine herausragenden Merkmale die Unterstützung großer Datenmengen und die schnelle Abruftechnologie.
Metadaten
Metadaten sind Daten, die die Struktur und Erstellungsmethode von Daten im Data Warehouse beschreiben. Sie können je nach Verwendungszweck in zwei Kategorien unterteilt werden: technische Metadaten und kommerzielle Metadaten.
Technische Metadaten sind die Daten, die von Data-Warehouse-Designern und -Managern verwendet werden, um die Nutzung von Data-Warehouses zu entwickeln und täglich zu verwalten. Einschließlich: Datenquelleninformationen; Definition von Objekten und Datenstrukturen im Data Warehouse; Datenbereinigung und Datenaktualisierung; Verlauf der Datensicherung; Aufzeichnungen, Verlauf der Informationsfreigabe usw.
Geschäftsmetadaten beschreiben die Daten im Data Warehouse aus kaufmännischer Sicht. Einschließlich: Beschreibung der Geschäftsthemen, enthaltenen Daten, Abfragen und Berichte;
Metadata stellt ein Informationsverzeichnis (Informationsverzeichnis) für den Zugriff auf das Data Warehouse bereit. Dieses Verzeichnis beschreibt umfassend, welche Daten sich im Data Warehouse befinden und wie die Daten abgerufen werden. und wie man auf diese Daten zugreift. Es ist das Zentrum für den Betrieb und die Wartung des Data Warehouse. Der Data Warehouse-Server verwendet es zum Speichern und Aktualisieren von Daten, und Benutzer verwenden es zum Verstehen und Zugreifen auf Daten.
Data Mart
Ein Teil der Daten, der für einen bestimmten Anwendungszweck oder Anwendungsbereich unabhängig vom Data Warehouse ist. Er kann auch als Abteilungsdaten oder Fachdaten (Fachgebiet) bezeichnet werden. Bei der Implementierung eines Data Warehouse können Sie häufig mit dem Data Mart einer Abteilung beginnen und dann mehrere Data Marts verwenden, um ein vollständiges Data Warehouse zu bilden. Zu beachten ist, dass bei der Implementierung verschiedener Data Marts Felddefinitionen mit derselben Bedeutung kompatibel sein müssen, damit es bei der zukünftigen Implementierung eines Data Warehouse nicht zu großen Problemen kommt.
Im bekannten ausländischen Garnter-Bericht zu Data-Mart-Produkten gehören zu den agilen Business-Intelligence-Produkten im ersten Quadranten QlikView, Tableau und SpotView, die allesamt Full-Memory-Computing-Data-Mart-Produkte sind wettbewerbsfähiger als herkömmliche Business-Intelligence-Produkte sind, stellen eine Herausforderung dar. Zu den bekannten agilen Business-Intelligence-Produkten gehören PowerBI, die Z-Suite von Yonghong Technology, SmartBI und die Business-Intelligence-Software von FineBI. Unter ihnen ist Z-Data Mart von Yonghong Technology ein Hot-Memory-Computing-Datenmarkt. Domestic Deon Information ist auch ein Systemintegrator von Data-Mart-Produkten.
Data-Warehouse-Verwaltung: Datenaktualisierungen verfolgen und Metadaten aktualisieren; Daten löschen, aufteilen und wiederherstellen; ; Speicherverwaltung.
Informationsveröffentlichungssystem
sendet Daten im Data Warehouse oder andere verwandte Daten an verschiedene Standorte oder Benutzer. Ein webbasiertes Informationsveröffentlichungssystem ist die effektivste Möglichkeit, mit dem Mehrbenutzerzugriff umzugehen.
Zugriffstools
bieten Benutzern die Möglichkeit, auf das Data Warehouse zuzugreifen. Es gibt Tools zur Datenabfrage und zur Berichterstellung; Tools zur Online-Analyse (OLAP);
Weitere Informationen zu diesem Thema finden Sie in der Spalte „FAQ“!
Das obige ist der detaillierte Inhalt vonWas sind die herausragenden Merkmale eines Data Warehouse im Vergleich zu einer operativen Datenbank?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!