Zweck
Ich beschäftige mich seit zwei oder drei Jahren mit Datenvisualisierung und habe festgestellt, dass die meisten Menschen unter Datenvisualisierung das Zeichnen von Diagrammen verstehen. Daher möchte ich einige Artikel über das Design von Visualisierungsframeworks schreiben. Diese Artikel enthalten eine vollständige Reihe von Designideen und Implementierungsdetails des Visualisierungsframeworks. Ich hoffe, dass jeder die Visualisierung besser verstehen und die Visualisierung besser nutzen kann.
Was ist Datenvisualisierung?
Datenvisualisierung nutzt Daten- und Grafiktechnologie, um Informationen vom Datenraum in den visuellen Raum abzubilden. Es handelt sich um ein interdisziplinäres Fach, das die Bereiche Computergrafik, Datenwissenschaft, Naturwissenschaften und Mensch-Computer-Interaktion umfasst.
Das obige Domänenmodell ist zu komplex. Wir legen bei der Datenvisualisierung mehr Wert auf Daten und Grafiken und vereinfachen so das Domänenmodell der Datenvisualisierung:
- Daten: Konzentrieren Sie sich auf die Lösung von Datenerfassung, Bereinigung, Vorverarbeitung, Analyse und Mining.
- Grafik: Konzentrieren Sie sich auf den Empfang, die Extraktion von Informationen, die Verarbeitung und Transformation, die Mustererkennung, die Speicherung und die Anzeige optischer Bilder.
- Visualisierung: Konzentrieren Sie sich auf die Umwandlung von Daten in Grafiken und die Durchführung interaktiver Verarbeitung
Aktuelle Kenntnisse und Wissensbereiche, die ein Datenvisualisierungsmitarbeiter beherrschen muss:
Datenvisualisierungsphase
Aus Sicht der Datenvisualisierungstools auf dem Markt ist die Datenvisualisierung in die folgenden Phasen unterteilt:
- Datenstatistiken grafisch dargestellt
- Anzeige der Datenergebnisse
- Visualisierung des Datenanalyseprozesses
- Visualisierung der virtuellen Realität im VR/AR-Stadium
Datenstatistiken grafisch dargestellt
Zu diesem Zeitpunkt werden herkömmliche statistische Diagramme zur Darstellung von Daten verwendet. Die repräsentativen Werke sind Highcharts, Echarts und andere Diagrammbibliotheken. Die Vorteile dieser Frameworks sind:
- Das ausgereifteste Visualisierungstool. Die enthaltenen Diagramme sind gängige Diagramme, die für Benutzer leicht zu verstehen und für Entwickler leicht zu verwenden sind
- Geringe Entwicklungskosten, geringe Anforderungen an Grafiktechnologie und Datenkenntnisse
Die Nachteile liegen ebenso auf der Hand:
- Komplexe Konfigurationselemente, schlechte Skalierbarkeit und Leistung einzelner Diagramme
- Enger Anwendungsbereich, schlechte Unterstützung für Baum- und Netzwerkstrukturen; Anzeige von Datendimensionen und Datenvolumen sind begrenzt
Tool zur Anzeige von Datenergebnissen
Da das Datengeschäft immer höhere Anforderungen an die Visualisierung stellt, ist der Umfang der Visualisierung nicht mehr auf statistische Diagramme beschränkt. Das Unternehmen muss mehr Datendimensionen und vielfältigere grafische Anzeigedaten anzeigen. Dies erfordert, dass die Geschäftsseite Diagramme an ihre eigenen Bedürfnisse anpasst. Zu den Tools in dieser Phase gehören hauptsächlich Frameworks wie d3.js und Rapheal. Diese Frameworks bieten detailliertere Grafiktools und mehr Grafikalgorithmen :
- Leistungsstarke Funktionen, starke Interaktivität und großer Anwendungsbereich
- Integrieren Sie eine große Anzahl von Grafik- und Visualisierungsalgorithmen, um die Kosten komplexer Diagramme zu senken
- Starke Community und viele Beispiele
Es gibt auch einige häufige Probleme:
- Erfordert feinkörnige Betriebsgrafiken, hohe Lern- und Entwicklungskosten
- Viele personalisierte Anforderungen und schlechte Wiederverwendbarkeit
Visualisierungstools für die Datenanalyse
Die bisherigen Tools basieren alle auf A-priori-Modellen und wurden zur Erkennung bekannter Muster und Gesetze verwendet. Die automatische Verarbeitung komplexer, heterogener und umfangreicher Daten schlägt häufig fehl, sodass eine Visualisierung des Datenanalyseprozesses erforderlich ist Regeln besser erkunden und Probleme finden. Die besten Visualisierungstools für die Datenanalyse, die derzeit auf dem Markt sind, sind Tableau, ggplot2 in R-Sprache usw. Die Vorteile dieser Produkte:
- Hängt eng mit der Datenanalyse zusammen und integriert eine große Anzahl datenbezogener Algorithmen
- Kann die Zwischenverbindungen der Datenanalyse visuell anzeigen
Nachteile:
- Hochprofessionell, nicht für Anfänger geeignet
G2
Die Merkmale des aktuell unterstützten Unternehmens bestimmen den Inhalt unserer Datenvisualisierungsarbeit:
- Einfache statistische Diagramme machen immer noch einen großen Teil der Visualisierung aus, aber die Entwicklung wird durch die Unvollständigkeit verschiedener Diagrammbibliotheken, inkonsistente Dateneingabe und -ausgabe sowie eine umständliche Syntax behindert, was zu schlechter Erfahrung und geringer Entwicklungseffizienz führt.
- Immer mehr Unternehmen stellen immer mehr Anforderungen an die dimensionale Datenanzeige. Herkömmliche statistische Diagramme können diese Anforderungen nicht mehr erfüllen, und es gibt immer mehr Anforderungen an die visuelle Anpassung
- Das Geschäft mit der Online-Datenanalyse hat begonnen zu wachsen, und herkömmliche PC-Tools können die Nachfrage nicht decken
Wir haben vor 2 Jahren mit der Entwicklung von G2 begonnen. Die Positionierung von G2:
- Erfüllen Sie bestehende Anforderungen an statistische Diagramme, stellen Sie eine Reihe extrem einfacher Grafiksyntax bereit und vervollständigen Sie die Zuordnung von Daten vom Datenraum zum Grafikraum.
- Bietet erweiterte Syntax für verschiedene Grafiken, unterstützt heterogene und komplexe Datentypen und ist ein leistungsstarker Satz von Visualisierungstools
- Erkunden Sie die Anwendung der Datentechnologie in der Visualisierung und nutzen Sie die Online-Datenanalyse als Einstieg, um Visualisierungsmöglichkeiten für die Datenanalyse bereitzustellen
G2s Roadmap
G2 hat die Entwicklung von 1.0, 1.1 und 1.2 abgeschlossen. Die ersten paar Versionen haben den folgenden Inhalt fertiggestellt:
Gesamt-Roadmap:
- antV ist eine Reihe unserer Praxisspezifikationen zur Unterstützung des visuellen Geschäfts, die dazu dienen, Benutzern bei der Verwendung geeigneter Diagramme in geeigneten Szenarien zu helfen
- Die G-Zeichnungsbibliothek ist die unterste Zeichenebene für unsere Datenvisualisierung und muss in 3D, Animation und Interaktion erweitert werden
- G2 1.x wurde entwickelt und implementiert eine Reihe einfacher und benutzerfreundlicher grafischer Syntax, um den Anforderungen statistischer Diagramme gerecht zu werden.
- G2 2.x befindet sich in der Entwicklung. Wir hoffen, die Details des Grafikzeichnens mithilfe von Daten und Grafiken abzuschirmen, damit Benutzer ihre individuellen Visualisierungsanforderungen anpassen können. Die Grafiken, die D3 zeichnen kann, sollten in der Lage sein, eine einfache Syntax zu erreichen.
- Für die Funktionen von G2 3.x habe ich bisher nur einfache Regressions-, Anpassungs- und andere Datenalgorithmen ausprobiert. Später muss ich sie mit der Datenabteilung kombinieren, um eine Online-Version des Datenanalysetools zu erstellen.
Fazit
Mehrere Website-Adressen:
- g2: https://g2.alipay.com/
- antV: https://antv.alipay.com/
- Github: https://github.com/antvis
Wir werden in Zukunft eine Reihe von Artikeln zum visuellen Framework-Design veröffentlichen, in denen die allgemeinen Designideen von G2 und die Designdetails verschiedener grammatikalischer Elemente beschrieben werden. Jeder ist herzlich willkommen, an unserer Visualisierungsarbeit teilzunehmen.