Heim  >  Artikel  >  Backend-Entwicklung  >  Die Zukunft der KI-Datenvisualisierung

Die Zukunft der KI-Datenvisualisierung

Mary-Kate Olsen
Mary-Kate OlsenOriginal
2024-10-31 03:09:011002Durchsuche

The future of AI data visualization

Seit LLMs auf dem Markt sind, war einer der allerersten Anwendungsfälle/Demos die Datenanalyse. Zu diesem Zeitpunkt haben die meisten von uns ChatGPT, Claude oder eine andere KI verwendet, um ein Diagramm zu erstellen, aber es scheint, dass die Entscheidung über die Rolle, die KI bei der Datenvisualisierung spielen wird, noch unklar ist. Werden wir weiterhin standardmäßig Point-and-Click-Diagramme verwenden? Wird KI 100 % der Diagramme generieren? Oder ist die Zukunft ein Hybrid, der etwas KI-Generation und etwas Point-and-Click miteinander vermischt?

Als Gründer im Bereich KI und Datenvisualisierung finde ich dieses Thema fast existenziell. Nachdem wir nach 2022 gegründet wurden (d. h. nachdem LLMs tatsächlich auf den Markt kamen), müssen wir eine Entscheidung darüber treffen, wie wir mit der Diagrammerstellung umgehen wollen. Investieren wir Stunden um Stunden an Entwicklungsarbeit (und Geld), um Diagrammfunktionen zu entwickeln, oder verschwindet das und ist ein Kostensturz für alle Tools, die vor LLMs erstellt wurden? Oder ist die Zukunft ein Hybrid? Ich bin kürzlich auf Data Formulator gestoßen, ein Forschungsprojekt, das einige wirklich interessante Wechselwirkungen zwischen KI und traditioneller Diagrammerstellung untersucht, was diese Frage für mich wieder aufleben ließ.

In diesem Beitrag werde ich einen Blick darauf werfen, wo wir heute in Bezug auf Text-to-Chart (oder Text-to-Visualisierung) stehen und wohin wir in Zukunft gehen könnten.

Der aktuelle Stand der Text-zu-Visualisierung

Wie alles, was mit KI zu tun hat, wird dieser Beitrag wahrscheinlich nicht sehr gut altern. In den nächsten 6 Monaten werden einige neue Informationen oder Modelle veröffentlicht, die unsere Einstellung zu diesem Thema völlig verändern werden. Werfen wir dennoch einen Blick auf die verschiedenen Stadien der Datenvisualisierung und KI.

Reine Point-and-Click-Diagramme

Ich werde mich hier nicht allzu sehr aufhalten, da die meisten Leser es gut kennen. Öffnen Sie Excel, Google Sheets oder ein anderes Datentool, das vor 2023 erstellt wurde, und schon haben Sie eine Form davon. Manchmal klicken Sie, um Daten zu einer Achse hinzuzufügen, manchmal ziehen Sie ein Feld per Drag & Drop, aber das Konzept ist dasselbe: Sie strukturieren die Daten entsprechend und drücken dann ein paar Tasten, um ein Diagramm zu erstellen.

In diesem Paradigma erfolgt der Großteil der Datenbereinigung und -transformation vor der Diagrammerstellung. Sie können im Allgemeinen Aggregationsmetriken wie Durchschnitt, Median, Anzahl, Minimum, Maximum usw. anwenden, aber alle Transformationen sind ziemlich rudimentär.

100 % KI-generierte Diagramme

KI-generierte Diagramme oder Text-zu-Visualisierung gibt es erst seit dem Aufkommen moderner LLMs (wenn wir uns umsehen, gab es schon vorher Experimente, aber aus praktischen Gründen können wir uns auf die Zeit nach 2022 konzentrieren). LLMs).

ChatGPT von OpenAI kann nicht-interaktive Diagramme mit Python oder einen begrenzten Satz interaktiver Diagramme mithilfe von Front-End-Bibliotheken generieren (einige Beispiele finden Sie unter OpenAI Canvas). Wie alles, was mit OpenAI zu tun hat, hat Anthropic seine eigenen analogen Konzepte und Artefakte.

An dieser Stelle ist zu beachten, dass KI-generierte Diagramme in zwei Familien unterteilt werden können: rein pythonische/Back-End-generierte Diagramme oder eine Mischung aus Back-End und Front-End.

ChatGPT und Claude wechseln zwischen den beiden. Eine KI zu trainieren, um Front-End-Code zu generieren, und diesen Front-End-Code zu integrieren, um Visualisierungen zu erstellen, kann viel mehr Arbeit bedeuten, als sich nur auf Python zu verlassen und eine Bibliothek wie plotly, matplotlib, seaborn zu verwenden. Andererseits geben Frontend-Bibliotheken den Anbietern und Benutzern mehr Kontrolle über das Erscheinungsbild des Diagramms und die Interaktivität. Aus diesem Grund lassen LLM-Anbieter ihre KI grundlegende Diagramme wie Balkendiagramme, Liniendiagramme oder Streudiagramme generieren, aber alles Anspruchsvollere wie ein Sankey-Diagramm oder ein Wasserfalldiagramm greift auf Python zurück.

Eine kurze Seitenleiste zu Fabi.ai: Da wir eine Datenanalyseplattform sind, bieten wir natürlich Diagramme an, und trotz einiger Point-and-Click-Diagramme ist die überwiegende Mehrheit der von unseren Benutzern erstellten Diagramme KI-generiert. Bisher haben wir festgestellt, dass KI bemerkenswert gut darin ist, Diagramme zu erstellen, und durch die Nutzung von reinem Python für die Diagrammerstellung konnten wir die KI trainieren, nahezu jedes Diagramm zu erstellen, das sich der Benutzer ausdenken kann. Bisher haben wir diese Genauigkeit und Flexibilität der Point-and-Click-Funktionalität und benutzerdefinierten UI-Designs vorgezogen.
Hybrid: KI-Generierung in einem Point-and-Click-Paradigma
Hier beginnt die Debatte darüber, wohin die Entwicklung von KI-Text-zu-Visualisierung führt, interessant zu werden. Wenn jemand in drei Jahren eine Analyse durchführt und KI verwendet, überlässt er dann der KI die 100-prozentige Kontrolle oder wird die KI in einer gemischten Umgebung verwendet, in der sie die Diagramme nur innerhalb der Grenzen bearbeiten kann? bestimmte Point-and-Click-Funktionalität.

Um dieses Bild konkreter zu machen, schauen Sie sich Data Formulator an. Hierbei handelt es sich um ein aktuelles Forschungsprojekt, das versucht, eine echte gemischte Umgebung bereitzustellen, in der KI bestimmte Änderungen vornehmen kann, der Benutzer jedoch die Point-and-Click-Funktionalität übernehmen und nach Bedarf nutzen kann.

Wenn wir die Frage anhand einer Auto-Analogie stellen: Glauben Sie, dass Autos in Zukunft kein Lenkrad mehr haben werden, oder glauben Sie, dass es einen Fahrer geben wird, der da sitzen und aufpassen und gelegentlich mitnehmen muss? vorbei, ähnlich wie die autonome Fahrfunktion von Tesla derzeit funktioniert?

Erste Prinzipien: Was ich für wahr halte

Die Frage, wohin die Reise geht, ist uns bei Fabi.ai sehr wichtig, da sie bestimmte Entscheidungen, die wir treffen, stark beeinflussen könnte: Investieren wir in die Integration einer Diagrammbibliothek im Frontend? Beschäftigen wir uns überhaupt mit der Point-and-Click-Funktionalität? Als wachsendes, innovatives Unternehmen, das im Bereich der KI-Datenanalyse führend ist, müssen wir darüber nachdenken, wohin der Puck geht, und nicht darüber, wo er sich gerade befindet.

Um diese Frage zu beantworten, werde ich einige Überlegungen nach dem ersten Prinzip anwenden.

KI wird immer besser, schneller und billiger

Von dem ersten Mal an, als ich KI nutzte und es Beschwerden über die Geschwindigkeit und die Kosten gab, war ich davon überzeugt, dass KI immer besser, schneller und billiger werden würde. Grob gesagt sind die Kosten pro Token in den letzten Jahren um 87 % pro Jahr gesunken. Nicht nur die Kosten sind gesunken, sondern auch Genauigkeit und Geschwindigkeit sind drastisch gestiegen.

In den nächsten 10 Jahren werden wir auf die LLMs von 2024 genauso zurückblicken wie auf die „Supercomputer“ der 80er und 90er Jahre, jetzt, wo wir alle überall, wo wir hingehen, Supercomputer in der Tasche haben.

All dies bedeutet, dass ein Argument für oder gegen einen der verschiedenen oben genannten Diagrammansätze nicht darin bestehen kann, dass KI zu langsam, zu teuer oder ungenau ist, um Diagramme zu erstellen. Mit anderen Worten: Um zu glauben, dass es Point-and-Click-Diagramme in irgendeiner Form noch geben wird, muss man glauben, dass es etwas an der Benutzererfahrung oder dem Anwendungsfall gibt, das diese Funktionalität verdient.

Der schwierige Teil der Datenvisualisierung ist die Datenverarbeitung und -bereinigung

Meiner Erfahrung nach ist bei jeder Form der Datenanalyse, die Visualisierung beinhaltet, das Diagramm nicht der schwierige Teil. Der schwierige Teil besteht darin, die Daten zu bereinigen und im richtigen Format für das Diagramm bereitzustellen, das ich erstellen möchte.

Sagen wir einige Benutzerereignisdaten mit den folgenden Feldern:

  • Ereignis-ID
  • Ereignisstartzeitstempel
  • Zeitstempel für das Ende des Ereignisses

Angenommen, ich möchte die durchschnittliche Ereignisdauer pro Stunde grafisch darstellen, um die Latenz zu messen. Bevor ich Diagramme in einer Tabellenkalkulation oder einem älteren Diagrammtool erstellen kann, muss ich Folgendes tun:

  1. Berechnen Sie die Endzeit minus der Startzeit (ich muss wahrscheinlich zuerst eine Art Formatierung vornehmen)
  2. Pivotisieren Sie die Daten nach Stunden, was eigentlich überraschend schwierig ist

Aber wenn man die KI darum bittet, erledigt sie das alles und die Diagrammerstellung in nur ein oder zwei Sekunden:

# Calculate the event duration in hours
df['Event duration (hours)'] = (df['Event end datetime'] - df['Event start datetime']).dt.total_seconds() / 3600

# Extract the start hour from the start datetime
df['Start hour'] = df['Event start datetime'].dt.hour

# Group by start hour and calculate the average duration
average_duration_by_hour = df.groupby('Start hour')['Event duration (hours)'].mean().reset_index()

# Plot using Plotly
fig = px.bar(
    average_duration_by_hour, 
    x='Start hour', 
    y='Event duration (hours)',
    title='Average Event Duration by Hour',
    labels={'Event duration (hours)': 'Average Duration (hours)', 'Start hour': 'Hour of Day'},
    text='Event duration (hours)'
)

# Show the figure
fig.show()

Und dies war eines der einfachsten möglichen Beispiele. Meistens sind reale Daten viel komplizierter.

Die Zukunft der KI-Text-zu-Visualisierung: Point-and-Click mit 100 % KI-Generierung

An diesem Punkt haben Sie wahrscheinlich eine Vorstellung davon, wohin ich tendiere. Solange Sie Ihren Datensatz mit allen für eine Analyse benötigten Daten annähernd richtig zusammenstellen können, leistet KI bereits bemerkenswert gute Arbeit darin, ihn zu manipulieren und im Handumdrehen grafisch darzustellen. In ein, zwei oder drei Jahren kann man sich kaum vorstellen, dass dies nicht der Standard sein wird.

Dennoch gibt es einige interessante Hybridansätze wie den Data Formulator. Der Grund für einen solchen Ansatz liegt darin, dass sich unsere Hände und unser Gehirn vielleicht schneller bewegen können, um schnell Anpassungen vorzunehmen, als wir brauchen, um darüber nachzudenken, was wir wollen, und es ausreichend klar zu erklären, damit die KI ihre Aufgabe erfüllen kann. Wenn ich frage „Zeige mir den Gesamtumsatz pro Monat in den letzten 12 Monaten“ und gehe davon aus, dass es sich um ein nach Regionen aufgeschlüsseltes gestapeltes Balkendiagramm handeln sollte, fällt es uns möglicherweise leichter, einfach die Maus zu bewegen. Wenn das der Fall ist, könnte der hybride Ansatz der interessanteste sein: Bitten Sie die KI, einen ersten Versuch zu unternehmen, dann ein paar Klicks und Sie haben, was Sie wollen.

Der Schlüssel zum Erfolg eines vollständigen KI-Ansatzes oder eines Hybridansatzes liegt in der Benutzererfahrung. Gerade für den hybriden Ansatz müssen die KI und die menschlichen Interaktionen perfekt Hand in Hand zusammenarbeiten und für den Nutzer unglaublich intuitiv sein.

Ich bin gespannt, wie sich der Raum entwickelt und wohin wir uns in den nächsten 12 Monaten mit der Text-zu-Visualisierung entwickeln.

Das obige ist der detaillierte Inhalt vonDie Zukunft der KI-Datenvisualisierung. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn