AI データ視覚化の未来-Python チュートリアル-php.cn

ホームページ

バックエンド開発

Python チュートリアル

AI データ視覚化の未来

Mary-Kate Olsen

Oct 31, 2024 am 03:09 AM

The future of AI data visualization

LLM が登場して以来、最初のユースケース/デモの 1 つはデータ分析でした。現段階では、私たちのほとんどは ChatGPT、Claude、またはその他の AI を使用してチャートを生成していますが、データ視覚化において AI が果たす役割についてはまだ結論が出ていないように感じます。今後もデフォルトでポイントアンドクリックグラフを作成し続けるのでしょうか? AIはチャートを100％生成するのでしょうか？それとも、将来のハイブリッドでは、AI 生成とポイントアンドクリックが混在するのでしょうか?

AI およびデータ視覚化分野の創設者として、私はこのトピックがほぼ不可欠であると考えています。 2022 年以降 (つまり、LLM が本格的に登場した後) に設立された私たちは、チャートをどのように扱うかについて決定を下す必要があります。チャート機能を開発するために何時間も開発作業 (および資金) を投資するのでしょうか、それともそれはなくなり、LLM より前に構築されたすべてのツールの埋没コストとなるのでしょうか?それとも未来はハイブリッドになるのでしょうか？私は最近、Data Formulator という研究プロジェクトに出会いました。このプロジェクトでは、AI と従来のグラフ作成の間の非常に興味深い相互作用を調査しており、この疑問が私に甦りました。

この投稿では、テキストからグラフへ (またはテキストから視覚化) の現在の状況と、将来どこへ向かうのかを見ていきます。

テキストから視覚化の現状

AI に関するすべてのことと同様、この投稿もあまり古くならないでしょう。今後 6 か月以内に何らかの新しい情報やモデルが発表され、このトピックに対する私たちの考え方が完全に変わるでしょう。それにもかかわらず、データ視覚化と AI のさまざまな状態を見てみましょう。

純粋なポイントアンドクリックのグラフ作成

ほとんどの読者はこの内容をよく知っているので、これについてはあまり長く言いません。 Excel、Google スプレッドシート、または 2023 年より前に構築されたその他のデータツールを開くと、これの何らかの形式が得られます。クリックして軸にデータを追加する場合もあれば、フィールドをドラッグアンドドロップする場合もありますが、概念は同じです。データを適切に構造化し、いくつかのボタンを押してグラフを生成します。

このパラダイムでは、データのクリーニングと変換の大部分はグラフ作成の前に行われます。一般に、平均、中央値、カウント、最小、最大などの集計指標を適用できますが、すべての変換はかなり初歩的なものです。

100% AI で生成されたグラフ

AI が生成したチャート、つまりテキストから視覚化が実際に存在したのは、現代の LLM の出現以来です (調べてみると、それ以前にも実験が行われていましたが、実際的な目的としては、2022 年以降に焦点を当てることができます) LLM）。

OpenAI の ChatGPT は、Python を使用して非インタラクティブなチャートを生成したり、フロントエンドライブラリを使用して限定されたインタラクティブチャートを生成したりできます (いくつかの例については、「OpenAI Canvas」を参照)。 OpenAI のすべてと同様、Anthropic にも独自の類似概念があり、アーティファクトがあります。

ここで、AI によって生成されたチャートは、純粋に Python で生成されたチャート/バックエンドで生成されたチャート、またはバックエンドとフロントエンドの混合の 2 つのファミリーに細分できることに注目してください。

ChatGPT と Claude が交互に働きます。 AI をトレーニングしてフロントエンドコードを生成し、そのフロントエンドコードを統合してビジュアライゼーションを作成することは、plotly、matplotlib、seaborn などのライブラリを使用して Python に依存するよりもはるかに手間がかかる可能性があります。一方、フロントエンドライブラリを使用すると、プロバイダーとユーザーはグラフの外観と操作性をより詳細に制御できます。これが、LLM プロバイダーが AI に棒グラフ、折れ線グラフ、散布図などの基本的なグラフを生成させる理由ですが、サンキーダイアグラムやウォーターフォールグラフなどのより高度なグラフは Python に頼ることになります。

Fabi.ai についての簡単なサイドバー: 当社はデータ分析プラットフォームであるため、明らかにグラフ作成を提供しており、一部のポイントアンドクリックによるグラフ作成にもかかわらず、ユーザーが作成したグラフの大部分は AI によって生成されています。これまでのところ、AI はグラフの生成に非常に優れていることがわかっており、グラフ作成に純粋な Python を活用することで、ユーザーが思い描くほぼすべてのグラフを生成するように AI をトレーニングすることができました。これまでのところ、ポイントアンドクリック機能やカスタム UI デザインよりも、その精度と柔軟性を選択してきました。
ハイブリッド: ポイントアンドクリックパラダイムでの AI 生成
ここから、AI によるテキストから視覚化への移行がどこへ向かうのかという議論が興味深くなり始めます。今から 3 年後、誰かが分析を行うときに、AI を使用する場合、AI に 100% の制御を任せるか、それとも AI が制限内でのみチャートを編集できる混合環境で使用されるでしょうか。特定のポイントアンドクリック機能。

このイメージをより具体的にするには、Data Formulator を確認してください。これは、AI が特定の編集を行うことができるが、必要に応じてユーザーがポイントアンドクリック機能を引き継いで使用できる、真の混合環境を提供しようとする最近の研究プロジェクトです。

車に例えて質問すると: 将来の車にはハンドルがなくなると思いますか、それともドライバーがそこに座って注意を払い、時にはハンドルを握る必要があると思いますか?テスラの自動運転機能が現在どのように動作するかに似ていますか?

第一原則: 私が真実だと信じていること

物事がどこに向かっているのかという問題は、Fabi.ai にとって非常に重要です。これは、私たちが下す特定の決定に大きな影響を与える可能性があるためです。フロントエンドにチャートライブラリを統合することに投資するか?そもそもポイントアンドクリック機能を気にする必要があるでしょうか? AI データ分析分野をリードする革新的な成長企業として、私たちはパックが現在どこにいるかではなく、どこへ行くのかを考える必要があります。

したがって、この質問に答えるために、第一原理の考え方を使用してみます。

AI はますます改良、高速化、低コスト化を続けています

初めて AI を使用し、速度とコストに関して不満が生じたときから、私は AI が今後も改良され、より速く、より安価になると信じてきました。大まかに言えば、トークンあたりのコストは過去数年間で年間 87% 減少しました。コストが下がっただけでなく、精度と速度も大幅に向上しました。

今後 10 年で、私たちは 80 年代と 90 年代の「スーパーコンピューター」を振り返るのと同じように、2024 年の LLM を振り返ることになるでしょう。今では、どこに行くにもポケットにスーパーコンピューターが入っています。

以上のことは、上記のさまざまなグラフ作成アプローチのいずれかに賛成または反対する議論は、AI がグラフを生成するには遅すぎる、高価すぎる、または不正確すぎるということではあり得ません。言い換えれば、ポイントアンドクリックグラフが何らかの形でまだ存在すると信じるには、ユーザーエクスペリエンスやユースケースに、その機能に値する何かがあると信じる必要があります。

データ視覚化の難しい部分は、データのラングリングとクリーニングです。

私の経験では、視覚化を伴うあらゆる形式のデータ分析を行う場合、難しい部分はグラフ作成ではありません。難しいのは、データをクリーンアップして、作成しようとしているグラフに適した形式に準備することです。

次のフィールドを持つユーザーイベントデータがあるとします:

イベントID
イベント開始タイムスタンプ
イベント終了タイムスタンプ

ここで、レイテンシを測定するために平均イベント継続時間を時間ごとにプロットしたいとします。スプレッドシートや従来のグラフ作成ツールで何らかのグラフ作成を行う前に、次のことを行う必要があります。

終了時刻から開始時刻を引いた値を計算します (おそらく最初に何らかの書式設定を行う必要があります)
時間単位でデータをピボットします。これは実際には驚くほど難しいです

しかし、AI にこれを実行するように依頼すると、それらすべてとグラフ作成がわずか 1 ～ 2 秒で行われます。

# Calculate the event duration in hours
df['Event duration (hours)'] = (df['Event end datetime'] - df['Event start datetime']).dt.total_seconds() / 3600

# Extract the start hour from the start datetime
df['Start hour'] = df['Event start datetime'].dt.hour

# Group by start hour and calculate the average duration
average_duration_by_hour = df.groupby('Start hour')['Event duration (hours)'].mean().reset_index()

# Plot using Plotly
fig = px.bar(
    average_duration_by_hour, 
    x='Start hour', 
    y='Event duration (hours)',
    title='Average Event Duration by Hour',
    labels={'Event duration (hours)': 'Average Duration (hours)', 'Start hour': 'Hour of Day'},
    text='Event duration (hours)'
)

# Show the figure
fig.show()

これは最も単純な例の 1 つです。多くの場合、現実世界のデータはさらに複雑です。

AI によるテキストから視覚化の未来: 100% AI 生成によるポイントアンドクリック

この時点で、あなたはおそらく私がどちらに傾いているかを感じているでしょう。分析に必要なすべてのデータを備えたデータセットをほぼ適切に作成できる限り、AI はすでに、瞬く間にデータセットを操作してグラフ化するという点で非常に優れた仕事をしています。今から 1 年、2 年、3 年後にこれが標準でなくなるとは想像しにくいです。

そうは言っても、Data Formulator のような興味深いハイブリッドアプローチがいくつか登場しています。このタイプのアプローチの場合は、おそらく、私たちが何を望んでいるのかを考え、AI がその仕事を遂行できるように十分に明確に説明するよりも、私たちの手や脳の方が速く動いて、素早く調整を行うことができるということです。これが地域ごとに分かれた積み上げ棒グラフであることを前提として、「過去 12 か月の月ごとの総売上高を表示してください」と尋ねると、マウスを動かすだけの方が簡単になる可能性があります。その場合は、ハイブリッドアプローチが最も興味深いかもしれません。AI に最初の処理を依頼し、その後数回クリックするだけで、必要なものが得られます。

完全な AI アプローチでもハイブリッドアプローチでも、成功の鍵はユーザーエクスペリエンスにあります。特にハイブリッドアプローチの場合、AI と人間のインタラクションは完全に連携して機能し、ユーザーにとって非常に直感的である必要があります。

今後 12 か月でこの分野が発展し、テキストからビジュアル化がどのような方向に向かうのかを見るのが楽しみです。

以上がAI データ視覚化の未来の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

Pythonの融合リスト：適切な方法を選択しますMay 14, 2025 am 12:11 AM

Tomergelistsinpython、あなたはオペレーター、extendmethod、listcomfulting、olitertools.chain、それぞれの特異的advantages：1）operatorissimplebutlessforlargelist;

Python 3の2つのリストを連結する方法は？May 14, 2025 am 12:09 AM

Python 3では、2つのリストをさまざまな方法で接続できます。1）小さなリストに適したオペレーターを使用しますが、大きなリストには非効率的です。 2）メモリ効率が高い大規模なリストに適した拡張方法を使用しますが、元のリストは変更されます。 3）元のリストを変更せずに、複数のリストをマージするのに適した *オペレーターを使用します。 4）Itertools.chainを使用します。これは、メモリ効率が高い大きなデータセットに適しています。

Python Concatenateリスト文字列May 14, 2025 am 12:08 AM

Join（）メソッドを使用することは、Pythonのリストから文字列を接続する最も効率的な方法です。 1）join（）メソッドを使用して、効率的で読みやすくなります。 2）サイクルは、大きなリストに演算子を非効率的に使用します。 3）リスト理解とJoin（）の組み合わせは、変換が必要なシナリオに適しています。 4）redoce（）メソッドは、他のタイプの削減に適していますが、文字列の連結には非効率的です。完全な文は終了します。

Pythonの実行、それは何ですか？May 14, 2025 am 12:06 AM

pythonexexecutionistheprocessoftransforningpythoncodeintoexecutabletructions.1）interpreterreadSthecode、変換intobytecode、thepythonvirtualmachine（pvm）executes.2）theglobalinterpreeterlock（gil）管理委員会、

Python：重要な機能は何ですかMay 14, 2025 am 12:02 AM

Pythonの主な機能には次のものがあります。1。構文は簡潔で理解しやすく、初心者に適しています。 2。動的タイプシステム、開発速度の向上。 3。複数のタスクをサポートするリッチ標準ライブラリ。 4.強力なコミュニティとエコシステム、広範なサポートを提供する。 5。スクリプトと迅速なプロトタイピングに適した解釈。 6.さまざまなプログラミングスタイルに適したマルチパラダイムサポート。

Python：コンパイラまたはインタープリター？May 13, 2025 am 12:10 AM

Pythonは解釈された言語ですが、コンパイルプロセスも含まれています。 1）Pythonコードは最初にBytecodeにコンパイルされます。 2）ByteCodeは、Python Virtual Machineによって解釈および実行されます。 3）このハイブリッドメカニズムにより、Pythonは柔軟で効率的になりますが、完全にコンパイルされた言語ほど高速ではありません。

ループvs whileループ用のpython：いつ使用するか？May 13, 2025 am 12:07 AM

useaforloopwhenteratingoverasequenceor foraspificnumberoftimes; useawhileloopwhentinuninguntinuntilaConditionismet.forloopsareidealforknownownownownownownoptinuptinuptinuptinuptinutionsituations whileoopsuitsituations withinterminedationations。

Pythonループ：最も一般的なエラーMay 13, 2025 am 12:07 AM

pythonloopscanleadtoErrorslikeinfiniteloops、ModifiningListsDuringiteration、Off-Oneerrors、Zero-dexingissues、およびNestededLoopinefficiencies.toavoidhese：1）use'i

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

AtomエディタMac版ダウンロード

最も人気のあるオープンソースエディター

SublimeText3 英語版

推奨: Win バージョン、コードプロンプトをサポート!

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

mPDF

mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。