一文でデータ分析を完了する浙江大学の新しい大型モデルデータアシスタントにより、収集の必要がなくなりました-AI-php.cn

ホームページ

テクノロジー周辺機器

一文でデータ分析を完了する浙江大学の新しい大型モデルデータアシスタントにより、収集の必要がなくなりました

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jul 13, 2023 pm 10:01 PM

データモデル

データを処理するには、この AI ツールを使用するだけです。

その背後にある大規模言語モデル (LLM) を利用することで、必要な作業は 必要なデータ を 1 文で記述するだけで、残りはそのままにします。

処理、分析、さらには可視化もすべて簡単に行うことができます。自分で収集する必要さえありません。

一文でデータ分析を完了する浙江大学の新しい大型モデルデータアシスタントにより、収集の必要がなくなりました写真

この LLM ベースの AI データアシスタントは Data-Copilot と呼ばれ、浙江大学のチームによって開発されました。

関連論文のプレプリントが公開されました。

次のコンテンツは寄稿者によって提供されています

金融、気象、エネルギー、その他の業界では、毎日大量の異種データが生成されています。このデータを効果的に管理、処理、表示するツールが緊急に必要とされています。

DataCopilot は、ユーザーの多様なクエリ、計算、予測、視覚化、その他のニーズを満たす大規模な言語モデルを展開することで、大量のデータを自律的に管理および処理します。

テキストを入力するだけで、見たいデータを DataCopilot に伝えることができ、面倒な操作は必要ありません。

独自のコードを記述する必要はありません。 DataCopilot は、元のデータを自律的に視覚化結果に変換します。それはユーザーの意図に最もよく応えるものです。

さまざまな形のデータ関連タスクをカバーする普遍的なフレームワークを実現するために、研究チームは Data-Copilot を提案しました。

このモデルは、LLM を使用するだけで発生するデータ漏洩のリスク、不十分なコンピューティング能力、複雑なタスクを処理できない問題を解決します。

一文でデータ分析を完了する浙江大学の新しい大型モデルデータアシスタントにより、収集の必要がなくなりました図

複雑なリクエストを受け取ると、Data-Copilot は

独立したインターフェイスを独自に設計およびスケジュールし、作業プロセスを構築します。ユーザーの意図を満たすために。人間の支援なしで

、さまざまなソースおよびさまざまな形式の生データを、グラフィック、表、テキストなどの人間化された出力に巧みに変換できます。

写真

一文でデータ分析を完了する浙江大学の新しい大型モデルデータアシスタントにより、収集の必要がなくなりました Data-Copilot プロジェクトの主な貢献は次のとおりです。

データソースの接続とさまざまな分野での多様化ユーザーのニーズを満たし、面倒な労力と専門知識を削減します。

これには、
designer
scheduler という二重の ID があり、インターフェイスツール設計プロセス (デザイナー) とスケジューリングプロセス (スケジューラー) の 2 つのプロセスが含まれます。 Data-Copilot デモは、中国の金融市場データに基づいて構築されました。
次の例を使用して、Data-Copilot のパフォーマンスを確認してみましょう。

上海総合 50 指数のすべてのコンポーネント今年の第 1 四半期の株式の純利益の前年比成長率はどのくらいですか?

Data-Copilot はこのようなワークフローを独自に設計しました:

画像

一文でデータ分析を完了する浙江大学の新しい大型モデルデータアシスタントにより、収集の必要がなくなりましたこれを目的とした複雑な問題の場合、Data-Copilot は、loop_rank インターフェイスを使用して複数のループクエリを実装します。 Data-Copilot は、このワークフローを実行した後、次の結果を得ました:

横軸は各構成銘柄の名前、縦軸は各構成銘柄の純利益の前年比成長率です。第 1 四半期

写真

一文でデータ分析を完了する浙江大学の新しい大型モデルデータアシスタントにより、収集の必要がなくなりました一般的なデータ処理プロセスに加えて、Data-Copilot はさまざまなワークフローも生成できます。研究チームは、予測と並列の 2 つのワークフローモードで Data-Copilot をテストしました。

予測ワークフロー

既知のデータ以外の部分について、Data-Copilot は、たとえば次の質問を入力して予測することもできます。

次の 4 四半期の中国の四半期 GDP を予測する

Data-Copilot は次のようなワークフローを展開します:

過去の GDP データを取得→線形回帰モデルを使用して将来を予測→テーブルを出力

#Picture

実行後の結果は次のとおりです: 一文でデータ分析を完了する浙江大学の新しい大型モデルデータアシスタントにより、収集の必要がなくなりました

一文でデータ分析を完了する浙江大学の新しい大型モデルデータアシスタントにより、収集の必要がなくなりました写真

パラレルワークフロー

CATL と Kweichow Moutai の過去 3 年間の株価収益率を確認したいです

対応ワークフローは次のとおりです。

株価データの取得→関連指数の計算→チャートの生成

一文でデータ分析を完了する浙江大学の新しい大型モデルデータアシスタントにより、収集の必要がなくなりました画像

関連作業2 つの株式は同時に存在します。並行して、最終的に次のチャートが取得されます。

一文でデータ分析を完了する浙江大学の新しい大型モデルデータアシスタントにより、収集の必要がなくなりました Picture

Main Method

Data- Copilot は一般的な大規模言語モデルです。システムには、インターフェイス設計とインターフェイススケジューリングという 2 つの主要な段階があります。

インターフェイス設計: 研究チームは、LLM が少数のシードリクエストから十分なリクエストを自律的に生成できるようにする自己リクエストプロセスを設計しました。次に、LLM は、生成されたリクエストに基づいてインターフェイスを繰り返し設計および最適化します。これらのインターフェイスは自然言語を使用して記述されているため、異なるプラットフォーム間での拡張や転送が容易になります。
インターフェイスのスケジューリング: ユーザーのリクエストを受け取った後、LLM は、独自に設計したインターフェイスの説明とコンテキスト内のデモンストレーションに基づいてインターフェイスツールを計画および呼び出し、ユーザーのニーズを満たすワークフローを展開し、結果を複数の形式でユーザーに提示します。

Data-Copilot は、リクエストを自動的に生成し、ユーザーのニーズを満たして結果を複数の形式でユーザーに表示するインターフェースを独立して設計することにより、高度に自動化されたデータ処理と視覚化を実現します。

一文でデータ分析を完了する浙江大学の新しい大型モデルデータアシスタントにより、収集の必要がなくなりました図

インターフェース設計

上図に示すように、まずデータ管理を実装する必要があり、最初のステップではインターフェースが必要です。ツール。

Data-Copilot は、データ管理ツールとして多数のインターフェイスを設計します。インターフェイスは、データの取得、処理、および処理を担当する自然言語 (機能記述) とコード (実装) で構成されるモジュールです。他のタスク。

まず、LLM は、さまざまなアプリケーションシナリオを可能な限りカバーするために、少数のシードリクエストを使用し、多数のリクエスト (セルフリクエストによるデータ探索) を独立して生成します。
次に、LLM はこれらのリクエストに対応するインターフェイス (インターフェイス定義: 説明とパラメーターのみを含む) を設計し、反復ごとにインターフェイス設計を徐々に最適化します (インターフェイスのマージ)。
最後に、研究者らは LLM の強力なコード生成機能を使用して、インターフェイスライブラリ内の各インターフェイスに特定のコード (インターフェイス実装) を生成しました。このプロセスにより、インターフェイスの設計が特定の実装から分離され、ほとんどの要求を満たすことができる多用途のインターフェイスツールのセットが作成されます。

以下に示すように: Data-Copilot の独自設計インターフェースツールはデータ処理に使用されます

一文でデータ分析を完了する浙江大学の新しい大型モデルデータアシスタントにより、収集の必要がなくなりました写真

インターフェーススケジューリング

前の段階で、研究者はデータの取得、処理、視覚化のためのさまざまな共通インターフェイスツールを入手しました。各インターフェイスには、明確かつ明示的な機能説明があります。上の図の 2 つのクエリに示されているように、Data-Copilot は、リアルタイムリクエストでのさまざまなインターフェイスの計画と呼び出しを通じて、データから複数の形式の結果までのワークフローを形成します。

Data-Copilot は、まず意図分析を実行して、ユーザーのリクエストを正確に理解します。
ユーザーの意図が正確に理解されると、Data-Copilot はユーザーのリクエストを処理するための合理的なワークフローを計画します。 Data-Copilot は、スケジュールの各ステップを表す固定形式の JSON (step={"arg":"", "function":"", "output":"","description":""} など) を生成します。。

Data-Copilot は、インターフェイスの説明と例に基づいて、各ステップ内のインターフェイスのスケジュールを順次または並行して調整します。

Data-Copilot は、LLM をデータ関連タスクのあらゆる段階に統合し、ユーザーのリクエストに基づいて生データをユーザーフレンドリーな視覚化に自動的に変換することで、退屈な労働と専門知識への依存を大幅に削減します。

GitHub プロジェクトページ: https://github.com/zwq2018/Data-Copilot

論文アドレス: https://arxiv.org/abs /2306.07209

HuggingFace デモ:https://huggingface.co/spaces/zwq2018/Data-Copilot

以上が一文でデータ分析を完了する浙江大学の新しい大型モデルデータアシスタントにより、収集の必要がなくなりましたの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

エージェントラグシステムはどのようにテクノロジーを変換しますか？Apr 12, 2025 am 09:21 AM

導入人工知能は新しい時代に入りました。モデルが事前定義されたルールに基づいて単に情報を出力する時代は終わりました。今日のAIの最先端のアプローチは、Ragを中心に展開しています（検索装備

自動生成クエリのSQLアシスタントApr 12, 2025 am 09:13 AM

複雑なSQLクエリを書いたり、スプレッドシートを並べ替えたりせずに、データベースと話をしたり、単純な言語で質問したり、即座に答えを得たりすることを望んだことがありますか？ LangchainのSQL Toolkit、Groq a

AIインデックス2025を読む：AIはあなたの友人、敵、または副操縦士ですか？Apr 11, 2025 pm 12:13 PM

スタンフォード大学ヒト指向の人工知能研究所によってリリースされた2025年の人工知能インデックスレポートは、進行中の人工知能革命の良い概要を提供します。 4つの単純な概念で解釈しましょう：認知（何が起こっているのかを理解する）、感謝（利益を見る）、受け入れ（顔の課題）、責任（責任を見つける）。認知：人工知能はどこにでもあり、急速に発展しています私たちは、人工知能がどれほど速く発展し、広がっているかを強く認識する必要があります。人工知能システムは絶えず改善されており、数学と複雑な思考テストで優れた結果を達成しており、わずか1年前にこれらのテストで惨めに失敗しました。 2023年以来、複雑なコーディングの問題や大学院レベルの科学的問題を解決することを想像してみてください

Meta Llama 3.2を始めましょう - 分析VidhyaApr 11, 2025 pm 12:04 PM

メタのラマ3.2：マルチモーダルとモバイルAIの前進メタは最近、ラマ3.2を発表しました。これは、モバイルデバイス向けに最適化された強力なビジョン機能と軽量テキストモデルを特徴とするAIの大幅な進歩です。成功に基づいてo

AVバイト：Meta＆＃039; s llama 3.2、GoogleのGemini 1.5などApr 11, 2025 pm 12:01 PM

今週のAIの風景：進歩、倫理的考慮、規制の議論の旋風。 Openai、Google、Meta、Microsoftのような主要なプレーヤーは、画期的な新しいモデルからLEの重要な変化まで、アップデートの急流を解き放ちました

マシンと話すための人的費用：チャットボットは本当に気にすることができますか？Apr 11, 2025 pm 12:00 PM

つながりの慰めの幻想：私たちはAIとの関係において本当に繁栄していますか？この質問は、MIT Media Labの「AI（AHA）で人間を進める」シンポジウムの楽観的なトーンに挑戦しました。イベントではCondedgを紹介している間

PythonのScipy Libraryの理解Apr 11, 2025 am 11:57 AM

導入あなたが科学者またはエンジニアで複雑な問題に取り組んでいると想像してください - 微分方程式、最適化の課題、またはフーリエ分析。 Pythonの使いやすさとグラフィックスの機能は魅力的ですが、これらのタスクは強力なツールを必要とします

ラマ3.2を実行する3つの方法-Analytics VidhyaApr 11, 2025 am 11:56 AM

メタのラマ3.2：マルチモーダルAIパワーハウス Metaの最新のマルチモーダルモデルであるLlama 3.2は、AIの大幅な進歩を表しており、言語理解の向上、精度の向上、および優れたテキスト生成機能を誇っています。その能力t

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

AtomエディタMac版ダウンロード

最も人気のあるオープンソースエディター

MantisBT

Mantis は、製品の欠陥追跡を支援するために設計された、導入が簡単な Web ベースの欠陥追跡ツールです。 PHP、MySQL、Web サーバーが必要です。デモおよびホスティングサービスをチェックしてください。

ZendStudio 13.5.1 Mac

強力な PHP 統合開発環境

EditPlus 中国語クラック版

サイズが小さく、構文の強調表示、コードプロンプト機能はサポートされていません

SecLists

SecLists は、セキュリティテスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティテスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティテストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジングペイロード、機密データパターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテストマシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。