ホームページ  >  記事  >  テクノロジー周辺機器  >  火山エンジンと大型モデルを使用してデータ フライホイールを「点火」します

火山エンジンと大型モデルを使用してデータ フライホイールを「点火」します

王林
王林転載
2023-09-20 21:21:031282ブラウズ
大きなモデルが何千もの業界を変革する過程で、Volcano Engine はデータ業界にパーソナライズされた答えを提供する上で先導者となりました。

#9月19日、上海で開催された「Data Flywheel V-Tech Data-Driven Technology Summit」において、Volcano Engineはデジタルインテリジェンスプラットフォームの大規模アプリケーションモデルを発表しました。 VeDI (大規模言語モデル) 機能。
火山エンジンと大型モデルを使用してデータ フライホイールを「点火」します
製品のアップグレード後は、自然言語を使用して「数値を検索」し、データ ウェアハウス モデルの開発を支援し、コードを最適化し、さらにビジュアルチャートの生成や会話中のアトリビューション分析などの機能を実装。 コーディングのスキルを持たない一般のオペレーターでも、すぐに数値を見つけて分析できます。現在、VeDI 関連のデータ製品がテストに招待されています。

#データ製品のアップグレードにより、データ利用の敷居が大幅に下がりました。 以前は、一般のオペレーターが番号を見つけたい場合、多くの場合、番号を取得するためのコードを作成する研究開発担当者に依頼する必要がありました。データの分析には、多くの専門知識を組み合わせる必要がありました。アップグレードされたデータ製品の助けを借りて、オペレーターはいつでも自然言語でニーズを入力し、必要なデータをリアルタイムで取得できるようになりました。

#これにより、データの価値がさらに高まります。企業内では、使用量のしきい値が低くなることで、データ消費チェーンのより多くの人がデータにアクセスして使用できるようになり、これまで実際のしきい値によって抑制されていたデータのニーズが満たされ、データに基づいたビジネス上の洞察が得られるようになります。よりタイムリーになり、意思決定もよりタイムリーになり、より科学的でデータに基づいたビジネスの想像力が解き放たれるようになります。

#デジタル化が進む企業では、データの価値がより高い頻度で流通し、データのフライホイールがさらに加速することになります。

#大規模なモデルは完全なデータ リンクに統合され、データ生成と使用のしきい値がさらに削減されます。

小規模モデルと比較して、大規模モデルには強力な一般化推論機能、外部ツール検索機能、およびコード生成機能があります。これらの機能はデータ製品に大きな影響を与えます。

一般化された推論能力が強化されるということは、より高い知性を意味しますが、同時に、数学や分析能力などのさまざまな能力を調整するための多くのツールと組み合わせる必要もあります。補足として。
大規模モデルの時代に開かれた自然言語対話モデルは、データ製品の使用に新たな想像力の余地をもたらしました。

今年 3 月から、Byte 社内では大規模なモデルとデータ製品を組み合わせ始めました。迅速な反復による小規模なテストでは、Luo Xuan チームがすぐにそれを実行しました。データ製品の主要なシナリオでは、大規模なモデルによってもたらされる改善と変更が明らかであることがわかりました。その後、チームはデータ製品シナリオの大規模な実験を開始し、シナリオの優先順位を常に定量化し、製品への大規模モデルの実装を推進しました。

ビッグ モデルがデータ業界を変革するプロセスにおいて、シナリオの選択は最も重要なステップの 1 つです。
. 適切な使用シナリオには、以下のことが必要です。現在のテクノロジーまたは予測可能なテクノロジーのみに基づいて、より多くのデータ消費価値をもたらし、データ生産をさらに推進しながら、大規模なモデルを追加した後にユーザーまたはビジネス関係者がより良いエクスペリエンスを得ることができるようにすることも必要です。

Luo Xuan 氏は、たとえば、一部のシナリオでは、大規模なモデルを使用した後、遅延の問題により、元のソリューションに 1 ~ 2 秒しかかからない場合があると共有しました。大規模なモデルでは、自然言語を使用すると 5 秒以上かかる可能性があり、その場合、このシナリオはビジネスの適時性エクスペリエンスの要件を満たすことができず、無効になります。

「しかし、たとえば、ショートコード生成プロセスでは、自然言語を追加すると、シーンの効率が大幅に向上します。将来的には、パフォーマンスが向上するにつれて、大規模モデルのデータは引き続き改善されており、リンク全体のあらゆる側面において、大規模モデルがもたらすインテリジェントな変化には、さらに期待する価値があります。」今回の「Data Flywheel・V-Tech Data Driven at "Technology Summit"」では、Volcano Engineが発表したデジタルインテリジェンスプラットフォームVeDIの製品アップグレードには主にDataLeapとDataWindが含まれます。その中で、DataLeap の「Number Assistant」は質疑応答形式で数値の検索をサポートし、「Development Assistant」は自然言語での SQL コードの生成と最適化をサポートし、DataWind - Analysis Assistant は自然言語での数値検索をサポートします。データ視覚化のクエリと分析を完了するための言語。
数値の検索、取得、分析のリンク全体をカバーし、データの生成と使用のプロセス全体の技術的な敷居を下げます。

DataLeap - 番号検索アシスタント

「番号の検索」は通常、データ消費チェーン全体の最初のステップは、データ消費を実現するための適切なデータ資産を見つけることです。しかし、従来のプロセスで「数字を見つける」ことは簡単な作業ではなく、ビジネスの専門知識の入力に大きく依存する必要があり、通常はキーワード検索、手作業によるスクリーニング、または専門のデータ開発者を探すことによってのみ確認できます。

火山エンジンと大型モデルを使用してデータ フライホイールを「点火」します

## DataLEAP を使用する - アシスタントの検索 "Find"

## " " 関数を、大規模言語モデル (LLM) は、「数値を見つける」という敷居を大幅に下げます。
「数値検索アシスタント」を使用すると、コーディングスキルのない人でも自然言語を通じて「擬人化」クエリを実行できます
たとえば、電子商取引オペレーターは、「Haowu Live Broadcast Room の運営状況」を直接尋ねることができます。過去 7 日間にどのテーブルを使用する必要がありますか?」 DataLeap - データ検索アシスタントは、ビジネス知識ベースに基づいてビジネス条件に関連するテーブルを推奨し、各テーブルに対応するデータ ディメンションを説明します。

現在、「数値アシスタント」は、Hive テーブル、データ セット、ダッシュボード、データ インジケーター、ディメンションなど、さまざまなデータ タイプに関する質疑応答を実装できます。および関連するビジネス知識 擬人化クエリを実現するための検索。

さらに、「数字検索」を簡単にするだけでなく、「数字検索アシスタント」と大規模モデルの機能を組み合わせることで、「数字検索」の精度をさらに向上させることができます。 「。」過去の従来の技術ソリューションでは、データ資産の取得は構造化データ管理に依存していました。非構造化ビジネス データには接続が欠落している可能性があります。検索にキーワードを使用すると、リンクの断片化の問題が発生する可能性があり、ビジネスに基づくデータの数が大幅に減少する可能性があります。効率的に見つけて消費します。また、検索ではキーワードに基づいて回答候補が提示されるため、手動での選別や確認が必要であり、直接的な回答ではないため、ユーザーにとって快適な体験が得られません。

ユーザーとの会話プロセスにおいて、大規模言語モデル (LLM) がユーザーの真の意図を理解できるようになり、検索プロセスがより集中的になり、人間の時間が節約されます。コスト、「数字を見つける」こと自体が高速化すると同時に、モデルの意味理解・解析能力が徐々に向上し、単純なキーワード検索よりも会話型検索の方がリンク全体での検索効率が高くなりました。

DataLeap - 開発アシスタント

データの生成および処理プロセスでは、「開発」 「アシスタント」 自然言語の使用をサポートし、SQL コードを自動的に生成できます。バグ修復、コードの最適化、既存のコードの説明と注釈を自動的に実装できます。また、ドキュメント検索、関数の使用法、コード例なども実現できます。対話による SQL の使用法クラス。

火山エンジンと大型モデルを使用してデータ フライホイールを「点火」します## SQL コードの自動開発

開発アシスタントの最下層では大きな言語が使用されます。モデル (LLM) は、大規模なコードとコーパスのトレーニング後、ユーザーの自然言語入力に従ってテーブル スキーマを含むメタデータ情報を自動的に関連付け、高品質のデータ処理コードを生成し、データを理解し、書き換え、質疑応答する機能を備えています。コード。
アウトアウトアウト ダウン アウト ' ' ' ' ' ' ' ' ダウン ' ダウン ' 一緒に' ウェイ' 一緒にウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイウェイ開発アシスタントは言語の壁を打ち破り、データ開発の敷居を大幅に下げます。 「本来、データを(処理)するには、SQL や Python などのプログラミング言語の知識が必要であり、比較的強いスキル要件となります。しかし、現在ではプログラミング言語は必要なく、自然言語を使用できるようになりました。つまり、これは、これを行う人々の要件がさらに軽減されたことを意味します。」

データ消費の需要があるアナリストやオペレーターにとって、SQL を理解していません。基本的な ETL も実行できます。
オペレーターは、DataLeap に都市別の注文販売数や時間帯別のライブ ブロードキャスト ルームのトラフィックなどのビジネス条件に対応するデータ要求コードを自動的に生成させることができます。オペレーターは、「このテーブルの実行中に最適化計画はありますか?」など、コードの意味について尋ねたり、「このコード文字列のチェックと修正を手伝ってください」と会話したりすることもできます。生成されたコードをワンクリックで解析し、S​​QL ツールを呼び出してテーブルを確認し、クリックして AI 自動修復を確認してデータ資産をさらに最適化することもできます。

さらに重要なのは、プロの開発者にとって、DataLeap-Development Assistant は、基本的な作業を実行したり、データ アナリストからのデータを処理したり、データに依存したりするのに役立ちます。業務担当者のニーズに応え、エンジニアは最後に生成されたコードを修正して正確性を確認するだけで済みます。 その結果、研究開発担当者はより創造的な作業に集中し、複雑なシナリオのニーズにさらに集中し、開発アシスタントを使用してコードを最適化し、研究開発の生産性とコードの品質を向上させることができます。

DataWind - Analysis Assistant

検索と取得の実装数値 その後、データ分析リンクが登場しました。大規模なモデル機能を組み合わせた DataWind - Analysis Assistant は、分析以外の立場にある人々が、データ視覚化クエリや自然言語対話による分析などの一連のビジネス探索を完了するのに役立ち、このリンクの敷居を下げます。

最初は「データセット」の作成です。データ資産では、オペレーターは DataWind のドラッグ アンド ドロップ方式を使用してデータ セットを作成し、自然言語を使用して、「有名人の生放送期間」のデータを直接チェックするなど、さまざまなフィールドのロジックを定義します。

##フィールドジェネレーション

火山エンジンと大型モデルを使用してデータ フライホイールを「点火」します

#チェック後、オペレーターは視覚的に分析して探索できます。従来のBIツールはドラッグ&ドロップによる操作方法が一般的であり、ダッシュボード制作の敷居は下がってきましたが、分析やインサイトの分野においては、依然としてデータをより深く理解するために多くの専門知識が必要となります。これが「しきい値」です。

##視覚探査

火山エンジンと大型モデルを使用してデータ フライホイールを「点火」します


# DataWind は、さまざまな機能に基づいて、基本的な仮定と検証を実施し、分析アイデアを提案することができました。 DataWindが提供するAI自動分析機能は、チャートをもとにさらなる原因の探索をサポートします。例えば、生成された「時間帯別ライブ配信室トラフィックグラフ」や「ライブ配信室売上上位エリア」などのビジュアルチャートをAIが自動分析し、オペレーターは分析結果を基に対話を通じてさらなるアトリビューションを行うだけで済みます。

同時に、DataWind は Feishu などのオフィス コラボレーション ツールとも接続し、IM メッセージの購読や自然な対話を通じて、より拡張的な分析を行うことができ、いつでも柔軟な分析を実現できます。データ セット、ビジュアル インサイト、メッセージ サブスクリプションなど、チェーン全体にわたってセルフサービス インテリジェンスを提供し、チャイナ ユニコムのオフィス統合により、データ分析を日常生活にシームレスに統合できます。

火山エンジンと大型モデルを使用してデータ フライホイールを「点火」します

# IMメッセージサブスクリプションと協力して拡張分析を実施する。言語の対話は結果を直接理解することができ、データ分析と思考サイクルは大幅に短縮されます。過去の分析と洞察を活用し、データ分析サイクルを短縮します。

この段階で、DataWind - Analysis Assistant のアプリケーション シナリオはすでに非常に充実しています。コア分析シナリオでの会話による探索を可能にすることに加えて、Anaization Assistant はその機能も拡張します。以前はより技術的なしきい値が必要だった数式生成などのシナリオで。

#大規模モデルはデータ フライホイールを加速し、企業のデータドリブン化を支援します

ByteDance には深いデータ駆動型の遺伝子があります。設立以来、ByteDance内のほぼすべてのシナリオがA/Bテストの対象となり、Douyinビデオ品質の最適化効果が良いか、レコメンデーションアルゴリズム戦略の最適化が適切かなど、ビジネス戦略を推進するためにデータフィードバックを通じて調整が行われています。正確であり、Toutiao の名前も A/B テスト済みです。

バイト内では、データ消費の範囲は非常に広いです。組織的には、経営トップから中間管理職、現場の従業員までが基本的にデータを閲覧し、会社の経営状況、収支、事業進捗、商品戦略などの評価に活用することができます。ライブ e コマースでのリアルタイム マーケティングなどの特定のシナリオでは、運用はリアルタイム データに基づいて対応するマーケティング戦略を設計し、推進します。

Byte は、データ消費を通じて科学的な意思決定と機敏な行動を実現し、ビジネス価値の向上をもたらします。また、頻繁なデータ消費とビジネス上のメリットを通じて、的を絞った低コストの構築も可能にします。ビジネス アプリケーションをより適切にサポートするための高品質のデータ資産。

今年 4 月、ByteDance の 10 年以上にわたるデータ駆動型の実践経験に基づいて、Volcano Engine はエンタープライズ デジタル インテリジェンス アップグレードのための新しいパラダイムである「データ フライホイール」をリリースしました。 「データ フライホイール」は、エンタープライズ データ フローがビジネス フローに完全に統合された後のデータ資産とビジネス アプリケーションの改善によるフライホイール効果を要約するために使用されます。

デジタル化の全体的な傾向の下、何千もの業界の企業ビジネスはデジタル化に近づき、企業にとってデータの重要性はますます高まっています。データは新たな生産要素として、企業のデジタル化とインテリジェント化をサポートしています。しかし、客観的に見ると、多くの企業はデジタル構築を進めてきたにもかかわらず、データの価値を十分に解放できていないのです。

「企業はデータ製品を高額で導入しているかもしれませんが、実際に社内で使用している人はほとんどいないかもしれません。データの流れが難しい場合は、 Luo Xuan 氏は、データ製品市場において、デジタル構築を進めている多くの企業が、高額なデータ構築および管理コスト、データ製品の使用に対する高い障壁、低いデータ資産価値などの問題を抱えていると観察しています。 。

#デジタル化プロセス全体の観点から見ると、「データドリブン」を実現することは難しいですが正しいです。 Byteを例に挙げると、Luo Xuan氏は現在、ByteDanceの従業員の80%がデータ製品を直接使用でき、管理可能で運用可能なデータ資産が日々の分析シナリオの80%をカバーしていることを明らかにした。 Byte の経験から判断すると、これは、企業内で良好な「データ フライホイール」を形成するには、企業内の内部データ製品の利用率と、シナリオ内で管理可能および運用可能なデータ資産の範囲をより高いレベルまで高める必要があることを意味します。会社。 。

#このプロセスでは、大規模なモデルによってサポートされるデータ製品が、企業の目標達成を支援する重要な原動力となる可能性があります。
大規模モデル機能を備えてアップグレードされたデジタル インテリジェンス プラットフォーム VeDI は、数値の検索、数値の取得、データ分析など、データの生成と消費のプロセス全体をさらに削減します。同じレベルの需要の下で、アップグレードされた VeDI を使用することで、社内でデータ製品を使用できる人の数がプロのデータ アナリストから、データを必要とするすべての人々 (運用、上司、プロダクト マネージャー、など、データ消費は包括的になります。

「閾値を下げてデータを活用してこそ、データが流通する中でどのような価値を生むのかが分かる。」デジタル化プロセスに参入したばかりの企業へ, つまり、データの価値は発見には程遠い宝物であり、敷居の低いデータプロダクトがそれを解く鍵となる可能性があります。

#大規模モデルのサポートにより、企業内の「データ フライホイール」の回転が加速します。
同社のビジネスはより強力なエンジンを備えており、ビジネス担当者は「数秒でデータ出力」からデータのフィードバックを迅速に取得できるため、ビジネスをより迅速に最適化できます。データフローが加速する過程で、より多くの高品質のデータ資産が継続的に提供されます。降水はビジネスにより多くの洞察をもたらし、最終的にはビジネス上の意思決定をより科学的かつ機敏に行うことができます。

以上が火山エンジンと大型モデルを使用してデータ フライホイールを「点火」しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事はjiqizhixin.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。