検索
ホームページテクノロジー周辺機器AI大規模なモデル開発ツールセットが作成されました。

大規模なモデル開発ツールセットが作成されました。

Sep 17, 2023 pm 02:21 PM
フレーム大型モデル開発スタック

書き直す必要がある内容は次のとおりです: 著者 Richard MacManus

計画 | Yan Zheng

Web3 は Web2 を破壊することはできませんでしたが、新興の大規模モデル開発スタックにより、開発者は次のことを可能にしています。 「クラウド」からスタート 「ネイティブ」の時代は、新たなAI技術スタックに向かって進んでいます。

ヒント エンジニアは、大規模なモデルに急ぐ開発者の神経には触れられないかもしれませんが、プロダクト マネージャーまたはリーダーからの一文: 「エージェント」は開発できるか、「チェーン」は実装できるか、 「どのベクトル データベースを使用するか?」という問題がありましたが、主要な主流の大規模モデル アプリケーション企業の運転技術学生にとって、生成 AI の開発を克服することは困難になっています。

新興テクノロジー スタックの層は何ですか?最も難しい部分はどこですか?この記事では、次のことがわかります。

1. テクノロジー スタックを更新する必要があります。開発者は AI エンジニアの時代を迎えています

過去 1 年で、次のようなツールがいくつか登場しました。これにより、AI アプリケーションの開発者エコシステムが成熟し始めました。現在では、人工知能の開発に注力する人たちを表す言葉として「AIエンジニア」も使われています。 Shawn @swyx Wang 氏によると、これは「迅速なエンジニア」にとっての次のステップです。また、AI エンジニアがより広範な人工知能エコシステムのどこに当てはまるかを視覚化するための座標図も作成しました。

大規模なモデル開発ツールセットが作成されました。#出典: swyx## 大規模言語モデル (LLM) AIエンジニアのコアテクノロジーです。 LangChain と LlamaIndex の両方が LLM を拡張および補完するツールであることは偶然ではありません。しかし、この新しい種類の開発者が利用できる他のツールは何でしょうか?

これまでのところ、私が見た LLM スタックの最も優れた図は、ベンチャー キャピタル会社 Andreessen Horowitz (a16z) のものです。以下は、「LLM アプリ スタック」に関する見解です:

出典: a16z大規模なモデル開発ツールセットが作成されました。

2. はい、最上位層は依然としてデータです

LLM テクノロジー スタックでは、データが最も重要なコンポーネントであることは明らかです。 a16zのチャートによれば、データは一番上にあります。 LLM では、「埋め込みモデル」は非常に重要な領域であり、OpenAI、Cohere、Hugging Face、または人気が高まっているオープンソース LLM

を含むその他の数十の LLM オプションから選択できます。LLM を使用する前に、 「データパイプライン」を確立する必要があります。たとえば、Databricks と Airflow を 2 つの例として考えてみましょう。そうでない場合、データは「非構造化」で処理できます。これはデータの周期性にも当てはまり、企業がカスタム LLM にデータを入力する前にデータを「クリーンアップ」するか、単に整理するのに役立ちます。 Alation のような「データ インテリジェンス」企業は、この種のサービスを提供しています。これは、IT テクノロジ スタックでよく知られている「ビジネス インテリジェンス」などのツールに似ています。

データ レイヤーの最後の部分は非常に人気があります。最近では、LLM データを保存および処理するためのベクトル データベース。 Microsoft の定義によれば、これはデータを高次元ベクトルとして保存するデータベースであり、これは特徴や属性の数学的表現です。データは埋め込みテクノロジを使用してベクトルとして保存され、大手ベクトル データベース ベンダーである Pinecone はメディア チャットで、自社のツールが Databricks などのデータ パイプライン ツールと併用されることが多いと述べました。この場合、データは通常、他の場所 (データ レイクなど) に保存され、機械学習モデルを介して埋め込みデータに変換されます。処理とチャンク化の後、結果のベクトルが Pinecone に送信されます。

3、ヒントとクエリ

次の 2 つのレベルはヒントとクエリとして要約できます。これは人工知能アプリケーションです。プログラムが LLM および (オプションで) 他のデータ ツールと連携する対話。 A16z は、LangChain と LlamaIndex を「オーケストレーション フレームワーク」として位置付けています。つまり、開発者が使用している LLM を理解すれば、これらのツールを活用できるということです。

a16z によると、LangChain や LlamaIndex のようなオーケストレーションは、フレームワークによって「多くの機能が抽象化されます」 「プロンプト リンクの詳細」とは、アプリケーションと LLM 間のデータのクエリと管理を意味します。このオーケストレーション プロセスには、外部 API インターフェイスとの対話、ベクトル データベースからのコンテキスト データの取得、複数の LLM 呼び出しにわたるメモリの維持が含まれます。 a16z の図で最も興味深いボックスは、OpenAI、nat.dev、Humanloop を含む「Playground」です。

A16z はブログ投稿では正確に定義されていませんが、「Playground」ツールは次のことができると推測できます。 help 開発者は、A16z が「キュー柔術」と呼ぶものを実行します。これらの場所では、開発者はさまざまなプロンプト手法を試すことができます。

Humanloop は英国の企業で、そのプラットフォームには「共同プロンプト ワークスペース」が特徴です。さらに、それ自体を「本番 LLM 機能のための完全な開発ツールキット」であると説明しています。したがって、基本的には LLM のものを試し、それが機能する場合はアプリケーションにデプロイすることができます

4. 組立ラインのオペレーション: LLMOps

現在、大規模な生産ラインのレイアウトが徐々に明らかになりつつあります。オーケストレーション ボックスの右側には、LLM キャッシュや検証などの多くの操作ボックスがあります。さらに、Hugging Face などのオープン API リポジトリや、OpenAI などの独自の API プロバイダーを含む、LLM 関連の一連のクラウド サービスと API サービスがあります。

これは、「クラウド ネイティブ」の第一歩となるかもしれません。多くの DevOps 企業が、自社の製品リストに、開発者が慣れ親しんでいる技術スタックの最も類似した場所に人工知能を追加しているのは偶然ではありません。 5月に私はハーネスのCEO、ジョティ・バンサル氏と話をした。 Harness は、CI/CD プロセスの「CD」部分に焦点を当てた「ソフトウェア配信プラットフォーム」を実行しています。

Bansai 氏は、既存の機能に基づいた仕様の生成からコードの記述に至るまで、ソフトウェア配信ライフサイクルに関わる退屈で反復的なタスクを AI が軽減できると教えてくれました。さらに同氏は、AIはコードレビュー、脆弱性テスト、バグ修正を自動化し、さらにはビルドやデプロイのためのCI/CDパイプラインの作成も可能だと述べた。 5 月に私が行った別の会話によると、AI は開発者の生産性も変化させています。ビルド自動化ツール Gradle の Trisha Gee 氏は、AI はボイラープレート コードの作成などの反復的なタスクの時間を削減し、開発者がコードがビジネス ニーズを満たしているかどうかを確認するなどの全体像に集中できるようにすることで、開発をスピードアップできると語った。

5. Web3 が登場し、大規模なモデル開発スタックが登場

新興の LLM 開発テクノロジ スタックでは、オーケストレーション フレームワーク ( LangChain や LlamaIndex など)、ベクトル データベース、Humanloop などの「プレイグラウンド」プラットフォーム。これらの製品はすべて、かつての Spring Cloud や Kubernetes などのクラウドネイティブ時代のツールの台頭と同様に、現在の時代のコアテクノロジーである大規模言語モデルを拡張および/または補完しています。ただし、現在、クラウド ネイティブ時代の大企業、中小企業、トップ企業のほぼすべてが、自社のツールを AI エンジニアリングに適応させるために最善を尽くしており、これは LLM テクノロジー スタックの将来の開発に非常に有益です。

はい、今回の大きなモデルは「巨人の肩の上に立っている」ようです。コンピューター技術における最高のイノベーションは常に過去に基づいています。おそらくそれが、「Web3」革命が失敗した理由です。それは前世代を基礎にして構築するというよりも、それを横取りしようとしたのです。

LLM テクノロジー スタックはそれを実現したようで、クラウド開発時代から新しい人工知能ベースの開発者エコシステムへの架け橋となっています

参考リンク:

https :/ /www.php.cn/link/c589c3a8f99401b24b9380e86d939842

以上が大規模なモデル開発ツールセットが作成されました。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。
O3対O4 -Mini vs Gemini 2.5 Pro:究極の推論バトル-AnalyticsVidhyaO3対O4 -Mini vs Gemini 2.5 Pro:究極の推論バトル-AnalyticsVidhyaApr 26, 2025 am 09:28 AM

このブログは、厳密な推論課題で互いに並んでいる3つの主要なAIモデル(O3、O4-Mini、およびGemini 2.5 Pro)をピットします。 物理学、数学、コーディング、Webデザイン、画像分析にわたってそれらの能力をテストし、それらの強みを明らかにします

Yoloの効率的なReidを使用して追跡 - 分析VidhyaYoloの効率的なReidを使用して追跡 - 分析VidhyaApr 26, 2025 am 09:26 AM

Yolo、SSD、DETRなどのリアルタイムオブジェクト検出ツールは、オブジェクトの動きとアクションを監視するために重要です。 交通管理やセキュリティなどの業界は、これらのツールを追跡して分析するために活用しています。ただし、大きな課題は維持されます

生成AIデータサイエンティスト:活況を呈している新しい仕事の役割生成AIデータサイエンティスト:活況を呈している新しい仕事の役割Apr 26, 2025 am 09:22 AM

生成AI(genai)データサイエンティスト:活況を呈しているキャリアパス エグゼクティブサマリー: 生成AIの急成長分野では、大規模なデータセットナビゲーション、LLMアクセラレーションモデル開発、および実際のAI展開に熟練した専門家が必要です。 ティ

カーソルAIでMCPを使用する方法は?カーソルAIでMCPを使用する方法は?Apr 26, 2025 am 09:21 AM

AIはソフトウェアの構築方法を変更しています。 MCP(モデルコンテキストプロトコル)やカーソルAIなどのツールがこのシフトをリードしています。 Cursor AIでは、自然言語を使用してコードを作成できますが、MCPはスマート処理と自動化を上に追加します。 tog

Python 3.14アップデート - この甘いスライスの新品は何ですか? - 分析VidhyaPython 3.14アップデート - この甘いスライスの新品は何ですか? - 分析VidhyaApr 26, 2025 am 09:18 AM

Python 3.14.0A6:πデイがリリースしたメジャーアップデート 2025年3月14日(π日)に、Python 3.14.0A6がリリースされました。これは、3.14シリーズの最後から2番目のアルファバージョンで、ベータフェーズの到来を告げました。このリリースには、多くの新機能が含まれています。 目次 Python 3.14 Alphaバージョンとは何ですか? Python 3.14アップデートの重要な機能(これまでのところ) PEP 649 - 評価の遅延アノテーション(第2版) PEP 741 - 新しいPython構成C API PEP 761 - PGP署名パブリッシングを使用しなくなりました(Sigstoreログイン

Langchainを使用してMCPクライアントサーバーを作成する方法-AnalyticsVidhyaLangchainを使用してMCPクライアントサーバーを作成する方法-AnalyticsVidhyaApr 26, 2025 am 09:17 AM

このガイドは、Langchainとモデルコンテキストプロトコル(MCP)を使用して、堅牢なAIエージェントの構築を示しています。 MCPにより、大規模な言語モデル(LLM)が外部ツールとリアルタイムデータと対話し、機能を大幅に向上させることができます。私たちはwaです

言語モデル評価におけるエントロピー損失を超えて - 分析vidhya言語モデル評価におけるエントロピー損失を超えて - 分析vidhyaApr 26, 2025 am 09:14 AM

エントロピーの喪失を理解する:大規模な言語モデルの重要な指標 エントロピークロスロスは、言語モデルを評価するための基礎指標の1つです。これは、トレーニング目標と評価指標の両方です。この記事では、エントロピーの喪失の意味、大規模な言語モデル(LLM)での機能、およびその重要性について詳細に説明します。あなたが機械学習実践者、研究者であろうと、現代の人工知能システムがどのように訓練され評価されているかを理解したい人であろうと、この記事は、言語モデリングの分野におけるエントロピーの喪失とその重要性についての包括的な理解を提供します。 目次 クロスエントロピー損失とは何ですか? エントロピー喪失の重要な特性 バイナリクロスエントロピーと式 損失関数としてのエントロピーを横断します 大規模な言語モデルにおける交差エントロピーの役割 どのように機能しますか? 式と説明 pyt

Google Veo 2にアクセスする3つの方法-AnalyticsVidhyaGoogle Veo 2にアクセスする3つの方法-AnalyticsVidhyaApr 26, 2025 am 09:13 AM

Google Veo 2:Googleの高度な生成ビデオモデルに深く掘り下げる Googleは、これまでで最も洗練された生成ビデオモデルであるGoogle Veo 2を発表しました。 この強力なツールは、詳細なテキストの説明を映画品質のビデオに変換します。

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

DVWA

DVWA

Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、

WebStorm Mac版

WebStorm Mac版

便利なJavaScript開発ツール

AtomエディタMac版ダウンロード

AtomエディタMac版ダウンロード

最も人気のあるオープンソースエディター

EditPlus 中国語クラック版

EditPlus 中国語クラック版

サイズが小さく、構文の強調表示、コード プロンプト機能はサポートされていません

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポート ライブラリとヘッダー ファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。