検索
ホームページウェブフロントエンドjsチュートリアルLLM アプリケーションのテスト: SDK のモックと直接 HTTP リクエストにおける不運

Testing LLM Applications: Misadventures in Mocking SDKs vs Direct HTTP Requests

導入

このブログは、タスクを完了するまでの手順を順を追って説明する他のブログとは違うということを前置きさせていただきます。むしろ、これは、プロジェクト gimme_readme にテストを追加しようとして遭遇した課題と、その過程で LLM を利用したアプリケーションのテストについて学んだことを反映したものです。

コンテキスト

今週、オープンソース開発のクラスメートと私は、大規模言語モデル (LLM) を組み込んだコマンドライン ツールにテストを追加するという任務を与えられました。最初は簡単そうに見えましたが、予想していなかった複雑なテストのウサギの穴に私を導きました。

私のテストの旅

最初のアプローチ

初めて gimme_readme を構築したとき、Jest.js を使用していくつかの基本的なテストを追加しました。これらのテストは非常に単純で、主に次の点に焦点を当てていました。

  • 関数の出力を検証する
  • 基本的なエラー処理の確認
  • 単純なユーティリティ関数のテスト

これらのテストはある程度の範囲をカバーしましたが、アプリケーションの最も重要な部分の 1 つである LLM インタラクションをテストしていませんでした。

課題: LLM インタラクションのテスト

より包括的なテストを追加しようとしたとき、アプリケーションが LLM とどのように通信するかについて興味深いことに気づきました。当初、私は Nock.js を使用して、これらの言語モデルへの HTTP リクエストを模擬できると考えました。結局のところ、Nock が得意とするのは、テストのために HTTP リクエストをインターセプトしてモックすることです。

しかし、私が LLM を使用している方法では、Nock を使用してテストを書くのが難しくなっていることがわかりました。

SDK とダイレクト HTTP リクエストのジレンマ

ここからが興味深いところです。私のアプリケーションは、Google の Gemini や Groq などの LLM サービスによって提供される公式 SDK クライアントを使用します。これらの SDK は、すべての HTTP 通信をバックグラウンドで処理する抽象化レイヤーとして機能します。これにより、コードがよりクリーンになり、運用環境での作業が容易になりますが、興味深いテスト上の課題が生じます。

LLM 機能を実装するには、次の 2 つのアプローチを検討してください。

// Approach 1: Using SDK
const groq = new Groq({ apiKey });
const response = await groq.chat.completions.create({
  messages: [{ role: "user", content: prompt }],
  model: "mixtral-8x7b-32768"
});

// Approach 2: Direct HTTP requests
const response = await fetch('https://api.groq.com/v1/completions', {
  method: 'POST',
  headers: {
    'Authorization': `Bearer ${apiKey}`,
    'Content-Type': 'application/json'
  },
  body: JSON.stringify({
    messages: [{ role: "user", content: prompt }],
    model: "mixtral-8x7b-32768"
  })
});

SDK アプローチはよりクリーンで、開発者エクスペリエンスが向上しますが、Nock のような従来の HTTP モック ツールの有用性が低くなります。 HTTP リクエストは SDK 内で発生するため、Nock による傍受が困難になります。

学んだ教訓

  1. 早期にテスト戦略を検討する: SDK と直接 HTTP リクエストのどちらを選択する場合は、実装をテストする方法を検討してください。場合によっては、実稼働コードが「よりクリーン」になると、テストがより困難になる場合があります。

  2. SDK テストにはさまざまなツールが必要です: SDK を使用する場合、HTTP レベルではなく SDK レベルでモックする必要があります。これは次のことを意味します:

    • SDK クライアント全体をモックする
    • HTTP リクエストではなく SDK のインターフェースに焦点を当てます
    • HTTP インターセプターの代わりに Jest のモジュール モック機能を使用する
  3. 利便性とテスト容易性のバランス: SDK は優れた開発者エクスペリエンスを提供しますが、特定のテスト手法をより困難にする可能性があります。アプリケーションを設計する際には、このトレードオフを考慮する価値があります。

今後の展開

テストの課題はまだ完全には解決していませんが、この経験から、SDK を介した外部サービスに依存するアプリケーションのテストについて貴重な教訓を得ることができました。同様のアプリケーションを構築している人には、以下をお勧めします。

  1. SDK と直接 API 呼び出しのどちらかを選択する場合は、テスト戦略を考慮してください
  2. SDK を使用する場合は、HTTP レベルではなく SDK レベルでモックすることを計画してください
  3. SDK をテストしやすくするために、SDK の周囲に薄いラッパーを作成することを検討してください
  4. プロジェクトに取り組む他の人のためにテストのアプローチを文書化します

結論

LLM アプリケーションのテストには、特に SD​​K などの最新の開発の利便性と徹底的なテストの必要性のバランスを取る場合に、特有の課題が伴います。私はまだ gimme_readme のテスト カバレッジの改善に取り組んでいますが、この経験により、外部サービスや SDK が関与する将来のプロジェクトでのテストへのアプローチ方法についてより深く理解できるようになりました。

LLM SDK を使用するアプリケーションをテストするときに、同様の課題に遭遇した人はいますか?コメントであなたの経験や解決策をぜひお聞かせください!

以上がLLM アプリケーションのテスト: SDK のモックと直接 HTTP リクエストにおける不運の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
JavaScriptフレームワーク:最新のWeb開発のパワーJavaScriptフレームワーク:最新のWeb開発のパワーMay 02, 2025 am 12:04 AM

JavaScriptフレームワークのパワーは、開発を簡素化し、ユーザーエクスペリエンスとアプリケーションのパフォーマンスを向上させることにあります。フレームワークを選択するときは、次のことを検討してください。1。プロジェクトのサイズと複雑さ、2。チームエクスペリエンス、3。エコシステムとコミュニティサポート。

JavaScript、C、およびブラウザの関係JavaScript、C、およびブラウザの関係May 01, 2025 am 12:06 AM

はじめに私はあなたがそれを奇妙に思うかもしれないことを知っています、JavaScript、C、およびブラウザは正確に何をしなければなりませんか?彼らは無関係であるように見えますが、実際、彼らは現代のウェブ開発において非常に重要な役割を果たしています。今日は、これら3つの間の密接なつながりについて説明します。この記事を通して、JavaScriptがブラウザでどのように実行されるか、ブラウザエンジンでのCの役割、およびそれらが協力してWebページのレンダリングと相互作用を駆動する方法を学びます。私たちは皆、JavaScriptとブラウザの関係を知っています。 JavaScriptは、フロントエンド開発のコア言語です。ブラウザで直接実行され、Webページが鮮明で興味深いものになります。なぜJavascrを疑問に思ったことがありますか

node.jsは、型を使用してストリーミングしますnode.jsは、型を使用してストリーミングしますApr 30, 2025 am 08:22 AM

node.jsは、主にストリームのおかげで、効率的なI/Oで優れています。 ストリームはデータを段階的に処理し、メモリの過負荷を回避します。大きなファイル、ネットワークタスク、リアルタイムアプリケーションの場合。ストリームとTypeScriptのタイプの安全性を組み合わせることで、パワーが作成されます

Python vs. JavaScript:パフォーマンスと効率の考慮事項Python vs. JavaScript:パフォーマンスと効率の考慮事項Apr 30, 2025 am 12:08 AM

PythonとJavaScriptのパフォーマンスと効率の違いは、主に以下に反映されています。1)解釈された言語として、Pythonはゆっくりと実行されますが、開発効率が高く、迅速なプロトタイプ開発に適しています。 2)JavaScriptはブラウザ内の単一のスレッドに限定されていますが、マルチスレッドおよび非同期I/Oを使用してnode.jsのパフォーマンスを改善でき、両方とも実際のプロジェクトで利点があります。

JavaScriptの起源:その実装言語の調査JavaScriptの起源:その実装言語の調査Apr 29, 2025 am 12:51 AM

JavaScriptは1995年に発信され、Brandon Ikeによって作成され、言語をCに実現しました。 2。JavaScriptのメモリ管理とパフォーマンスの最適化は、C言語に依存しています。 3. C言語のクロスプラットフォーム機能は、さまざまなオペレーティングシステムでJavaScriptを効率的に実行するのに役立ちます。

舞台裏:JavaScriptをパワーする言語は何ですか?舞台裏:JavaScriptをパワーする言語は何ですか?Apr 28, 2025 am 12:01 AM

JavaScriptはブラウザとnode.js環境で実行され、JavaScriptエンジンに依存してコードを解析および実行します。 1)解析段階で抽象的構文ツリー(AST)を生成します。 2)ASTをコンパイル段階のバイトコードまたはマシンコードに変換します。 3)実行段階でコンパイルされたコードを実行します。

PythonとJavaScriptの未来:傾向と予測PythonとJavaScriptの未来:傾向と予測Apr 27, 2025 am 12:21 AM

PythonとJavaScriptの将来の傾向には、1。Pythonが科学コンピューティングの分野での位置を統合し、AI、2。JavaScriptはWebテクノロジーの開発を促進します。どちらもそれぞれのフィールドでアプリケーションシナリオを拡大し続け、パフォーマンスをより多くのブレークスルーを行います。

Python vs. JavaScript:開発環境とツールPython vs. JavaScript:開発環境とツールApr 26, 2025 am 12:09 AM

開発環境におけるPythonとJavaScriptの両方の選択が重要です。 1)Pythonの開発環境には、Pycharm、Jupyternotebook、Anacondaが含まれます。これらは、データサイエンスと迅速なプロトタイピングに適しています。 2)JavaScriptの開発環境には、フロントエンドおよびバックエンド開発に適したnode.js、vscode、およびwebpackが含まれます。プロジェクトのニーズに応じて適切なツールを選択すると、開発効率とプロジェクトの成功率が向上する可能性があります。

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

MantisBT

MantisBT

Mantis は、製品の欠陥追跡を支援するために設計された、導入が簡単な Web ベースの欠陥追跡ツールです。 PHP、MySQL、Web サーバーが必要です。デモおよびホスティング サービスをチェックしてください。

SAP NetWeaver Server Adapter for Eclipse

SAP NetWeaver Server Adapter for Eclipse

Eclipse を SAP NetWeaver アプリケーション サーバーと統合します。

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポート ライブラリとヘッダー ファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。

Safe Exam Browser

Safe Exam Browser

Safe Exam Browser は、オンライン試験を安全に受験するための安全なブラウザ環境です。このソフトウェアは、あらゆるコンピュータを安全なワークステーションに変えます。あらゆるユーティリティへのアクセスを制御し、学生が無許可のリソースを使用するのを防ぎます。