Testen von LLM-Anwendungen: Missgeschicke beim Verspotten von SDKs im Vergleich zu direkten HTTP-Anfragen-js-Tutorial-php.cn

Heim

Web-Frontend

js-Tutorial

Testen von LLM-Anwendungen: Missgeschicke beim Verspotten von SDKs im Vergleich zu direkten HTTP-Anfragen

Barbara Streisand

Dec 04, 2024 am 11:03 AM

Testing LLM Applications: Misadventures in Mocking SDKs vs Direct HTTP Requests

Einführung

Lassen Sie mich vor diesem Blog Folgendes sagen: ist nicht wie in meinen anderen Blogs, in denen ich die Schritte durchgehen konnte, die ich zur Erledigung einer Aufgabe unternommen habe. Stattdessen ist dies eher eine Reflexion über die Herausforderungen, denen ich begegnet bin, als ich versuchte, Tests zu meinem Projekt, gimme_readme, hinzuzufügen, und darüber, was ich dabei über das Testen von LLM-basierten Anwendungen gelernt habe.

Der Kontext

Diese Woche wurden meine Klassenkameraden in der Open-Source-Entwicklung und ich damit beauftragt, Tests zu unseren Befehlszeilentools hinzuzufügen, die Large Language Models (LLMs) integrieren. Das schien zunächst unkompliziert, aber es führte mich in ein Kaninchenloch voller Testkomplexitäten, mit denen ich nicht gerechnet hatte.

Meine Testreise

Der erste Ansatz

Als ich gimme_readme zum ersten Mal erstellt habe, habe ich einige grundlegende Tests mit Jest.js hinzugefügt. Diese Tests waren recht einfach und konzentrierten sich hauptsächlich auf Folgendes:

Funktionsausgaben überprüfen
Überprüfung der grundlegenden Fehlerbehandlung
Testen einfacher Hilfsfunktionen

Obwohl diese Tests eine gewisse Abdeckung boten, testeten sie nicht einen der kritischsten Teile meiner Anwendung: die LLM-Interaktionen.

Die Herausforderung: LLM-Interaktionen testen

Als ich versuchte, umfassendere Tests hinzuzufügen, stieß ich auf eine interessante Erkenntnis darüber, wie meine Anwendung mit LLMs kommuniziert. Anfangs dachte ich, ich könnte Nock.js verwenden, um die HTTP-Anfragen an diese Sprachmodelle zu verspotten. Schließlich ist Nock darin großartig: HTTP-Anfragen zu Testzwecken abzufangen und zu verspotten.

Ich habe jedoch festgestellt, dass die Art und Weise, wie ich LLM verwende, es mir schwer macht, Tests mit Nock zu schreiben. Das Dilemma zwischen SDK und direkten HTTP-Anfragen

Hier wird es interessant. Meine Anwendung verwendet offizielle SDK-Clients, die von LLM-Diensten wie Gemini und Groq von Google bereitgestellt werden. Diese SDKs fungieren als Abstraktionsebenen, die

die gesamte HTTP-Kommunikation im Hintergrund abwickeln

. Dies macht den Code zwar sauberer und erleichtert die Arbeit mit ihm in der Produktion, stellt aber auch eine interessante Testherausforderung dar. Betrachten Sie diese beiden Ansätze zur Implementierung der LLM-Funktionalität:

Der SDK-Ansatz ist sauberer und bietet eine bessere Entwicklererfahrung, macht jedoch herkömmliche HTTP-Mocking-Tools wie Nock weniger nützlich. Die HTTP-Anfragen erfolgen innerhalb des SDK, was es schwieriger macht, sie

// Approach 1: Using SDK
const groq = new Groq({ apiKey });
const response = await groq.chat.completions.create({
  messages: [{ role: "user", content: prompt }],
  model: "mixtral-8x7b-32768"
});

// Approach 2: Direct HTTP requests
const response = await fetch('https://api.groq.com/v1/completions', {
  method: 'POST',
  headers: {
    'Authorization': `Bearer ${apiKey}`,
    'Content-Type': 'application/json'
  },
  body: JSON.stringify({
    messages: [{ role: "user", content: prompt }],
    model: "mixtral-8x7b-32768"
  })
});

mit Nock abzufangen

. Gelernte Lektionen

Erwägen Sie frühzeitig die Teststrategie
: Überlegen Sie bei der Wahl zwischen SDKs und direkten HTTP-Anfragen, wie Sie die Implementierung testen. Manchmal macht der „sauberere“ Produktionscode das Testen schwieriger.
SDK-Tests erfordern unterschiedliche Tools: Wenn Sie SDKs verwenden, müssen Sie auf SDK-Ebene statt auf HTTP-Ebene simulieren. Das bedeutet:
- Verspottung des gesamten SDK-Clients
- Konzentrieren Sie sich auf die SDK-Schnittstelle und nicht auf HTTP-Anfragen
- Verwendung der Modul-Mocking-Funktionen von Jest anstelle von HTTP-Interceptoren
Gleichgewicht zwischen Komfort und Testbarkeit: Während SDKs eine großartige Entwicklererfahrung bieten, können sie bestimmte Testansätze schwieriger machen. Es lohnt sich, diesen Kompromiss bei der Architektur Ihrer Anwendung zu berücksichtigen.

Vorwärts gehen

Obwohl ich meine Testherausforderungen noch nicht vollständig gelöst habe, habe ich durch diese Erfahrung wertvolle Lektionen über das Testen von Anwendungen gelernt, die auf externen Diensten über SDKs basieren. Für alle, die ähnliche Anwendungen erstellen, würde ich Folgendes empfehlen:

Denken Sie über die Teststrategie nach, wenn Sie zwischen SDKs und direkten API-Aufrufen wählen
Wenn Sie SDKs verwenden, planen Sie eine Verspottung auf SDK-Ebene und nicht auf HTTP-Ebene
Denken Sie darüber nach, dünne Wrapper um SDKs zu schreiben, um sie testbarer zu machen
Dokumentieren Sie den Testansatz für andere, die möglicherweise an dem Projekt arbeiten

Abschluss

Das Testen von LLM-Anwendungen stellt einzigartige Herausforderungen dar, insbesondere wenn moderne Entwicklungsfunktionen wie SDKs mit der Notwendigkeit gründlicher Tests in Einklang gebracht werden müssen. Während ich immer noch daran arbeite, die Testabdeckung für gimme_readme zu verbessern, habe ich durch diese Erfahrung ein besseres Verständnis dafür gewonnen, wie ich Tests in zukünftigen Projekten angehen soll, die externe Dienste und SDKs beinhalten.

Ist jemand beim Testen von Anwendungen, die LLM-SDKs verwenden, auf ähnliche Herausforderungen gestoßen? Ich freue mich über eure Erfahrungen und Lösungen in den Kommentaren!

Das obige ist der detaillierte Inhalt vonTesten von LLM-Anwendungen: Missgeschicke beim Verspotten von SDKs im Vergleich zu direkten HTTP-Anfragen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Verwandter Artikel

Python vs. JavaScript: Die Lernkurve und BenutzerfreundlichkeitApr 16, 2025 am 12:12 AM

Python eignet sich besser für Anfänger mit einer reibungslosen Lernkurve und einer kurzen Syntax. JavaScript ist für die Front-End-Entwicklung mit einer steilen Lernkurve und einer flexiblen Syntax geeignet. 1. Python-Syntax ist intuitiv und für die Entwicklung von Datenwissenschaften und Back-End-Entwicklung geeignet. 2. JavaScript ist flexibel und in Front-End- und serverseitiger Programmierung weit verbreitet.

Python gegen JavaScript: Community, Bibliotheken und RessourcenApr 15, 2025 am 12:16 AM

Python und JavaScript haben ihre eigenen Vor- und Nachteile in Bezug auf Gemeinschaft, Bibliotheken und Ressourcen. 1) Die Python-Community ist freundlich und für Anfänger geeignet, aber die Front-End-Entwicklungsressourcen sind nicht so reich wie JavaScript. 2) Python ist leistungsstark in Bibliotheken für Datenwissenschaft und maschinelles Lernen, während JavaScript in Bibliotheken und Front-End-Entwicklungsbibliotheken und Frameworks besser ist. 3) Beide haben reichhaltige Lernressourcen, aber Python eignet sich zum Beginn der offiziellen Dokumente, während JavaScript mit Mdnwebdocs besser ist. Die Wahl sollte auf Projektbedürfnissen und persönlichen Interessen beruhen.

Von C/C nach JavaScript: Wie alles funktioniertApr 14, 2025 am 12:05 AM

Die Verschiebung von C/C zu JavaScript erfordert die Anpassung an dynamische Typisierung, Müllsammlung und asynchrone Programmierung. 1) C/C ist eine statisch typisierte Sprache, die eine manuelle Speicherverwaltung erfordert, während JavaScript dynamisch eingegeben und die Müllsammlung automatisch verarbeitet wird. 2) C/C muss in den Maschinencode kompiliert werden, während JavaScript eine interpretierte Sprache ist. 3) JavaScript führt Konzepte wie Verschlüsse, Prototypketten und Versprechen ein, die die Flexibilität und asynchrone Programmierfunktionen verbessern.

JavaScript -Engines: Implementierungen vergleichenApr 13, 2025 am 12:05 AM

Unterschiedliche JavaScript -Motoren haben unterschiedliche Auswirkungen beim Analysieren und Ausführen von JavaScript -Code, da sich die Implementierungsprinzipien und Optimierungsstrategien jeder Engine unterscheiden. 1. Lexikalanalyse: Quellcode in die lexikalische Einheit umwandeln. 2. Grammatikanalyse: Erzeugen Sie einen abstrakten Syntaxbaum. 3. Optimierung und Kompilierung: Generieren Sie den Maschinencode über den JIT -Compiler. 4. Führen Sie aus: Führen Sie den Maschinencode aus. V8 Engine optimiert durch sofortige Kompilierung und versteckte Klasse.

Jenseits des Browsers: JavaScript in der realen WeltApr 12, 2025 am 12:06 AM

Zu den Anwendungen von JavaScript in der realen Welt gehören die serverseitige Programmierung, die Entwicklung mobiler Anwendungen und das Internet der Dinge. Die serverseitige Programmierung wird über node.js realisiert, die für die hohe gleichzeitige Anfrageverarbeitung geeignet sind. 2. Die Entwicklung der mobilen Anwendungen erfolgt durch reaktnative und unterstützt die plattformübergreifende Bereitstellung. 3.. Wird für die Steuerung von IoT-Geräten über die Johnny-Five-Bibliothek verwendet, geeignet für Hardware-Interaktion.

Erstellen einer SaaS-Anwendung mit mehreren Mietern mit Next.js (Backend Integration)Apr 11, 2025 am 08:23 AM

Ich habe eine funktionale SaaS-Anwendung mit mehreren Mandanten (eine EdTech-App) mit Ihrem täglichen Tech-Tool erstellt und Sie können dasselbe tun. Was ist eine SaaS-Anwendung mit mehreren Mietern? Mit Multi-Tenant-SaaS-Anwendungen können Sie mehrere Kunden aus einem Sing bedienen

So erstellen Sie eine SaaS-Anwendung mit mehreren Mietern mit Next.js (Frontend Integration)Apr 11, 2025 am 08:22 AM

Dieser Artikel zeigt die Frontend -Integration mit einem Backend, das durch die Genehmigung gesichert ist und eine funktionale edtech SaaS -Anwendung unter Verwendung von Next.js. erstellt. Die Frontend erfasst Benutzerberechtigungen zur Steuerung der UI-Sichtbarkeit und stellt sicher, dass API-Anfragen die Rollenbasis einhalten

JavaScript: Erforschung der Vielseitigkeit einer WebspracheApr 11, 2025 am 12:01 AM

JavaScript ist die Kernsprache der modernen Webentwicklung und wird für seine Vielfalt und Flexibilität häufig verwendet. 1) Front-End-Entwicklung: Erstellen Sie dynamische Webseiten und einseitige Anwendungen durch DOM-Operationen und moderne Rahmenbedingungen (wie React, Vue.js, Angular). 2) Serverseitige Entwicklung: Node.js verwendet ein nicht blockierendes E/A-Modell, um hohe Parallelitäts- und Echtzeitanwendungen zu verarbeiten. 3) Entwicklung von Mobil- und Desktop-Anwendungen: Die plattformübergreifende Entwicklung wird durch reaktnative und elektronen zur Verbesserung der Entwicklungseffizienz realisiert.

See all articles