


Einführung
Lassen Sie mich vor diesem Blog Folgendes sagen: ist nicht wie in meinen anderen Blogs, in denen ich die Schritte durchgehen konnte, die ich zur Erledigung einer Aufgabe unternommen habe. Stattdessen ist dies eher eine Reflexion über die Herausforderungen, denen ich begegnet bin, als ich versuchte, Tests zu meinem Projekt, gimme_readme, hinzuzufügen, und darüber, was ich dabei über das Testen von LLM-basierten Anwendungen gelernt habe.
Der Kontext
Diese Woche wurden meine Klassenkameraden in der Open-Source-Entwicklung und ich damit beauftragt, Tests zu unseren Befehlszeilentools hinzuzufügen, die Large Language Models (LLMs) integrieren. Das schien zunächst unkompliziert, aber es führte mich in ein Kaninchenloch voller Testkomplexitäten, mit denen ich nicht gerechnet hatte.
Meine Testreise
Der erste Ansatz
Als ich gimme_readme zum ersten Mal erstellt habe, habe ich einige grundlegende Tests mit Jest.js hinzugefügt. Diese Tests waren recht einfach und konzentrierten sich hauptsächlich auf Folgendes:
- Funktionsausgaben überprüfen
- Überprüfung der grundlegenden Fehlerbehandlung
- Testen einfacher Hilfsfunktionen
Obwohl diese Tests eine gewisse Abdeckung boten, testeten sie nicht einen der kritischsten Teile meiner Anwendung: die LLM-Interaktionen.
Die Herausforderung: LLM-Interaktionen testen
Als ich versuchte, umfassendere Tests hinzuzufügen, stieß ich auf eine interessante Erkenntnis darüber, wie meine Anwendung mit LLMs kommuniziert. Anfangs dachte ich, ich könnte Nock.js verwenden, um die HTTP-Anfragen an diese Sprachmodelle zu verspotten. Schließlich ist Nock darin großartig: HTTP-Anfragen zu Testzwecken abzufangen und zu verspotten.
Ich habe jedoch festgestellt, dass die Art und Weise, wie ich LLM verwende, es mir schwer macht, Tests mit Nock zu schreiben. Das Dilemma zwischen SDK und direkten HTTP-Anfragen
Hier wird es interessant. Meine Anwendung verwendet offizielle SDK-Clients, die von LLM-Diensten wie Gemini und Groq von Google bereitgestellt werden. Diese SDKs fungieren als Abstraktionsebenen, die
die gesamte HTTP-Kommunikation im Hintergrund abwickeln. Dies macht den Code zwar sauberer und erleichtert die Arbeit mit ihm in der Produktion, stellt aber auch eine interessante Testherausforderung dar. Betrachten Sie diese beiden Ansätze zur Implementierung der LLM-Funktionalität:
// Approach 1: Using SDK const groq = new Groq({ apiKey }); const response = await groq.chat.completions.create({ messages: [{ role: "user", content: prompt }], model: "mixtral-8x7b-32768" }); // Approach 2: Direct HTTP requests const response = await fetch('https://api.groq.com/v1/completions', { method: 'POST', headers: { 'Authorization': `Bearer ${apiKey}`, 'Content-Type': 'application/json' }, body: JSON.stringify({ messages: [{ role: "user", content: prompt }], model: "mixtral-8x7b-32768" }) });mit Nock abzufangen
. Gelernte Lektionen
- Erwägen Sie frühzeitig die Teststrategie
: Überlegen Sie bei der Wahl zwischen SDKs und direkten HTTP-Anfragen, wie Sie die Implementierung testen. Manchmal macht der „sauberere“ Produktionscode das Testen schwieriger.
-
SDK-Tests erfordern unterschiedliche Tools: Wenn Sie SDKs verwenden, müssen Sie auf SDK-Ebene statt auf HTTP-Ebene simulieren. Das bedeutet:
- Verspottung des gesamten SDK-Clients
- Konzentrieren Sie sich auf die SDK-Schnittstelle und nicht auf HTTP-Anfragen
- Verwendung der Modul-Mocking-Funktionen von Jest anstelle von HTTP-Interceptoren
Gleichgewicht zwischen Komfort und Testbarkeit: Während SDKs eine großartige Entwicklererfahrung bieten, können sie bestimmte Testansätze schwieriger machen. Es lohnt sich, diesen Kompromiss bei der Architektur Ihrer Anwendung zu berücksichtigen.
Vorwärts gehen
Obwohl ich meine Testherausforderungen noch nicht vollständig gelöst habe, habe ich durch diese Erfahrung wertvolle Lektionen über das Testen von Anwendungen gelernt, die auf externen Diensten über SDKs basieren. Für alle, die ähnliche Anwendungen erstellen, würde ich Folgendes empfehlen:
- Denken Sie über die Teststrategie nach, wenn Sie zwischen SDKs und direkten API-Aufrufen wählen
- Wenn Sie SDKs verwenden, planen Sie eine Verspottung auf SDK-Ebene und nicht auf HTTP-Ebene
- Denken Sie darüber nach, dünne Wrapper um SDKs zu schreiben, um sie testbarer zu machen
- Dokumentieren Sie den Testansatz für andere, die möglicherweise an dem Projekt arbeiten
Abschluss
Das Testen von LLM-Anwendungen stellt einzigartige Herausforderungen dar, insbesondere wenn moderne Entwicklungsfunktionen wie SDKs mit der Notwendigkeit gründlicher Tests in Einklang gebracht werden müssen. Während ich immer noch daran arbeite, die Testabdeckung für gimme_readme zu verbessern, habe ich durch diese Erfahrung ein besseres Verständnis dafür gewonnen, wie ich Tests in zukünftigen Projekten angehen soll, die externe Dienste und SDKs beinhalten.
Ist jemand beim Testen von Anwendungen, die LLM-SDKs verwenden, auf ähnliche Herausforderungen gestoßen? Ich freue mich über eure Erfahrungen und Lösungen in den Kommentaren!
Das obige ist der detaillierte Inhalt vonTesten von LLM-Anwendungen: Missgeschicke beim Verspotten von SDKs im Vergleich zu direkten HTTP-Anfragen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Python eignet sich besser für Anfänger mit einer reibungslosen Lernkurve und einer kurzen Syntax. JavaScript ist für die Front-End-Entwicklung mit einer steilen Lernkurve und einer flexiblen Syntax geeignet. 1. Python-Syntax ist intuitiv und für die Entwicklung von Datenwissenschaften und Back-End-Entwicklung geeignet. 2. JavaScript ist flexibel und in Front-End- und serverseitiger Programmierung weit verbreitet.

Python und JavaScript haben ihre eigenen Vor- und Nachteile in Bezug auf Gemeinschaft, Bibliotheken und Ressourcen. 1) Die Python-Community ist freundlich und für Anfänger geeignet, aber die Front-End-Entwicklungsressourcen sind nicht so reich wie JavaScript. 2) Python ist leistungsstark in Bibliotheken für Datenwissenschaft und maschinelles Lernen, während JavaScript in Bibliotheken und Front-End-Entwicklungsbibliotheken und Frameworks besser ist. 3) Beide haben reichhaltige Lernressourcen, aber Python eignet sich zum Beginn der offiziellen Dokumente, während JavaScript mit Mdnwebdocs besser ist. Die Wahl sollte auf Projektbedürfnissen und persönlichen Interessen beruhen.

Die Verschiebung von C/C zu JavaScript erfordert die Anpassung an dynamische Typisierung, Müllsammlung und asynchrone Programmierung. 1) C/C ist eine statisch typisierte Sprache, die eine manuelle Speicherverwaltung erfordert, während JavaScript dynamisch eingegeben und die Müllsammlung automatisch verarbeitet wird. 2) C/C muss in den Maschinencode kompiliert werden, während JavaScript eine interpretierte Sprache ist. 3) JavaScript führt Konzepte wie Verschlüsse, Prototypketten und Versprechen ein, die die Flexibilität und asynchrone Programmierfunktionen verbessern.

Unterschiedliche JavaScript -Motoren haben unterschiedliche Auswirkungen beim Analysieren und Ausführen von JavaScript -Code, da sich die Implementierungsprinzipien und Optimierungsstrategien jeder Engine unterscheiden. 1. Lexikalanalyse: Quellcode in die lexikalische Einheit umwandeln. 2. Grammatikanalyse: Erzeugen Sie einen abstrakten Syntaxbaum. 3. Optimierung und Kompilierung: Generieren Sie den Maschinencode über den JIT -Compiler. 4. Führen Sie aus: Führen Sie den Maschinencode aus. V8 Engine optimiert durch sofortige Kompilierung und versteckte Klasse.

Zu den Anwendungen von JavaScript in der realen Welt gehören die serverseitige Programmierung, die Entwicklung mobiler Anwendungen und das Internet der Dinge. Die serverseitige Programmierung wird über node.js realisiert, die für die hohe gleichzeitige Anfrageverarbeitung geeignet sind. 2. Die Entwicklung der mobilen Anwendungen erfolgt durch reaktnative und unterstützt die plattformübergreifende Bereitstellung. 3.. Wird für die Steuerung von IoT-Geräten über die Johnny-Five-Bibliothek verwendet, geeignet für Hardware-Interaktion.

Ich habe eine funktionale SaaS-Anwendung mit mehreren Mandanten (eine EdTech-App) mit Ihrem täglichen Tech-Tool erstellt und Sie können dasselbe tun. Was ist eine SaaS-Anwendung mit mehreren Mietern? Mit Multi-Tenant-SaaS-Anwendungen können Sie mehrere Kunden aus einem Sing bedienen

Dieser Artikel zeigt die Frontend -Integration mit einem Backend, das durch die Genehmigung gesichert ist und eine funktionale edtech SaaS -Anwendung unter Verwendung von Next.js. erstellt. Die Frontend erfasst Benutzerberechtigungen zur Steuerung der UI-Sichtbarkeit und stellt sicher, dass API-Anfragen die Rollenbasis einhalten

JavaScript ist die Kernsprache der modernen Webentwicklung und wird für seine Vielfalt und Flexibilität häufig verwendet. 1) Front-End-Entwicklung: Erstellen Sie dynamische Webseiten und einseitige Anwendungen durch DOM-Operationen und moderne Rahmenbedingungen (wie React, Vue.js, Angular). 2) Serverseitige Entwicklung: Node.js verwendet ein nicht blockierendes E/A-Modell, um hohe Parallelitäts- und Echtzeitanwendungen zu verarbeiten. 3) Entwicklung von Mobil- und Desktop-Anwendungen: Die plattformübergreifende Entwicklung wird durch reaktnative und elektronen zur Verbesserung der Entwicklungseffizienz realisiert.


Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

MantisBT
Mantis ist ein einfach zu implementierendes webbasiertes Tool zur Fehlerverfolgung, das die Fehlerverfolgung von Produkten unterstützen soll. Es erfordert PHP, MySQL und einen Webserver. Schauen Sie sich unsere Demo- und Hosting-Services an.

SAP NetWeaver Server-Adapter für Eclipse
Integrieren Sie Eclipse mit dem SAP NetWeaver-Anwendungsserver.

VSCode Windows 64-Bit-Download
Ein kostenloser und leistungsstarker IDE-Editor von Microsoft

SublimeText3 Englische Version
Empfohlen: Win-Version, unterstützt Code-Eingabeaufforderungen!

ZendStudio 13.5.1 Mac
Leistungsstarke integrierte PHP-Entwicklungsumgebung