LLM 애플리케이션 테스트: 모의 SDK와 직접 HTTP 요청의 오해-JS 튜토리얼-php.cn

집

웹 프론트엔드

JS 튜토리얼

LLM 애플리케이션 테스트: 모의 SDK와 직접 HTTP 요청의 오해

Barbara Streisand

Dec 04, 2024 am 11:03 AM

Testing LLM Applications: Misadventures in Mocking SDKs vs Direct HTTP Requests

소개

이 블로그는 작업을 완료하기 위해 수행한 단계를 단계별로 수행할 수 있었던 다른 블로그와 같지 않습니다. 대신 이것은 내 프로젝트 gimme_readme에 테스트를 추가하는 동안 직면한 문제와 그 과정에서 LLM 기반 애플리케이션을 테스트하는 방법에 대해 배운 내용을 반영한 것입니다.

맥락

이번 주에 오픈 소스 개발 반 친구들과 저는 LLM(대형 언어 모델)을 통합하는 명령줄 도구에 테스트를 추가하는 임무를 받았습니다. 처음에는 간단해 보였지만 예상하지 못한 복잡한 테스트라는 토끼굴에 빠지게 되었습니다.

나의 테스트 여정

초기 접근 방식

처음 gimme_readme를 빌드했을 때 Jest.js를 사용하여 몇 가지 기본 테스트를 추가했습니다. 이 테스트는 매우 간단했으며 주로 다음에 중점을 두었습니다.

함수 출력 확인
기본 오류 처리 확인
간단한 유틸리티 기능 테스트

이러한 테스트는 어느 정도 적용 범위를 제공했지만 지원서의 가장 중요한 부분 중 하나인 LLM 상호 작용을 테스트하지는 않았습니다.

과제: LLM 상호 작용 테스트

보다 포괄적인 테스트를 추가하려고 시도하면서 내 응용 프로그램이 LLM과 통신하는 방식에 대한 흥미로운 사실을 깨달았습니다. 처음에는 Nock.js를 사용하여 이러한 언어 모델에 대한 HTTP 요청을 모의할 수 있다고 생각했습니다. 결국 Nock은 테스트를 위해 HTTP 요청을 가로채고 조롱하는 일을 훌륭하게 수행합니다.

그런데 LLM을 사용하는 방식 때문에 Nock을 사용하여 테스트를 작성하는 것이 어렵다는 것을 알게 되었습니다.

SDK와 직접 HTTP 요청 딜레마

여기서 흥미로운 점이 있습니다. 내 애플리케이션은 Google의 Gemini 및 Groq와 같은 LLM 서비스에서 제공하는 공식 SDK 클라이언트를 사용합니다. 이러한 SDK는 배후에서 모든 HTTP 통신을 처리하는 추상화 계층 역할을 합니다. 이렇게 하면 프로덕션 환경에서 코드가 더 깔끔하고 작업하기 쉬워지지만 흥미로운 테스트 문제가 발생합니다.

LLM 기능을 구현하려면 다음 두 가지 접근 방식을 고려하세요.

// Approach 1: Using SDK
const groq = new Groq({ apiKey });
const response = await groq.chat.completions.create({
  messages: [{ role: "user", content: prompt }],
  model: "mixtral-8x7b-32768"
});

// Approach 2: Direct HTTP requests
const response = await fetch('https://api.groq.com/v1/completions', {
  method: 'POST',
  headers: {
    'Authorization': `Bearer ${apiKey}`,
    'Content-Type': 'application/json'
  },
  body: JSON.stringify({
    messages: [{ role: "user", content: prompt }],
    model: "mixtral-8x7b-32768"
  })
});

SDK 접근 방식은 더 깨끗하고 더 나은 개발자 경험을 제공하지만 Nock과 같은 기존 HTTP 모의 도구의 유용성은 떨어집니다. HTTP 요청은 SDK 내부에서 발생하므로 Nock을 사용하여 가로채기

하기가 더 어렵습니다.

배운 교훈

초기 테스트 전략 고려: SDK와 직접 HTTP 요청 중에서 선택할 때 구현 테스트 방법을 고려하세요. 때로는 "더 깔끔한" 프로덕션 코드로 인해 테스트가 더 어려워질 수 있습니다.
SDK 테스트에는 다양한 도구가 필요합니다: SDK를 사용할 때는 HTTP 수준이 아닌 SDK 수준에서 모의해야 합니다. 이는 다음을 의미합니다.
- 전체 SDK 클라이언트 모의
- HTTP 요청보다는 SDK의 인터페이스에 집중
- HTTP 인터셉터 대신 Jest의 모듈 모의 기능 사용
편의성과 테스트 가능성의 균형: SDK는 훌륭한 개발자 경험을 제공하지만 특정 테스트 접근 방식을 더 어렵게 만들 수 있습니다. 애플리케이션을 설계할 때 이러한 절충안을 고려해 볼 가치가 있습니다.

앞으로

아직 테스트 과제를 완전히 해결하지는 못했지만 이 경험을 통해 SDK를 통해 외부 서비스에 의존하는 애플리케이션 테스트에 대한 귀중한 교훈을 얻었습니다. 유사한 애플리케이션을 구축하는 사람에게는 다음을 권장합니다.

SDK와 직접 API 호출 중에서 선택할 때 테스트 전략을 고려하세요
SDK를 사용하는 경우 HTTP 수준이 아닌 SDK 수준에서 모의하도록 계획하세요
SDK 주위에 얇은 래퍼를 작성하여 테스트 가능성을 높이는 것을 고려하세요
프로젝트에 참여하는 다른 사람들을 위해 테스트 접근 방식을 문서화하세요

결론

LLM 애플리케이션 테스트는 특히 SDK와 같은 현대적인 개발 편의성과 철저한 테스트의 필요성 사이의 균형을 맞출 때 독특한 과제를 제시합니다. gimme_readme의 테스트 적용 범위를 개선하기 위해 계속 노력하고 있는 동안, 이 경험을 통해 외부 서비스 및 SDK가 포함된 향후 프로젝트에서 테스트에 접근하는 방법을 더 잘 이해할 수 있게 되었습니다.

LLM SDK를 사용하는 애플리케이션을 테스트할 때 비슷한 문제를 겪은 사람이 있습니까? 댓글로 여러분의 경험과 해결책을 듣고 싶습니다!

위 내용은 LLM 애플리케이션 테스트: 모의 SDK와 직접 HTTP 요청의 오해의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

관련 기사

JavaScript 프레임 워크 : 현대적인 웹 개발 파워May 02, 2025 am 12:04 AM

JavaScript 프레임 워크의 힘은 개발 단순화, 사용자 경험 및 응용 프로그램 성능을 향상시키는 데 있습니다. 프레임 워크를 선택할 때 : 1. 프로젝트 규모와 복잡성, 2. 팀 경험, 3. 생태계 및 커뮤니티 지원.

JavaScript, C 및 브라우저의 관계May 01, 2025 am 12:06 AM

서론 나는 당신이 이상하다는 것을 알고 있습니다. JavaScript, C 및 Browser는 정확히 무엇을해야합니까? 그들은 관련이없는 것처럼 보이지만 실제로는 현대 웹 개발에서 매우 중요한 역할을합니다. 오늘 우리는이 세 가지 사이의 밀접한 관계에 대해 논의 할 것입니다. 이 기사를 통해 브라우저에서 JavaScript가 어떻게 실행되는지, 브라우저 엔진의 C 역할 및 웹 페이지의 렌더링 및 상호 작용을 유도하기 위해 함께 작동하는 방법을 알게됩니다. 우리는 모두 JavaScript와 브라우저의 관계를 알고 있습니다. JavaScript는 프론트 엔드 개발의 핵심 언어입니다. 브라우저에서 직접 실행되므로 웹 페이지를 생생하고 흥미롭게 만듭니다. 왜 Javascr

Node.js는 TypeScript가있는 스트림입니다Apr 30, 2025 am 08:22 AM

Node.js는 크림 덕분에 효율적인 I/O에서 탁월합니다. 스트림은 메모리 오버로드를 피하고 큰 파일, 네트워크 작업 및 실시간 애플리케이션을위한 메모리 과부하를 피하기 위해 데이터를 점차적으로 처리합니다. 스트림을 TypeScript의 유형 안전과 결합하면 Powe가 생성됩니다

Python vs. JavaScript : 성능 및 효율성 고려 사항Apr 30, 2025 am 12:08 AM

파이썬과 자바 스크립트 간의 성능과 효율성의 차이는 주로 다음과 같이 반영됩니다. 1) 해석 된 언어로서, 파이썬은 느리게 실행되지만 개발 효율이 높고 빠른 프로토 타입 개발에 적합합니다. 2) JavaScript는 브라우저의 단일 스레드로 제한되지만 멀티 스레딩 및 비동기 I/O는 Node.js의 성능을 향상시키는 데 사용될 수 있으며 실제 프로젝트에서는 이점이 있습니다.

JavaScript의 기원 : 구현 언어 탐색Apr 29, 2025 am 12:51 AM

JavaScript는 1995 년에 시작하여 Brandon Ike에 의해 만들어졌으며 언어를 C로 실현했습니다. 1.C Language는 JavaScript의 고성능 및 시스템 수준 프로그래밍 기능을 제공합니다. 2. JavaScript의 메모리 관리 및 성능 최적화는 C 언어에 의존합니다. 3. C 언어의 크로스 플랫폼 기능은 자바 스크립트가 다른 운영 체제에서 효율적으로 실행하는 데 도움이됩니다.

무대 뒤에서 : 어떤 언어의 힘이 자바 스크립트입니까?Apr 28, 2025 am 12:01 AM

JavaScript는 브라우저 및 Node.js 환경에서 실행되며 JavaScript 엔진을 사용하여 코드를 구문 분석하고 실행합니다. 1) 구문 분석 단계에서 초록 구문 트리 (AST)를 생성합니다. 2) 컴파일 단계에서 AST를 바이트 코드 또는 기계 코드로 변환합니다. 3) 실행 단계에서 컴파일 된 코드를 실행하십시오.

파이썬과 자바 스크립트의 미래 : 트렌드와 예측Apr 27, 2025 am 12:21 AM

Python 및 JavaScript의 미래 추세에는 다음이 포함됩니다. 1. Python은 과학 컴퓨팅 분야에서의 위치를 통합하고 AI, 2. JavaScript는 웹 기술의 개발을 촉진하고, 3. 교차 플랫폼 개발이 핫한 주제가되고 4. 성능 최적화가 중점을 둘 것입니다. 둘 다 해당 분야에서 응용 프로그램 시나리오를 계속 확장하고 성능이 더 많은 혁신을 일으킬 것입니다.

Python vs. JavaScript : 개발 환경 및 도구Apr 26, 2025 am 12:09 AM

개발 환경에서 Python과 JavaScript의 선택이 모두 중요합니다. 1) Python의 개발 환경에는 Pycharm, Jupyternotebook 및 Anaconda가 포함되어 있으며 데이터 과학 및 빠른 프로토 타이핑에 적합합니다. 2) JavaScript의 개발 환경에는 Node.js, VScode 및 Webpack이 포함되어 있으며 프론트 엔드 및 백엔드 개발에 적합합니다. 프로젝트 요구에 따라 올바른 도구를 선택하면 개발 효율성과 프로젝트 성공률이 향상 될 수 있습니다.

See all articles

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

맨티스BT

Mantis는 제품 결함 추적을 돕기 위해 설계된 배포하기 쉬운 웹 기반 결함 추적 도구입니다. PHP, MySQL 및 웹 서버가 필요합니다. 데모 및 호스팅 서비스를 확인해 보세요.

Eclipse용 SAP NetWeaver 서버 어댑터

Eclipse를 SAP NetWeaver 애플리케이션 서버와 통합합니다.

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

MinGW - Windows용 미니멀리스트 GNU

이 프로젝트는 osdn.net/projects/mingw로 마이그레이션되는 중입니다. 계속해서 그곳에서 우리를 팔로우할 수 있습니다. MinGW: GCC(GNU Compiler Collection)의 기본 Windows 포트로, 기본 Windows 애플리케이션을 구축하기 위한 무료 배포 가능 가져오기 라이브러리 및 헤더 파일로 C99 기능을 지원하는 MSVC 런타임에 대한 확장이 포함되어 있습니다. 모든 MinGW 소프트웨어는 64비트 Windows 플랫폼에서 실행될 수 있습니다.