Menguji Aplikasi LLM: Kesalahan dalam SDK Mengejek vs Permintaan HTTP Terus-tutorial js-php.cn

Rumah

hujung hadapan web

tutorial js

Menguji Aplikasi LLM: Kesalahan dalam SDK Mengejek vs Permintaan HTTP Terus

Barbara Streisand

Dec 04, 2024 am 11:03 AM

Testing LLM Applications: Misadventures in Mocking SDKs vs Direct HTTP Requests

pengenalan

Izinkan saya mendahului blog ini dengan mengatakan ini bukan seperti blog saya yang lain di mana saya dapat melalui langkah-langkah yang saya ambil untuk menyelesaikan tugasan. Sebaliknya, ini lebih kepada refleksi tentang cabaran yang saya temui semasa cuba menambahkan ujian pada projek saya, gimme_readme dan perkara yang saya pelajari tentang menguji aplikasi berkuasa LLM sepanjang perjalanan.

Konteks

Minggu ini, saya dan rakan sekelas Pembangunan Sumber Terbuka ditugaskan untuk menambah ujian pada alatan baris perintah kami yang menggabungkan Model Bahasa Besar (LLM). Ini kelihatan mudah pada mulanya, tetapi ia membawa saya ke dalam lubang arnab dengan kerumitan ujian yang tidak saya jangkakan.

Perjalanan Ujian Saya

Pendekatan Awal

Apabila saya mula-mula membina gimme_readme, saya menambahkan beberapa ujian asas menggunakan Jest.js. Ujian ini agak mudah, memfokuskan terutamanya pada:

Mengesahkan output fungsi
Menyemak pengendalian ralat asas
Menguji fungsi utiliti mudah

Walaupun ujian ini memberikan beberapa liputan, mereka tidak menguji salah satu bahagian paling kritikal dalam aplikasi saya: interaksi LLM.

Cabaran: Menguji Interaksi LLM

Ketika saya cuba menambah ujian yang lebih komprehensif, saya mendapat kesedaran yang menarik tentang cara aplikasi saya berkomunikasi dengan LLM. Pada mulanya, saya fikir saya boleh menggunakan Nock.js untuk mengejek permintaan HTTP kepada model bahasa ini. Lagipun, itulah kehebatan Nock - memintas dan mengejek permintaan HTTP untuk ujian.

Walau bagaimanapun, saya mendapati bahawa cara saya menggunakan LLM menyukarkan saya untuk menulis ujian menggunakan Nock.

Dilema Permintaan SDK vs HTTP Terus

Di sinilah perkara menjadi menarik. Aplikasi saya menggunakan pelanggan SDK rasmi yang disediakan oleh perkhidmatan LLM seperti Gemini dan Groq Google. SDK ini bertindak sebagai lapisan abstraksi yang mengendalikan semua komunikasi HTTP di sebalik tabir. Walaupun ini menjadikan kod lebih bersih dan lebih mudah untuk digunakan dalam pengeluaran, ia mewujudkan cabaran ujian yang menarik.

Pertimbangkan dua pendekatan ini untuk melaksanakan fungsi LLM:

// Approach 1: Using SDK
const groq = new Groq({ apiKey });
const response = await groq.chat.completions.create({
  messages: [{ role: "user", content: prompt }],
  model: "mixtral-8x7b-32768"
});

// Approach 2: Direct HTTP requests
const response = await fetch('https://api.groq.com/v1/completions', {
  method: 'POST',
  headers: {
    'Authorization': `Bearer ${apiKey}`,
    'Content-Type': 'application/json'
  },
  body: JSON.stringify({
    messages: [{ role: "user", content: prompt }],
    model: "mixtral-8x7b-32768"
  })
});

Pendekatan SDK adalah lebih bersih dan memberikan pengalaman pembangun yang lebih baik, tetapi ia menjadikan alat mengejek HTTP tradisional seperti Nock kurang berguna. Permintaan HTTP berlaku di dalam SDK, menjadikannya lebih sukar untuk memintas dengan Nock.

Pengajaran

Pertimbangkan Strategi Pengujian Awal: Apabila memilih antara SDK dan permintaan HTTP langsung, pertimbangkan cara anda akan menguji pelaksanaan. Kadangkala kod pengeluaran "lebih bersih" mungkin menjadikan ujian lebih mencabar.
Pengujian SDK Memerlukan Alat Berbeza: Apabila menggunakan SDK, anda perlu mengejek pada tahap SDK dan bukannya tahap HTTP. Ini bermakna:
- Mengejek seluruh klien SDK
- Memfokus pada antara muka SDK dan bukannya permintaan HTTP
- Menggunakan keupayaan mengejek modul Jest dan bukannya pemintas HTTP
Imbangan Antara Kemudahan dan Kebolehujian: Walaupun SDK memberikan pengalaman pembangun yang hebat, mereka boleh menjadikan pendekatan ujian tertentu lebih sukar. Pertimbangan ini patut dipertimbangkan semasa mereka bentuk aplikasi anda.

Melangkah ke Hadapan

Walaupun saya masih belum menyelesaikan sepenuhnya cabaran ujian saya, pengalaman ini telah mengajar saya pelajaran berharga tentang menguji aplikasi yang bergantung pada perkhidmatan luaran melalui SDK. Bagi sesiapa yang membina aplikasi serupa, saya akan mengesyorkan:

Fikirkan tentang strategi ujian apabila memilih antara SDK dan panggilan API langsung
Jika menggunakan SDK, rancang untuk mengejek pada tahap SDK dan bukannya tahap HTTP
Pertimbangkan untuk menulis pembalut nipis di sekeliling SDK untuk menjadikannya lebih boleh diuji
Dokumenkan pendekatan ujian untuk orang lain yang mungkin mengusahakan projek

Kesimpulan

Menguji aplikasi LLM memberikan cabaran unik, terutamanya apabila mengimbangi kemudahan pembangunan moden seperti SDK dengan keperluan untuk ujian menyeluruh. Semasa saya masih berusaha untuk meningkatkan liputan ujian untuk gimme_readme, pengalaman ini telah memberikan saya pemahaman yang lebih baik tentang cara mendekati ujian dalam projek masa hadapan yang melibatkan perkhidmatan luaran dan SDK.

Adakah orang lain menghadapi cabaran yang sama semasa menguji aplikasi yang menggunakan LLM SDK? Saya ingin mendengar tentang pengalaman dan penyelesaian anda dalam ulasan!

Atas ialah kandungan terperinci Menguji Aplikasi LLM: Kesalahan dalam SDK Mengejek vs Permintaan HTTP Terus. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Artikel Berkaitan

Rangka Kerja JavaScript: Menguasai Pembangunan Web ModenMay 02, 2025 am 12:04 AM

Kuasa rangka kerja JavaScript terletak pada pembangunan yang memudahkan, meningkatkan pengalaman pengguna dan prestasi aplikasi. Apabila memilih rangka kerja, pertimbangkan: 1.

Hubungan antara JavaScript, C, dan penyemak imbasMay 01, 2025 am 12:06 AM

Pengenalan Saya tahu anda mungkin merasa pelik, apa sebenarnya yang perlu dilakukan oleh JavaScript, C dan penyemak imbas? Mereka seolah -olah tidak berkaitan, tetapi sebenarnya, mereka memainkan peranan yang sangat penting dalam pembangunan web moden. Hari ini kita akan membincangkan hubungan rapat antara ketiga -tiga ini. Melalui artikel ini, anda akan mempelajari bagaimana JavaScript berjalan dalam penyemak imbas, peranan C dalam enjin pelayar, dan bagaimana mereka bekerjasama untuk memacu rendering dan interaksi laman web. Kita semua tahu hubungan antara JavaScript dan penyemak imbas. JavaScript adalah bahasa utama pembangunan front-end. Ia berjalan secara langsung di penyemak imbas, menjadikan laman web jelas dan menarik. Adakah anda pernah tertanya -tanya mengapa Javascr

Aliran node.js dengan typescriptApr 30, 2025 am 08:22 AM

Node.js cemerlang pada I/O yang cekap, sebahagian besarnya terima kasih kepada aliran. Aliran memproses data secara berperingkat, mengelakkan beban memori-ideal untuk fail besar, tugas rangkaian, dan aplikasi masa nyata. Menggabungkan sungai dengan keselamatan jenis typescript mencipta powe

Python vs JavaScript: Pertimbangan Prestasi dan KecekapanApr 30, 2025 am 12:08 AM

Perbezaan prestasi dan kecekapan antara Python dan JavaScript terutamanya dicerminkan dalam: 1) sebagai bahasa yang ditafsirkan, Python berjalan perlahan tetapi mempunyai kecekapan pembangunan yang tinggi dan sesuai untuk pembangunan prototaip pesat; 2) JavaScript adalah terhad kepada benang tunggal dalam penyemak imbas, tetapi I/O multi-threading dan asynchronous boleh digunakan untuk meningkatkan prestasi dalam node.js, dan kedua-duanya mempunyai kelebihan dalam projek sebenar.

Asal JavaScript: Meneroka Bahasa PelaksanaannyaApr 29, 2025 am 12:51 AM

JavaScript berasal pada tahun 1995 dan dicipta oleh Brandon Ike, dan menyedari bahasa itu menjadi C. 1.C Language menyediakan keupayaan pengaturcaraan prestasi tinggi dan sistem untuk JavaScript. 2. Pengurusan memori JavaScript dan pengoptimuman prestasi bergantung pada bahasa C. 3. Ciri lintas platform bahasa C membantu JavaScript berjalan dengan cekap pada sistem operasi yang berbeza.

Di sebalik tabir: Apa bahasa JavaScript?Apr 28, 2025 am 12:01 AM

JavaScript berjalan dalam penyemak imbas dan persekitaran Node.js dan bergantung pada enjin JavaScript untuk menghuraikan dan melaksanakan kod. 1) menjana pokok sintaks abstrak (AST) di peringkat parsing; 2) menukar AST ke bytecode atau kod mesin dalam peringkat penyusunan; 3) Laksanakan kod yang disusun dalam peringkat pelaksanaan.

Masa Depan Python dan JavaScript: Trend dan RamalanApr 27, 2025 am 12:21 AM

Trend masa depan Python dan JavaScript termasuk: 1. Kedua -duanya akan terus mengembangkan senario aplikasi dalam bidang masing -masing dan membuat lebih banyak penemuan dalam prestasi.

Python vs JavaScript: Persekitaran dan Alat PembangunanApr 26, 2025 am 12:09 AM

Kedua -dua pilihan Python dan JavaScript dalam persekitaran pembangunan adalah penting. 1) Persekitaran pembangunan Python termasuk Pycharm, Jupyternotebook dan Anaconda, yang sesuai untuk sains data dan prototaip cepat. 2) Persekitaran pembangunan JavaScript termasuk node.js, vscode dan webpack, yang sesuai untuk pembangunan front-end dan back-end. Memilih alat yang betul mengikut keperluan projek dapat meningkatkan kecekapan pembangunan dan kadar kejayaan projek.

See all articles

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Tunjukkan Lagi

Artikel Panas

Apa yang Baru di Windows 11 KB5054979 & Cara Memperbaiki Masalah Kemas Kini

4 minggu yang laluByDDD

Bagaimana untuk memperbaiki KB5055523 gagal dipasang di Windows 11?

3 minggu yang laluByDDD

Inzoi: Cara Memohon ke Sekolah dan Universiti

1 bulan yang laluByDDD

Bagaimana untuk memperbaiki KB5055518 gagal dipasang di Windows 10?

3 minggu yang laluByDDD

Di mana untuk mencari kunci pejabat tapak di atomfall

1 bulan yang laluByDDD

Tunjukkan Lagi

Alat panas

Dreamweaver CS6

Alat pembangunan web visual

mPDF

mPDF ialah perpustakaan PHP yang boleh menjana fail PDF daripada HTML yang dikodkan UTF-8. Pengarang asal, Ian Back, menulis mPDF untuk mengeluarkan fail PDF "dengan cepat" dari tapak webnya dan mengendalikan bahasa yang berbeza. Ia lebih perlahan dan menghasilkan fail yang lebih besar apabila menggunakan fon Unicode daripada skrip asal seperti HTML2FPDF, tetapi menyokong gaya CSS dsb. dan mempunyai banyak peningkatan. Menyokong hampir semua bahasa, termasuk RTL (Arab dan Ibrani) dan CJK (Cina, Jepun dan Korea). Menyokong elemen peringkat blok bersarang (seperti P, DIV),