Set alat pembangunan model yang besar telah dicipta!
Kandungan yang perlu ditulis semula ialah: Pengarang Richard MacManus
Perancangan | Yan Zheng
Web3 gagal menumbangkan Web2, tetapi timbunan pembangunan model besar yang muncul adalah membenarkan Pembangun beralih daripada era "asli awan" kepada timbunan teknologi AI baharu.
Jurutera yang pantas mungkin tidak dapat menyentuh saraf pembangun untuk tergesa-gesa ke model besar, tetapi perkataan dari pengurus produk atau pemimpin: Bolehkah "ejen" dibangunkan, bolehkah "rantai" menjadi dilaksanakan, "Vektor mana yang hendak digunakan" "Pangkalan Data" telah menjadi titik sukar untuk memacu pelajar teknologi dalam syarikat aplikasi model besar arus perdana untuk mengatasi pembangunan AI generatif.
Apakah lapisan tindanan teknologi yang muncul? Di manakah bahagian yang paling sukar? Artikel ini akan membawa anda untuk mengetahui
1 Timbunan teknologi perlu dikemas kini. telah muncul, seperti LangChain dan LlamaIndex, yang menjadikan ekosistem pembangun aplikasi AI mula matang. Malah kini terdapat istilah yang digunakan untuk menggambarkan mereka yang menumpukan kepada pembangunan kecerdasan buatan, iaitu "jurutera AI". Menurut Shawn @swyx Wang, ini adalah langkah seterusnya untuk "jurutera segera". Dia juga mencipta carta koordinat yang menggambarkan tempat jurutera AI sesuai dengan ekosistem kecerdasan buatan yang lebih luas Sumber: swyx
Model bahasa berskala besar (LLM) ialah teknologi teras jurutera AI. Bukan kebetulan bahawa kedua-dua LangChain dan LlamaIndex adalah alat yang memanjangkan dan melengkapkan LLM. Tetapi apakah alat lain yang tersedia untuk pembangun generasi baharu ini?Rajah timbunan LLM terbaik yang saya lihat setakat ini adalah daripada firma modal teroka Andreessen Horowitz (a16z). Inilah pendapatnya tentang "Timbunan apl LLM":
Sumber imej: a16z
#🎜🎜, Ya🎜 , lapisan atas ialah data Dalam tindanan teknologi LLM, data ialah komponen yang paling penting, ini sangat jelas. Menurut carta a16z, data berada di bahagian atas. Dalam LLM, "model terbenam" ialah kawasan yang sangat kritikal, dan anda boleh memilih daripada OpenAI, Cohere, Hugging Face atau berpuluh-puluh pilihan LLM lain, termasuk sumber terbuka yang semakin popular LLM#🎜 🎜#Sebelum menggunakan LLM , anda juga perlu mewujudkan "talian paip data". Sebagai contoh, pertimbangkan Databricks dan Airflow sebagai dua contoh, atau data boleh diproses "tidak berstruktur". Ini juga terpakai pada keberkalaan data dan boleh membantu syarikat "membersihkan" atau hanya menyusun data sebelum memasukkannya ke dalam LLM tersuai. Syarikat "Kecerdasan Data" seperti Alation menawarkan perkhidmatan jenis ini, yang kelihatan seperti alat seperti "Kecerdasan Perniagaan" yang lebih dikenali dalam timbunan teknologi IT
Bahagian terakhir lapisan data ialah Pangkalan data vektor popular terkini untuk menyimpan dan memproses data LLM. Menurut definisi Microsoft, ini ialah pangkalan data yang menyimpan data sebagai vektor dimensi tinggi, yang merupakan perwakilan matematik bagi ciri atau atribut. Data disimpan sebagai vektor menggunakan teknologi benam Dalam sembang media, vendor pangkalan data vektor terkemuka Pinecone menyatakan bahawa alatan mereka sering digunakan dengan alatan saluran paip data seperti Databricks. Dalam kes ini, data biasanya disimpan di tempat lain (seperti tasik data) dan kemudian diubah menjadi data terbenam melalui model pembelajaran mesin. Selepas memproses dan menggunting, vektor yang terhasil dihantar ke Pinecone
3, gesaan dan pertanyaan
Dua peringkat seterusnya boleh diringkaskan sebagai gesaan dan pertanyaan - ini Adalah titik interaksi untuk aplikasi AI antara muka dengan LLM dan (pilihan) alatan data lain. A16z meletakkan LangChain dan LlamaIndex sebagai "rangka kerja orkestra", bermakna apabila pembangun memahami LLM yang mereka gunakan, mereka boleh memanfaatkan alatan ini
Menurut a16z, alatan seperti LangChain dan LlamaIndex Rangka kerja orkestra "menjauhkan diri banyak butiran pautan segera," yang bermaksud menanya dan mengurus data antara aplikasi dan LLM. Proses orkestrasi ini termasuk berinteraksi dengan antara muka API luaran, mendapatkan semula data konteks daripada pangkalan data vektor dan mengekalkan memori merentas berbilang panggilan LLM. Kotak yang paling menarik dalam rajah a16z ialah "Taman Permainan", yang merangkumi OpenAI, nat.dev dan Humanloop Ia membantu pembangun melaksanakan apa yang A16z panggil "cue jiu-jitsu." Di tempat ini, pembangun boleh bereksperimen dengan pelbagai teknik dorongan.
Humanloop ialah sebuah syarikat British dan ciri platformnya ialah "ruang kerja segera kolaboratif". Ia seterusnya menggambarkan dirinya sebagai "kit alat pembangunan lengkap untuk fungsi LLM pengeluaran." Jadi pada asasnya ia membolehkan anda mencuba barangan LLM dan kemudian gunakannya ke dalam aplikasi anda jika ia berfungsi
4. Operasi talian pemasangan: LLMOps
Pada masa ini, susun atur barisan pengeluaran berskala besar semakin jelas. Di sebelah kanan kotak orkestra, terdapat banyak kotak operasi, termasuk caching dan pengesahan LLM. Di samping itu, terdapat pelbagai perkhidmatan awan dan perkhidmatan API yang berkaitan dengan LLM, termasuk repositori API terbuka seperti Hugging Face, dan penyedia API proprietari seperti OpenAI
Ini mungkin perkembangan yang biasa kita lakukan dalam "cloud native" era Perkara yang paling serupa dalam timbunan teknologi manusia ialah banyak syarikat DevOps telah menambahkan kecerdasan buatan pada senarai produk mereka, yang bukan kebetulan. Pada bulan Mei, saya bercakap dengan Ketua Pegawai Eksekutif Harness, Jyoti Bansal. Harness menjalankan "platform penghantaran perisian" yang memfokuskan pada bahagian "CD" proses CI/CD.
Bansai memberitahu saya bahawa AI boleh mengurangkan tugas yang membosankan dan berulang yang terlibat dalam kitaran hayat penghantaran perisian, daripada menjana spesifikasi berdasarkan fungsi sedia ada kepada menulis kod. Selain itu, beliau berkata AI boleh mengautomasikan semakan kod, ujian kerentanan, pembetulan pepijat, dan juga mencipta saluran paip CI/CD untuk binaan dan penggunaan. Menurut perbualan lain yang saya ada pada bulan Mei, AI juga mengubah produktiviti pembangun. Trisha Gee daripada alat automasi binaan Gradle memberitahu saya bahawa AI boleh mempercepatkan pembangunan dengan mengurangkan masa pada tugasan berulang, seperti menulis kod boilerplate dan membenarkan pembangun menumpukan pada gambaran besar, seperti memastikan kod memenuhi keperluan perniagaan.
5. Web3 sudah keluar, timbunan pembangunan model besar ada di sini
Dalam timbunan teknologi pembangunan LLM yang baru muncul, kita boleh melihat satu siri jenis produk baharu, seperti rangka kerja orkestrasi (seperti LangChain dan LlamaIndex), pangkalan data vektor dan Humanloop Menunggu platform "taman permainan". Semua produk ini memanjangkan dan/atau menambah teknologi teras era semasa: model bahasa besar
Sama seperti kebangkitan alatan era asli awan seperti Spring Cloud dan Kubernetes pada tahun-tahun sebelumnya. Walau bagaimanapun, pada masa ini, hampir semua perusahaan besar, kecil dan terkemuka dalam era asal awan cuba yang terbaik untuk menyesuaikan alat mereka kepada kejuruteraan AI, yang akan sangat bermanfaat kepada pembangunan tindanan teknologi LLM pada masa hadapan.
Ya, model besar kali ini seperti "berdiri di atas bahu gergasi". Mungkin itulah sebabnya revolusi "Web3" gagal - ia tidak begitu banyak membina generasi sebelumnya seperti cuba merampasnya.
Timbunan teknologi LLM nampaknya telah melakukannya, ia telah menjadi jambatan daripada era pembangunan awan kepada ekosistem pembangun berasaskan kecerdasan buatan yang lebih baharu
Pautan rujukan: https://www.php.cn/link/ c589c3a8f99401b24b9380e86d939842
Atas ialah kandungan terperinci Set alat pembangunan model yang besar telah dicipta!. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Memanfaatkan kuasa AI di peranti: Membina CLI Chatbot Peribadi Pada masa lalu, konsep pembantu AI peribadi kelihatan seperti fiksyen sains. Bayangkan Alex, seorang peminat teknologi, bermimpi seorang sahabat AI yang pintar, yang tidak bergantung

Pelancaran AI4MH mereka berlaku pada 15 April, 2025, dan Luminary Dr. Tom Insel, M.D., pakar psikiatri yang terkenal dan pakar neurosains, berkhidmat sebagai penceramah kick-off. Dr. Insel terkenal dengan kerja cemerlangnya dalam penyelidikan kesihatan mental dan techno

"Kami mahu memastikan bahawa WNBA kekal sebagai ruang di mana semua orang, pemain, peminat dan rakan kongsi korporat, berasa selamat, dihargai dan diberi kuasa," kata Engelbert, menangani apa yang telah menjadi salah satu cabaran sukan wanita yang paling merosakkan. Anno

Pengenalan Python cemerlang sebagai bahasa pengaturcaraan, terutamanya dalam sains data dan AI generatif. Manipulasi data yang cekap (penyimpanan, pengurusan, dan akses) adalah penting apabila berurusan dengan dataset yang besar. Kami pernah meliputi nombor dan st

Sebelum menyelam, kaveat penting: Prestasi AI adalah spesifik yang tidak ditentukan dan sangat digunakan. Dalam istilah yang lebih mudah, perbatuan anda mungkin berbeza -beza. Jangan ambil artikel ini (atau lain -lain) sebagai perkataan akhir -sebaliknya, uji model ini pada senario anda sendiri

Membina portfolio AI/ML yang menonjol: Panduan untuk Pemula dan Profesional Mewujudkan portfolio yang menarik adalah penting untuk mendapatkan peranan dalam kecerdasan buatan (AI) dan pembelajaran mesin (ML). Panduan ini memberi nasihat untuk membina portfolio

Hasilnya? Pembakaran, ketidakcekapan, dan jurang yang melebar antara pengesanan dan tindakan. Tak satu pun dari ini harus datang sebagai kejutan kepada sesiapa yang bekerja dalam keselamatan siber. Janji Agentic AI telah muncul sebagai titik perubahan yang berpotensi. Kelas baru ini

Impak segera berbanding perkongsian jangka panjang? Dua minggu yang lalu Openai melangkah ke hadapan dengan tawaran jangka pendek yang kuat, memberikan akses kepada pelajar A.S. dan Kanada.


Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

MinGW - GNU Minimalis untuk Windows
Projek ini dalam proses untuk dipindahkan ke osdn.net/projects/mingw, anda boleh terus mengikuti kami di sana. MinGW: Port Windows asli bagi GNU Compiler Collection (GCC), perpustakaan import yang boleh diedarkan secara bebas dan fail pengepala untuk membina aplikasi Windows asli termasuk sambungan kepada masa jalan MSVC untuk menyokong fungsi C99. Semua perisian MinGW boleh dijalankan pada platform Windows 64-bit.

DVWA
Damn Vulnerable Web App (DVWA) ialah aplikasi web PHP/MySQL yang sangat terdedah. Matlamat utamanya adalah untuk menjadi bantuan bagi profesional keselamatan untuk menguji kemahiran dan alatan mereka dalam persekitaran undang-undang, untuk membantu pembangun web lebih memahami proses mengamankan aplikasi web, dan untuk membantu guru/pelajar mengajar/belajar dalam persekitaran bilik darjah Aplikasi web keselamatan. Matlamat DVWA adalah untuk mempraktikkan beberapa kelemahan web yang paling biasa melalui antara muka yang mudah dan mudah, dengan pelbagai tahap kesukaran. Sila ambil perhatian bahawa perisian ini

SecLists
SecLists ialah rakan penguji keselamatan muktamad. Ia ialah koleksi pelbagai jenis senarai yang kerap digunakan semasa penilaian keselamatan, semuanya di satu tempat. SecLists membantu menjadikan ujian keselamatan lebih cekap dan produktif dengan menyediakan semua senarai yang mungkin diperlukan oleh penguji keselamatan dengan mudah. Jenis senarai termasuk nama pengguna, kata laluan, URL, muatan kabur, corak data sensitif, cangkerang web dan banyak lagi. Penguji hanya boleh menarik repositori ini ke mesin ujian baharu dan dia akan mempunyai akses kepada setiap jenis senarai yang dia perlukan.

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma