cari
Rumahweb3.0Inferens AI Masa Nyata pada Skala dengan Soket Web dan Objek Tahan Lama

Inferens AI Masa Nyata pada Skala dengan Soket Web dan Objek Tahan Lama

Nov 20, 2024 am 09:08 AM
authenticationDurable Objects WebSockets AI Gateway

Pada Oktober 2024, kami telah membincangkan tentang menyimpan berbilion-bilion log daripada aplikasi AI anda menggunakan AI Gateway, dan cara kami menggunakan Platform Pembangun Cloudflare untuk melakukan ini.

Inferens AI Masa Nyata pada Skala dengan Soket Web dan Objek Tahan Lama

Pada Oktober 2024, kami membincangkan cara menyimpan berbilion-bilion log daripada aplikasi AI anda menggunakan AI Gateway, dan cara kami menggunakan Platform Pembangun Cloudflare untuk melakukan ini.

Dengan AI Gateway sudah memproses lebih 3 bilion log dan mengalami pertumbuhan pesat, bilangan sambungan ke platform terus meningkat dengan stabil. Untuk membantu pembangun mengurus skala ini dengan lebih berkesan, kami ingin menawarkan alternatif untuk melaksanakan HTTP/2 keep-alive untuk mengekalkan sambungan HTTP(S) yang berterusan, dengan itu mengelakkan overhed jabat tangan berulang dan rundingan TLS dengan setiap sambungan HTTP baharu ke AI Gateway . Kami faham bahawa melaksanakan HTTP/2 boleh menimbulkan cabaran, terutamanya apabila banyak perpustakaan dan alatan mungkin tidak menyokongnya secara lalai dan kebanyakan bahasa pengaturcaraan moden mempunyai perpustakaan WebSocket yang mantap tersedia.

Dengan mengambil kira perkara ini, kami menggunakan Platform Pembangun Cloudflare dan Objek Tahan Lama (ya, sekali lagi!) untuk membina API WebSockets yang mewujudkan sambungan tunggal yang berterusan, membolehkan komunikasi berterusan.

Melalui API ini, semua penyedia AI yang disokong oleh AI Gateway boleh diakses melalui WebSocket, membolehkan anda mengekalkan satu sambungan TCP antara aplikasi klien atau pelayan anda dan AI Gateway. Bahagian yang terbaik? Walaupun pembekal pilihan anda tidak menyokong WebSockets, kami mengendalikannya untuk anda, menguruskan permintaan kepada pembekal AI pilihan anda.

Dengan menyambung melalui WebSocket ke AI Gateway, kami membuat permintaan kepada perkhidmatan inferens untuk anda menggunakan protokol yang disokong penyedia (HTTPS, WebSocket, dll.), dan anda boleh memastikan sambungan terbuka untuk melaksanakan seberapa banyak permintaan inferens seperti yang anda mahu.

Untuk menjadikan sambungan anda ke AI Gateway lebih selamat, kami juga memperkenalkan pengesahan untuk AI Gateway. API WebSockets baharu akan memerlukan pengesahan. Apa yang anda perlu lakukan ialah mencipta token Cloudflare API dengan kebenaran “AI Gateway: Run” dan hantarkannya dalam pengepala cf-aig-authorization.

Dalam rajah alir di atas:

1. Apabila Gerbang Disahkan didayakan dan token yang sah disertakan, permintaan akan berjaya diluluskan.

2. Jika Gerbang Disahkan didayakan, tetapi permintaan tidak mengandungi pengepala kebenaran cf-aig yang diperlukan dengan token yang sah, permintaan itu akan gagal. Ini memastikan hanya permintaan yang disahkan melalui get laluan.

3. Apabila Gerbang Disahkan dilumpuhkan, pengepala cf-aig-authorization dipintas sepenuhnya dan sebarang token — sama ada sah atau tidak sah — diabaikan.

Cara kami membinanya

Kami baru-baru ini menggunakan Objek Tahan Lama (DO) untuk menskalakan penyelesaian pengelogan kami untuk AI Gateway, jadi menggunakan WebSockets dalam DO yang sama adalah kesesuaian semula jadi.

Apabila sambungan WebSocket baharu diterima oleh Cloudflare Workers kami, kami melaksanakan pengesahan dalam dua cara untuk menyokong pelbagai keupayaan pelanggan WebSocket. Kaedah utama melibatkan pengesahan token Cloudflare API melalui pengepala cf-aig-authorization, memastikan token itu sah untuk akaun penghubung dan get laluan.

Walau bagaimanapun, disebabkan oleh pengehadan dalam pelaksanaan WebSocket penyemak imbas, kami juga menyokong pengesahan melalui pengepala "sec-websocket-protocol". Pelanggan WebSocket Penyemak Imbas tidak membenarkan pengepala tersuai dalam API standard mereka, merumitkan penambahan token pengesahan dalam permintaan. Walaupun kami tidak mengesyorkan anda menyimpan kunci API dalam penyemak imbas, kami memutuskan untuk menambah kaedah ini untuk menambahkan lebih banyak kefleksibelan kepada semua pelanggan WebSocket.

Selepas langkah pengesahan awal ini, kami meningkatkan sambungan kepada Objek Tahan Lama, bermakna ia kini akan mengendalikan semua mesej untuk sambungan. Sebelum sambungan baharu diterima sepenuhnya, kami menjana UUID rawak, jadi sambungan ini boleh dikenal pasti antara semua mesej yang diterima oleh Objek Tahan Lama. Semasa sambungan terbuka, sebarang tetapan Gerbang AI yang diluluskan melalui pengepala — seperti cf-aig-skip-cache (yang memintas cache apabila ditetapkan kepada benar) — disimpan dan digunakan pada semua permintaan dalam sesi. Walau bagaimanapun, pengepala ini masih boleh ditindih atas dasar setiap permintaan, sama seperti dengan Titik Akhir Universal hari ini.

Cara ia berfungsi

Setelah sambungan diwujudkan, Objek Tahan Lama mula mendengar mesej masuk. Mulai saat ini, pengguna boleh menghantar mesej dalam format universal AI Gateway melalui WebSocket, memudahkan peralihan aplikasi anda daripada persediaan HTTP sedia ada kepada komunikasi berasaskan WebSockets.

Apabila mesej baharu sampai ke Objek Tahan Lama, ia diproses menggunakan kod yang sama yang menggerakkan Titik Akhir Universal HTTP, membolehkan penggunaan semula kod lancar merentas Pekerja dan Objek Tahan Lama — salah satu faedah utama membina Cloudflare.

Untuk permintaan bukan penstriman, respons dibungkus dalam sampul JSON, membolehkan kami memasukkan maklumat tambahan di luar inferens AI itu sendiri, seperti ID log AI Gateway untuk permintaan itu.

Berikut ialah contoh jawapan untuk permintaan di atas:

Untuk permintaan penstriman, AI Gateway menghantar mesej awal dengan metadata permintaan memberitahu pembangun strim itu bermula.

Selepas mesej awal ini, semua bahagian penstriman disampaikan dalam masa nyata kepada sambungan WebSocket apabila ia tiba daripada pembekal inferens. Ambil perhatian bahawa hanya medan eventId disertakan dalam metadata untuk potongan penstriman ini (maklumat lanjut tentang medan baharu ini di bawah).

Pendekatan ini mempunyai dua tujuan:

Atas ialah kandungan terperinci Inferens AI Masa Nyata pada Skala dengan Soket Web dan Objek Tahan Lama. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Harga token rangkaian PI telah meningkat lebih daripada 14% sejak seminggu yang lalu.Harga token rangkaian PI telah meningkat lebih daripada 14% sejak seminggu yang lalu.Apr 16, 2025 am 11:22 AM

Pada masa akhbar, PI didagangkan pada $ 0.6711 selepas integrasinya dengan ChainLink pada 12 April. Pengumuman itu menyebabkan lonjakan harga pi

Lebih banyak alasan untuk menaikkan harga Sui sebagai harga memasuki zon belian utamaLebih banyak alasan untuk menaikkan harga Sui sebagai harga memasuki zon belian utamaApr 16, 2025 am 11:20 AM

Seorang penganalisis mengenai X, Frigg, menyoroti pelbagai sebab untuk optimis mengenai trajektori harga rangkaian Sui.

Sentimen Bitcoin (BTC) menghidupkan kenaikan harga lebih dari $ 467 juta dari cryptocurrency telah ditarik balik dari pertukaran semalamSentimen Bitcoin (BTC) menghidupkan kenaikan harga lebih dari $ 467 juta dari cryptocurrency telah ditarik balik dari pertukaran semalamApr 16, 2025 am 11:18 AM

Berikutan data hari ini yang dikeluarkan oleh Intotheblock, sentimen di sekitar Bitcoin kelihatan semakin tinggi ke arah kenaikan harga.

Makmal Pergerakan dan Yayasan Rangkaian Pergerakan telah melancarkan siasatan bebas ke dalam penyelewengan pembuatan pasaran baru-baru ini yang berkaitan dengan token langkah.Makmal Pergerakan dan Yayasan Rangkaian Pergerakan telah melancarkan siasatan bebas ke dalam penyelewengan pembuatan pasaran baru-baru ini yang berkaitan dengan token langkah.Apr 16, 2025 am 11:16 AM

NT Labs dan Yayasan Rangkaian Pergerakan melancarkan siasatan bebas ke dalam pemindahan pasaran yang membuat token

Gelombang modal mengalir keluar dari Ethereum [ETH] dan ke Tron [TRX]Gelombang modal mengalir keluar dari Ethereum [ETH] dan ke Tron [TRX]Apr 16, 2025 am 11:14 AM

Dengan $ 1.52 bilion di stablecoins yang berhijrah ke Tron, pelabur nampaknya memihak kepada rantai kos rendah dan mempelbagaikan di luar aset yang disokong USD tradisional.

Ketua Pegawai Eksekutif Mantra John Patrick Mullin membakar peruntukan token OM untuk memulihkan keyakinan pelaburKetua Pegawai Eksekutif Mantra John Patrick Mullin membakar peruntukan token OM untuk memulihkan keyakinan pelaburApr 16, 2025 am 11:12 AM

Ketua Pegawai Eksekutif Mantra, John Patrick Mullin telah mencadangkan membakar peruntukannya terhadap token OM dalam langkah yang bertujuan untuk memulihkan keyakinan pelabur selepas tanda protokol asli mengalami keruntuhan tajam.

Pergerakan pasaran dan analisis teknikal baru -baru ini mencadangkan bahawa Bonk mungkin berada di ambang lonjakan harga yang ketara, melampaui ekosistem Solana yang lebih luas.Pergerakan pasaran dan analisis teknikal baru -baru ini mencadangkan bahawa Bonk mungkin berada di ambang lonjakan harga yang ketara, melampaui ekosistem Solana yang lebih luas.Apr 16, 2025 am 11:10 AM

Persediaan teknikal untuk pemulihan harga bonk Menurut penganalisis Crypto yang terkenal Altcoin Sherpa, Bonk menunjukkan tanda -tanda pemulihan yang berpotensi.

Securitize memperoleh perniagaan pentadbiran dana MG Stover untuk menjadi pentadbir dana aset digital terbesarSecuritize memperoleh perniagaan pentadbiran dana MG Stover untuk menjadi pentadbir dana aset digital terbesarApr 16, 2025 am 11:08 AM

Securitize, salah satu penerbit aset yang terbesar, pada hari Selasa ia telah memperoleh perniagaan pentadbiran dana MG Stover

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
1 bulan yang laluBy尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
1 bulan yang laluBy尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa
1 bulan yang laluBy尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Arahan sembang dan cara menggunakannya
1 bulan yang laluBy尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

Muat turun versi mac editor Atom

Muat turun versi mac editor Atom

Editor sumber terbuka yang paling popular

Penyesuai Pelayan SAP NetWeaver untuk Eclipse

Penyesuai Pelayan SAP NetWeaver untuk Eclipse

Integrasikan Eclipse dengan pelayan aplikasi SAP NetWeaver.

SecLists

SecLists

SecLists ialah rakan penguji keselamatan muktamad. Ia ialah koleksi pelbagai jenis senarai yang kerap digunakan semasa penilaian keselamatan, semuanya di satu tempat. SecLists membantu menjadikan ujian keselamatan lebih cekap dan produktif dengan menyediakan semua senarai yang mungkin diperlukan oleh penguji keselamatan dengan mudah. Jenis senarai termasuk nama pengguna, kata laluan, URL, muatan kabur, corak data sensitif, cangkerang web dan banyak lagi. Penguji hanya boleh menarik repositori ini ke mesin ujian baharu dan dia akan mempunyai akses kepada setiap jenis senarai yang dia perlukan.

VSCode Windows 64-bit Muat Turun

VSCode Windows 64-bit Muat Turun

Editor IDE percuma dan berkuasa yang dilancarkan oleh Microsoft