検索
ホームページウェブ3.0WebSocket と永続オブジェクトを使用した大規模なリアルタイム AI 推論

WebSocket と永続オブジェクトを使用した大規模なリアルタイム AI 推論

Nov 20, 2024 am 09:08 AM
authenticationDurable Objects WebSockets AI Gateway

2024 年 10 月に、AI Gateway を使用して AI アプリケーションから数十億のログを保存することと、これを行うために Cloudflare の開発者プラットフォームをどのように使用するかについて説明しました。

WebSocket と永続オブジェクトを使用した大規模なリアルタイム AI 推論

2024 年 10 月に、AI Gateway を使用して AI アプリケーションから数十億のログを保存する方法と、これを行うために Cloudflare の開発者プラットフォームを使用する方法について説明しました。

AI Gateway はすでに 30 億を超えるログを処理し、急速に成長しており、プラットフォームへの接続数は着実に増加し続けています。開発者がこの規模をより効果的に管理できるように、HTTP/2 キープアライブを実装して永続的な HTTP(S) 接続を維持する代替手段を提供したいと考えました。これにより、AI Gateway への新しい HTTP 接続ごとに繰り返されるハンドシェイクと TLS ネゴシエーションのオーバーヘッドが回避されます。 。私たちは、HTTP/2 の実装には課題が生じる可能性があることを理解しています。特に、多くのライブラリやツールがデフォルトで HTTP/2 をサポートしていない場合や、ほとんどの最新のプログラミング言語で十分に確立された WebSocket ライブラリが利用可能な場合には、課題が生じる可能性があります。

これを念頭に置いて、私たちは Cloudflare の開発者プラットフォームと Durable Objects (はい、また!) を使用して、単一の永続的な接続を確立し、継続的な通信を可能にする WebSocket API を構築しました。

この API を通じて、AI Gateway でサポートされているすべての AI プロバイダーに WebSocket 経由でアクセスできるため、クライアントまたはサーバー アプリケーションと AI Gateway の間で単一の TCP 接続を維持できます。一番いいところは?選択したプロバイダーが WebSocket をサポートしていない場合でも、当社が WebSocket を処理し、優先 AI プロバイダーへのリクエストを管理します。

WebSocket 経由で AI Gateway に接続すると、プロバイダーがサポートするプロトコル (HTTPS、WebSocket など) を使用して推論サービスにリクエストが行われます。接続を開いたままにして、必要なだけ推論リクエストを実行できます。

を希望します。

AI Gateway への接続をより安全にするために、AI Gateway の認証も導入しています。新しい WebSocket API には認証が必要です。必要なのは、「AI Gateway: Run」権限を持つ Cloudflare API トークンを作成し、それを cf-aig-authorization ヘッダーで送信することだけです。

上記のフロー図では:

1.認証されたゲートウェイが有効で、有効なトークンが含まれている場合、リクエストは正常に通過します。

2.認証されたゲートウェイが有効であっても、有効なトークンを含む必要な cf-aig-authorization ヘッダーがリクエストに含まれていない場合、リクエストは失敗します。これにより、検証されたリクエストのみがゲートウェイを通過することが保証されます。

3. Authenticated Gateway が無効になっている場合、cf-aig-authorization ヘッダーは完全にバイパスされ、有効か無効かにかかわらず、トークンは無視されます。

私たちがそれを構築した方法

私たちは最近、AI ゲートウェイのロギング ソリューションを拡張するためにデュラブル オブジェクト (DO) を使用したため、同じ DO 内で WebSocket を使用するのが自然でした。

Cloudflare ワーカーが新しい WebSocket 接続を受信すると、WebSocket クライアントの多様な機能をサポートするために 2 つの方法で認証を実装します。主な方法には、cf-aig-authorization ヘッダーを介して Cloudflare API トークンを検証し、接続するアカウントとゲートウェイに対してトークンが有効であることを確認することが含まれます。

ただし、ブラウザの WebSocket 実装の制限により、「sec-websocket-protocol」ヘッダーによる認証もサポートしています。ブラウザ WebSocket クライアントは標準 API でカスタム ヘッダーを許可しないため、リクエストへの認証トークンの追加が複雑になります。 API キーをブラウザーに保存することはお勧めしませんが、すべての WebSocket クライアントの柔軟性を高めるためにこの方法を追加することにしました。

この最初の検証ステップの後、接続を永続オブジェクトにアップグレードします。これは、接続のすべてのメッセージを処理できるようになることを意味します。新しい接続が完全に受け入れられる前に、ランダムな UUID が生成されるため、Durable Object が受信するすべてのメッセージの中でこの接続を識別できるようになります。接続が開いている間、ヘッダー経由で渡された AI Gateway 設定 (cf-aig-skip-cache (true に設定するとキャッシュをバイパスする) など) が保存され、セッション内のすべてのリクエストに適用されます。ただし、これらのヘッダーは、現在のユニバーサル エンドポイントと同様に、リクエストごとにオーバーライドできます。

仕組み

接続が確立されると、Durable Object は受信メッセージのリスニングを開始します。この時点から、ユーザーは WebSocket 経由で AI Gateway ユニバーサル形式でメッセージを送信できるようになり、既存の HTTP セットアップから WebSocket ベースの通信へのアプリケーションの移行が簡素化されます。

新しいメッセージが Durable Object に到達すると、HTTP Universal Endpoint を強化するのと同じコードを使用して処理され、Workers と Durable Object 間でのシームレスなコードの再利用が可能になります。これは、Cloudflare 上に構築する主な利点の 1 つです。

非ストリーミング リクエストの場合、レスポンスは JSON エンベロープでラップされ、そのリクエストの AI ゲートウェイ ログ ID など、AI 推論自体を超える追加情報を含めることができます。

上記のリクエストに対する応答の例を次に示します。

ストリーミング リクエストの場合、AI Gateway は、開発者にストリームが開始していることを伝えるリクエスト メタデータを含む最初のメッセージを送信します。

この最初のメッセージの後、すべてのストリーミング チャンクが推論プロバイダーから到着すると、リアルタイムで WebSocket 接続に中継されます。これらのストリーミング チャンクのメタデータには、eventId フィールドのみが含まれることに注意してください (この新しいフィールドの内容については、以下で詳しく説明します)。

このアプローチには 2 つの目的があります:

以上がWebSocket と永続オブジェクトを使用した大規模なリアルタイム AI 推論の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
無料視聴市場ソフトウェアWebサイトトップ10の無料表示市場ソフトウェアWebサイトは何ですか無料視聴市場ソフトウェアWebサイトトップ10の無料表示市場ソフトウェアWebサイトは何ですかApr 24, 2025 pm 02:21 PM

トップ10の無料ビュー市場ソフトウェアWebサイトが推奨されます:1。Binance、2。OKX、3。SesameOpen Door(Kucoin)、4。CoinmarketCap、5。Coingecko、6。TradingView、7。Investing.com、8。YahooFinance、9。GlassnodeStudio、10。

Binance Trading App公式Webサイトダウンロードポータルバイナンストレーディングアプリ公式ウェブサイトBinance Trading App公式Webサイトダウンロードポータルバイナンストレーディングアプリ公式ウェブサイトApr 24, 2025 pm 02:18 PM

Binanceの公式プラットフォームに安全にアクセスしてアプリをダウンロードするには、次の手順を使用できます。1)信頼できる検索エンジンを使用して「バイナンス」を検索し、ドメイン名を確認します。 2)公式のソーシャルメディアを表示してURLを取得します。 3)URLを確認するには、公式のカスタマーサービスに相談してください。 4)信頼できるナビゲーションWebサイトを使用します。アプリをダウンロードする手順には次のものがあります。1)Binanceの公式Webサイトにアクセス。 2)アプリのダウンロードポータルを見つけます。 3)ダウンロード方法を選択します(QRコードをスキャンし、App Storeをダウンロードし、APKファイルを直接ダウンロードします)。

OUYIトレーディングアプリ公式ウェブサイトダウンロードポータルOUYIトレーディングアプリ公式ウェブサイトOUYIトレーディングアプリ公式ウェブサイトダウンロードポータルOUYIトレーディングアプリ公式ウェブサイトApr 24, 2025 pm 02:15 PM

次の手順を通じて、OUYI公式プラットフォームに安全にアクセスしてアプリをダウンロードできます。1。信頼できる検索エンジンを使用して「OUYI」または「OKX」を検索してドメイン名を確認します。 2。公式のソーシャルメディアアカウントを確認して、URLを取得します。 3.公式のカスタマーサービスに相談して、URLを確認します。 4.信頼できるナビゲーションWebサイトを使用します。アプリをダウンロードするときは、公式ウェブサイトにアクセスし、ダウンロードポータルを見つけ、QRコード、APPストア、またはAPKファイルを直接ダウンロードする方法を選択し、開発者情報の確認、ユーザーレビューの表示、セキュリティソフトウェアのインストール、未知のソースからのフィッシングWebサイトやアプリの保護、個人情報の保護に注意してください。

バイナンスダウンロードリンクバイナンスダウンロードパスバイナンスダウンロードリンクバイナンスダウンロードパスApr 24, 2025 pm 02:12 PM

Binanceアプリを安全にダウンロードするには、公式チャネルを通過する必要があります。1。Binance公式Webサイトにアクセスして、アプリをダウンロードするポータルを見つけてクリックします。3。

OUYIダウンロードリンクOUYIダウンロードパスOUYIダウンロードリンクOUYIダウンロードパスApr 24, 2025 pm 02:09 PM

OKXアプリを安全にダウンロードする方法は次のとおりです。1。信頼できる検索エンジンを使用して、ドメイン名を検索して確認します。 2。公式のソーシャルメディアアカウントを確認し、認定ロゴを特定します。 3.公式のカスタマーサービスに相談して、リンクの信頼性を確認します。 4.信頼できるナビゲーションWebサイトを使用して、検証済みのダウンロードリンクを取得します。これらの手順を通じて、OUYIアプリを安全にダウンロードして、暗号通貨取引の旅を始めることができます。

OUYI Exchange OUYI Exchange登録チュートリアルでアカウントを登録する方法OUYI Exchange OUYI Exchange登録チュートリアルでアカウントを登録する方法Apr 24, 2025 pm 02:06 PM

OUYIアカウントを登録する手順は次のとおりです。1。有効な電子メールまたは携帯電話番号を準備し、ネットワークを安定させます。 2。OUYIの公式ウェブサイトにアクセスしてください。 3.登録ページを入力します。 4.電子メールまたは携帯電話番号を選択して、情報を登録して入力します。 5。検証コードを取得して入力します。 6。ユーザー契約に同意します。 7.登録を完了してログインし、KYCを実行してセキュリティ対策を設定します。

Binance Exchange Binance Exchange登録チュートリアルにアカウントを登録する方法Binance Exchange Binance Exchange登録チュートリアルにアカウントを登録する方法Apr 24, 2025 pm 02:03 PM

Binanceアカウントを登録する手順には次のものがあります。1。有効な電子メールまたは携帯電話番号と安定したネットワークを準備します。 2。Binance公式ウェブサイトにアクセスしてください。 3.登録ページを入力します。 4.登録方法を選択します。 5。登録情報を入力します。 6。ユーザー契約に同意します。 7。完全な検証。 8。検証コードを取得して入力します。 9。登録を完了します。

セサミオープンエクスチェンジにアカウントを登録する方法は?セサミオープンエクスチェンジの登録に関するチュートリアルセサミオープンエクスチェンジにアカウントを登録する方法は?セサミオープンエクスチェンジの登録に関するチュートリアルApr 24, 2025 pm 02:00 PM

セサミドアオープンアカウントを登録するには、7つの手順が必要です。1。有効な電子メールまたは携帯電話番号と安定したネットワークを準備します。 2。公式ウェブサイトにアクセスしてください。 3.登録ページを入力します。 4.登録方法を選択して入力します。 5。検証コードを取得して入力します。 6。ユーザー契約に同意します。 7.登録を完了してログインすると、KYCを実行してセキュリティ対策を設定することをお勧めします。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

SecLists

SecLists

SecLists は、セキュリティ テスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティ テスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティ テストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジング ペイロード、機密データ パターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテスト マシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。

SublimeText3 Linux 新バージョン

SublimeText3 Linux 新バージョン

SublimeText3 Linux 最新バージョン

DVWA

DVWA

Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

強力な PHP 統合開発環境

Safe Exam Browser

Safe Exam Browser

Safe Exam Browser は、オンライン試験を安全に受験するための安全なブラウザ環境です。このソフトウェアは、あらゆるコンピュータを安全なワークステーションに変えます。あらゆるユーティリティへのアクセスを制御し、学生が無許可のリソースを使用するのを防ぎます。