NVIDIA RTX グラフィックスカードは AI 推論を 5 倍高速化します。 RTX PC はローカルで大規模なモデルを簡単に処理できます-AI-php.cn

ホームページ

テクノロジー周辺機器

NVIDIA RTX グラフィックスカードは AI 推論を 5 倍高速化します。 RTX PC はローカルで大規模なモデルを簡単に処理できます

王林

Nov 17, 2023 pm 11:05 PM

Microsoft Iginte Global Technology Conference で、マイクロソフトは、開発者がハードウェアのパフォーマンスを最大限に活用し、AI アプリケーション分野を拡大できるよう支援することを目的として、一連の新しい AI 関連の最適化モデルと開発ツールリソースをリリースしました。

特に、現在 AI 分野で絶対的な支配的地位を占めている NVIDIA に対して、Microsoft は今回大きなギフトパッケージを送りました。

それが OpenAI Chat API 用の TensorRT-LLM パッケージングインターフェイスであれ、RTX であれ、主導的なパフォーマンスの向上 Llama 2 の DirectML およびその他の一般的なラージ言語モデル (LLM) は、より高速化され、NVIDIA ハードウェアに適用できます。

NVIDIA RTX显卡AI推理提速5倍！RTX PC轻松在本地搞定大模型

その中で、

TensorRT-LLM は、LLM 推論を高速化するために使用されるライブラリであり、AI 推論のパフォーマンスを大幅に向上させることができます。これは、より多くの言語モデルをサポートするために常に更新されており、オープンソースでもあります。

NVIDIA は 10 月に Windows プラットフォーム用の TensorRT-LLM をリリースしました。 RTX 30/40 シリーズ GPU グラフィックスカードを搭載したデスクトップおよびラップトップの場合、グラフィックスメモリが 8 GB 以上に達する限り、要求の厳しい AI ワークロードをより簡単に完了できます

Windows 用 Tensor RT-LLM は、新しいカプセル化インターフェイスを通じて OpenAI の人気のチャット API と互換性があるため、クラウドに接続する必要がなく、さまざまな関連アプリケーションをローカルで直接実行できるため、有益です。プライバシーの漏洩を防ぐために、PC 上の個人データや専有データを保護します。

TensorRT-LLM によって最適化された大規模な言語モデルである限り、Llama 2、Mistral、NV LLM などを含むこのパッケージ化インターフェイスで使用できます。

開発者にとっては、面倒なコードの書き換えや移植の必要がなく、

コードを 1 ～ 2 行変更するだけで、AI アプリケーションをローカルですばやく実行できます。

NVIDIA RTX显卡AI推理提速5倍！RTX PC轻松在本地搞定大模型 ↑↑↑TensorRT-LLM に基づく Microsoft Visual Studio コードプラグイン - Continue.dev コーディングアシスタント

TensorRT-LLM v0.6.0 は今月末に更新されます。これにより、RTX GPU での推論パフォーマンスが最大 5 倍向上します。

また、新しい The 7 を含む、より一般的な LLM をサポートします。 10 億パラメータの Mistral と 80 億パラメータの Nemotron-3 を使用すると、デスクトップとラップトップでいつでも迅速かつ正確に LLM をローカルで実行できます。実際の測定データによると、

RTX 4060 グラフィックスカードと TenroRT-LLM を組み合わせた場合、推論パフォーマンスは 1 秒あたり 319 トークンに達し、これは他のバックエンドの 1 秒あたり 61 トークンよりも完全に 4.2 倍高速です。

RTX 4090 は、1 秒あたりのトークン数から 2.8 倍の 829 トークンまで高速化できます。

NVIDIA RTX显卡AI推理提速5倍！RTX PC轻松在本地搞定大模型 NVIDIA RTX は、強力なハードウェアパフォーマンス、豊富な開発エコシステム、幅広いアプリケーションシナリオを備えており、ローカル AI にとって不可欠かつ強力なアシスタントになりつつあります。同時に、最適化、モデル、リソースの継続的な強化により、数億台の RTX PC での AI 機能の人気も加速しています

現在、RTX GPU アクセラレーションをサポートする AI アプリケーションやゲームをリリースしているパートナーは 400 社を超えており、モデルの使いやすさが向上するにつれて、Windows PC プラットフォームにも AIGC 機能がさらに増えていくと思います。

以上がNVIDIA RTX グラフィックスカードは AI 推論を 5 倍高速化します。 RTX PC はローカルで大規模なモデルを簡単に処理できますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は搜狐で複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

Gemma Scope：AI＆＃039;の思考プロセスを覗くためのGoogle＆＃039;の顕微鏡Apr 17, 2025 am 11:55 AM

ジェマの範囲で言語モデルの内部の仕組みを探る AI言語モデルの複雑さを理解することは、重要な課題です。包括的なツールキットであるGemma ScopeのGoogleのリリースは、研究者に掘り下げる強力な方法を提供します

ビジネスインテリジェンスアナリストは誰で、どのようになるか？Apr 17, 2025 am 11:44 AM

ビジネスの成功のロック解除：ビジネスインテリジェンスアナリストになるためのガイド生データを組織の成長を促進する実用的な洞察に変換することを想像してください。これはビジネスインテリジェンス（BI）アナリストの力です - GUにおける重要な役割

SQLに列を追加する方法は？ - 分析VidhyaApr 17, 2025 am 11:43 AM

SQLの変更テーブルステートメント：データベースに列を動的に追加するデータ管理では、SQLの適応性が重要です。その場でデータベース構造を調整する必要がありますか？ Alter Tableステートメントはあなたの解決策です。このガイドの詳細は、コルを追加します

ビジネスアナリストとデータアナリストApr 17, 2025 am 11:38 AM

導入 2人の専門家が重要なプロジェクトで協力している賑やかなオフィスを想像してください。ビジネスアナリストは、会社の目標に焦点を当て、改善の分野を特定し、市場動向との戦略的整合を確保しています。シム

ExcelのCountとCountaとは何ですか？ - 分析VidhyaApr 17, 2025 am 11:34 AM

Excelデータカウントと分析：カウントとカウントの機能の詳細な説明特に大規模なデータセットを使用する場合、Excelでは、正確なデータカウントと分析が重要です。 Excelは、これを達成するためにさまざまな機能を提供し、CountおよびCounta関数は、さまざまな条件下でセルの数をカウントするための重要なツールです。両方の機能はセルをカウントするために使用されますが、設計ターゲットは異なるデータ型をターゲットにしています。 CountおよびCounta機能の特定の詳細を掘り下げ、独自の機能と違いを強調し、データ分析に適用する方法を学びましょう。キーポイントの概要カウントとcouを理解します

ChromeはAIと一緒にここにいます：毎日何か新しいことを体験してください!!Apr 17, 2025 am 11:29 AM

Google Chrome'sAI Revolution：パーソナライズされた効率的なブラウジングエクスペリエンス人工知能（AI）は私たちの日常生活を急速に変換しており、Google ChromeはWebブラウジングアリーナで料金をリードしています。この記事では、興奮を探ります

ai＆＃x27; s Human Side：Wellbeing and the Quadruple bottuntApr 17, 2025 am 11:28 AM

インパクトの再考：四重材のボトムライン長い間、会話はAIの影響の狭い見方に支配されており、主に利益の最終ラインに焦点を当てています。ただし、より全体的なアプローチは、BUの相互接続性を認識しています

5ゲームを変える量子コンピューティングの使用ケースあなたが知っておくべきであるApr 17, 2025 am 11:24 AM

物事はその点に向かって着実に動いています。量子サービスプロバイダーとスタートアップに投資する投資は、業界がその重要性を理解していることを示しています。そして、その価値を示すために、現実世界のユースケースの数が増えています

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

SecLists

SecLists は、セキュリティテスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティテスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティテストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジングペイロード、機密データパターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテストマシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。

WebStorm Mac版

便利なJavaScript開発ツール

mPDF

mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。

VSCode Windows 64 ビットのダウンロード

Microsoft によって発売された無料で強力な IDE エディター

DVWA

Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、