検索
ホームページテクノロジー周辺機器AINVIDIA RTX グラフィックス カードは AI 推論を 5 倍高速化します。 RTX PC はローカルで大規模なモデルを簡単に処理できます

Microsoft Iginte Global Technology Conference で、マイクロソフトは、開発者がハードウェアのパフォーマンスを最大限に活用し、AI アプリケーション分野を拡大できるよう支援することを目的として、一連の新しい AI 関連の最適化モデルと開発ツール リソースをリリースしました。

特に、現在 AI 分野で絶対的な支配的地位を占めている NVIDIA に対して、Microsoft は今回大きなギフト パッケージを送りました。

それが OpenAI Chat API 用の TensorRT-LLM パッケージング インターフェイスであれ、RTX であれ、主導的なパフォーマンスの向上 Llama 2 の DirectML およびその他の一般的なラージ言語モデル (LLM) は、より高速化され、NVIDIA ハードウェアに適用できます。

NVIDIA RTX显卡AI推理提速5倍!RTX PC轻松在本地搞定大模型

その中で、

TensorRT-LLM は、LLM 推論を高速化するために使用されるライブラリであり、AI 推論のパフォーマンスを大幅に向上させることができます。これは、より多くの言語モデルをサポートするために常に更新されており、オープン ソースでもあります。

NVIDIA は 10 月に Windows プラットフォーム用の TensorRT-LLM をリリースしました。 RTX 30/40 シリーズ GPU グラフィックス カードを搭載したデスクトップおよびラップトップの場合、グラフィックス メモリが 8 GB 以上に達する限り、要求の厳しい AI ワークロードをより簡単に完了できます

Windows 用 Tensor RT-LLM は、新しいカプセル化インターフェイスを通じて OpenAI の人気のチャット API と互換性があるため、クラウドに接続する必要がなく、さまざまな関連アプリケーションをローカルで直接実行できるため、有益です。プライバシーの漏洩を防ぐために、PC 上の個人データや専有データを保護します。

TensorRT-LLM によって最適化された大規模な言語モデルである限り、Llama 2、Mistral、NV LLM などを含むこのパッケージ化インターフェイスで使用できます。

開発者にとっては、面倒なコードの書き換えや移植の必要がなく、

コードを 1 ~ 2 行変更するだけで、AI アプリケーションをローカルですばやく実行できます。

NVIDIA RTX显卡AI推理提速5倍!RTX PC轻松在本地搞定大模型↑↑↑TensorRT-LLM に基づく Microsoft Visual Studio コード プラグイン - Continue.dev コーディング アシスタント

TensorRT-LLM v0.6.0 は今月末に更新されます。これにより、RTX GPU での推論パフォーマンスが最大 5 倍向上します。

また、新しい The 7 を含む、より一般的な LLM をサポートします。 10 億パラメータの Mistral と 80 億パラメータの Nemotron-3 を使用すると、デスクトップとラップトップでいつでも迅速かつ正確に LLM をローカルで実行できます。 実際の測定データによると、

RTX 4060 グラフィックス カードと TenroRT-LLM を組み合わせた場合、推論パフォーマンスは 1 秒あたり 319 トークンに達し、これは他のバックエンドの 1 秒あたり 61 トークンよりも完全に 4.2 倍高速です。

RTX 4090 は、1 秒あたりのトークン数から 2.8 倍の 829 トークンまで高速化できます。

NVIDIA RTX显卡AI推理提速5倍!RTX PC轻松在本地搞定大模型NVIDIA RTX は、強力なハードウェア パフォーマンス、豊富な開発エコシステム、幅広いアプリケーション シナリオを備えており、ローカル AI にとって不可欠かつ強力なアシスタントになりつつあります。同時に、最適化、モデル、リソースの継続的な強化により、数億台の RTX PC での AI 機能の人気も加速しています

現在、RTX GPU アクセラレーションをサポートする AI アプリケーションやゲームをリリースしているパートナーは 400 社を超えており、モデルの使いやすさが向上するにつれて、Windows PC プラットフォームにも AIGC 機能がさらに増えていくと思います。

以上がNVIDIA RTX グラフィックス カードは AI 推論を 5 倍高速化します。 RTX PC はローカルで大規模なモデルを簡単に処理できますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事は搜狐で複製されています。侵害がある場合は、admin@php.cn までご連絡ください。
Gemma Scope:AI'の思考プロセスを覗くためのGoogle'の顕微鏡Gemma Scope:AI'の思考プロセスを覗くためのGoogle'の顕微鏡Apr 17, 2025 am 11:55 AM

ジェマの範囲で言語モデルの内部の仕組みを探る AI言語モデルの複雑さを理解することは、重要な課題です。 包括的なツールキットであるGemma ScopeのGoogleのリリースは、研究者に掘り下げる強力な方法を提供します

ビジネスインテリジェンスアナリストは誰で、どのようになるか?ビジネスインテリジェンスアナリストは誰で、どのようになるか?Apr 17, 2025 am 11:44 AM

ビジネスの成功のロック解除:ビジネスインテリジェンスアナリストになるためのガイド 生データを組織の成長を促進する実用的な洞察に変換することを想像してください。 これはビジネスインテリジェンス(BI)アナリストの力です - GUにおける重要な役割

SQLに列を追加する方法は? - 分析VidhyaSQLに列を追加する方法は? - 分析VidhyaApr 17, 2025 am 11:43 AM

SQLの変更テーブルステートメント:データベースに列を動的に追加する データ管理では、SQLの適応性が重要です。 その場でデータベース構造を調整する必要がありますか? Alter Tableステートメントはあなたの解決策です。このガイドの詳細は、コルを追加します

ビジネスアナリストとデータアナリストビジネスアナリストとデータアナリストApr 17, 2025 am 11:38 AM

導入 2人の専門家が重要なプロジェクトで協力している賑やかなオフィスを想像してください。 ビジネスアナリストは、会社の目標に焦点を当て、改善の分野を特定し、市場動向との戦略的整合を確保しています。 シム

ExcelのCountとCountaとは何ですか? - 分析VidhyaExcelのCountとCountaとは何ですか? - 分析VidhyaApr 17, 2025 am 11:34 AM

Excelデータカウントと分析:カウントとカウントの機能の詳細な説明 特に大規模なデータセットを使用する場合、Excelでは、正確なデータカウントと分析が重要です。 Excelは、これを達成するためにさまざまな機能を提供し、CountおよびCounta関数は、さまざまな条件下でセルの数をカウントするための重要なツールです。両方の機能はセルをカウントするために使用されますが、設計ターゲットは異なるデータ型をターゲットにしています。 CountおよびCounta機能の特定の詳細を掘り下げ、独自の機能と違いを強調し、データ分析に適用する方法を学びましょう。 キーポイントの概要 カウントとcouを理解します

ChromeはAIと一緒にここにいます:毎日何か新しいことを体験してください!!ChromeはAIと一緒にここにいます:毎日何か新しいことを体験してください!!Apr 17, 2025 am 11:29 AM

Google Chrome'sAI Revolution:パーソナライズされた効率的なブラウジングエクスペリエンス 人工知能(AI)は私たちの日常生活を急速に変換しており、Google ChromeはWebブラウジングアリーナで料金をリードしています。 この記事では、興奮を探ります

ai' s Human Side:Wellbeing and the Quadruple bottuntai' s Human Side:Wellbeing and the Quadruple bottuntApr 17, 2025 am 11:28 AM

インパクトの再考:四重材のボトムライン 長い間、会話はAIの影響の狭い見方に支配されており、主に利益の最終ラインに焦点を当てています。ただし、より全体的なアプローチは、BUの相互接続性を認識しています

5ゲームを変える量子コンピューティングの使用ケースあなたが知っておくべきである5ゲームを変える量子コンピューティングの使用ケースあなたが知っておくべきであるApr 17, 2025 am 11:24 AM

物事はその点に向かって着実に動いています。量子サービスプロバイダーとスタートアップに投資する投資は、業界がその重要性を理解していることを示しています。そして、その価値を示すために、現実世界のユースケースの数が増えています

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

SecLists

SecLists

SecLists は、セキュリティ テスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティ テスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティ テストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジング ペイロード、機密データ パターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテスト マシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。

WebStorm Mac版

WebStorm Mac版

便利なJavaScript開発ツール

mPDF

mPDF

mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。

VSCode Windows 64 ビットのダウンロード

VSCode Windows 64 ビットのダウンロード

Microsoft によって発売された無料で強力な IDE エディター

DVWA

DVWA

Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、