在微軟Iginte全球技術大會上,微軟發布了一系列AI相關的全新優化模型和開發工具資源,旨在幫助開發者更充分地發揮硬體性能,擴展AI應用領域
特別是對於當下在AI領域佔據絕對主導地位的NVIDIA來說,微軟這次送上了一份大禮包,無論是面向OpenAI Chat API的TensorRT-LLM封裝接口,還是RTX驅動的效能改進DirectML for Llama 2,以及其他熱門大語言模型(LLM),都可以在NVIDIA硬體上獲得更好的加速和應用。
其中,TensorRT-LLM是一款用於加速LLM推理的函式庫,可大幅提升AI推理效能,還在持續更以支援越來越多的語言模型,而且它還是開源的。
NVIDIA在10月發布了適用於Windows平台的TensorRT-LLM。對於配備RTX 30/40系列GPU顯示卡的桌上型電腦和筆記型電腦來說,只要顯存達到8GB以上,就能更輕鬆地完成高要求的AI工作負載
現在,Tensor RT-LLM for Windows可以透過全新的封裝接口,與OpenAI 廣受歡迎的聊天API 相容,因此可以在本地直接運行各種相關應用,而不需要連接雲端,有利於在PC 上保留私人和專有數據,防範隱私外洩。
只要是經過TensorRT-LLM優化的大型語言模型,都可以與這個封裝介面配合使用,包括Llama 2、Mistral、NV LLM等等
對於開發者來說,無需繁瑣的程式碼重寫和移植,只需修改一兩行程式碼,就可以讓AI應用程式在本地快速執行。
↑↑↑基於TensorRT-LLM的微軟Visual Studio程式碼外掛程式-Continue.dev程式設計助理
本月底還會有TensorRT-LLM v0.6.0版本更新,將會在RTX GPU上帶來最多達5倍的推理性能提升,並支援更多熱門的LLM,包括全新的70億參數Mistral、80億參數Nemotron-3,讓桌上型電腦和筆電也能隨時、快速、準確地本地運行LLM。
根據實測數據,RTX 4060顯示卡搭配TenroRT-LLM,推理表現可以跑到每秒319 tokens,相比其他後端的每秒61 tokens提速足足4.2倍。
RTX 4090則可以從每秒tokens加速到每秒829 tokens,提升幅度達2.8倍。
憑藉著強大的硬體效能、豐富的開發生態和廣泛的應用場景,NVIDIA RTX正在成為本地AI不可或缺的有力助手。同時,隨著最佳化、模型和資源的不斷豐富,AI功能在億萬台RTX PC上的普及也加速推進
目前已經有400多個合作夥伴發布了支援RTX GPU加速的AI應用、遊戲,而隨著模型易用性的不斷提高,相信會有越來越多的AIGC功能出現在Windows PC平台上。
以上是NVIDIA RTX顯示卡AI推理提速5倍! RTX PC輕鬆在本地搞定大模型的詳細內容。更多資訊請關注PHP中文網其他相關文章!

嘿,編碼忍者!您當天計劃哪些與編碼有關的任務?在您進一步研究此博客之前,我希望您考慮所有與編碼相關的困境,這是將其列出的。 完畢? - 讓&#8217

AI增強食物準備 在新生的使用中,AI系統越來越多地用於食品製備中。 AI驅動的機器人在廚房中用於自動化食物準備任務,例如翻轉漢堡,製作披薩或組裝SA

介紹 了解Python函數中變量的名稱空間,範圍和行為對於有效編寫和避免運行時錯誤或異常至關重要。在本文中,我們將研究各種ASP

介紹 想像一下,穿過美術館,周圍是生動的繪畫和雕塑。現在,如果您可以向每一部分提出一個問題並獲得有意義的答案,該怎麼辦?您可能會問:“您在講什麼故事?

繼續使用產品節奏,本月,Mediatek發表了一系列公告,包括新的Kompanio Ultra和Dimenty 9400。這些產品填補了Mediatek業務中更傳統的部分,其中包括智能手機的芯片

#1 Google推出了Agent2Agent 故事:現在是星期一早上。作為AI驅動的招聘人員,您更聰明,而不是更努力。您在手機上登錄公司的儀表板。它告訴您三個關鍵角色已被採購,審查和計劃的FO

我猜你一定是。 我們似乎都知道,心理障礙由各種chat不休,這些chat不休,這些chat不休,混合了各種心理術語,並且常常是難以理解的或完全荒謬的。您需要做的一切才能噴出fo

根據本週發表的一項新研究,只有在2022年製造的塑料中,只有9.5%的塑料是由回收材料製成的。同時,塑料在垃圾填埋場和生態系統中繼續堆積。 但是有幫助。一支恩金團隊


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

MantisBT
Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

記事本++7.3.1
好用且免費的程式碼編輯器

MinGW - Minimalist GNU for Windows
這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。

PhpStorm Mac 版本
最新(2018.2.1 )專業的PHP整合開發工具

SublimeText3漢化版
中文版,非常好用