>像Llama 3這樣的大型語言模型(LLMS)本地在AI景觀中提供了顯著優勢。 擁抱面孔和其他平台擁護本地部署,使私人和不間斷的模型訪問能夠訪問。本指南探討了本地LLM執行的好處,證明了使用GPT4ALL和OLLAMA,模型服務,VSCODE集成的使用,最後是構建自定義AI應用程序。
>為什麼要本地Llama 3部署? 在要求高RAM,GPU和處理能力的同時,進步使本地駱駝3執行越來越可行。關鍵好處包括:
>不間斷的訪問:
避免速率限制和服務中斷。- 提高了性能:經驗最小的響應生成速度最小。 即使是中檔筆記本電腦也達到每秒50個令牌的速度。
- 增強的安全性:保持對輸入和數據的完全控制,使所有內容保持本地。 >
- 消除API費用和訂閱。 > >自定義和靈活性:
- 帶有超參數,停止令牌和高級設置的微調模型。 離線功能:
- >使用沒有Internet連接的模型。 所有權和控制權:
- 保留模型,數據和輸出的完全所有權。
更深入地研究雲與本地LLM的使用情況,請參閱我們的文章“雲與本地LLM部署:權衡利弊”。 >
- > llama 3與gpt4all和ollama >
>
>下載並安裝GPT4All(在官方下載頁面上可用Windows說明)。 啟動應用程序,導航到“下載”部分,選擇“ Llama 3指令”,然後下載。下載後,從“選擇模型”菜單中選擇“ Llama 3指示”。 輸入您的提示並與模型進行交互。 GPU加速度(如果有)將大大加快響應。olla提供了一種更簡單的方法。下載並安裝Ollama。 打開您的終端/powershell並執行:
(注意:模型下載和聊天機器人的初始化可能需要幾分鐘。)
出口。
ollama run llama3>在我們的“ 7種用於本地運行LLMS的簡單方法”指南中探索其他工具和框架。
>
>>本地Llama 3服務器和API訪問/bye
>本地服務器可以將Llama 3集成到其他應用程序中。 使用以下方式啟動服務器
ollama run llama3>通過Ollama系統托盤圖標檢查服務器狀態(右鍵單擊以查看日誌)。
訪問API
ollama serve(Curl是Linux的原生,但也可以在Windows PowerShell中起作用。
或者,使用Ollama Python軟件包:
curl http://localhost:11434/api/chat -d '{ "model": "llama3", "messages": [ { "role": "user", "content": "What are God Particles?" } ], "stream": false }'>包裝支持異步調用和流式傳輸以提高效率。
>
集成
將千層面的3集成到VSCODE中,以獲取諸如自動完成和代碼建議之類的功能。
啟動Ollama Server()。
>- >安裝“ codegpt” Vscode擴展名。
-
ollama serve
>配置Codegpt,選擇Ollama作為提供商,而“ Llama3:8b”作為模型(無需API密鑰)。 >使用Codegpt的提示在您的Python文件中生成和完善代碼。 - 請參閱“為高級配置設置python的Vscode”。
開發本地AI應用程序
本節詳細介紹了創建一個處理DOCX文件,生成嵌入式,利用矢量存儲的AI應用程序進行相似性搜索,並為用戶查詢提供上下文答案。
(詳細的代碼示例和說明是簡潔的,但在原始輸入中可用。)>該過程涉及:
設置必要的python軟件包。
>使用加載DOCX文件 將文本分成可管理的塊。
- >使用Ollama的Llama 3生成嵌入,並將它們存儲在Chroma Vector Store中。
- >建立一個蘭鍊鍊,以回答問題,併入矢量商店,抹布提示和ollama llm。
- 創建用於查詢系統的交互式終端應用程序。
DirectoryLoader
- 此應用程序的完整代碼可在GitHub上獲得(原始輸入中提供的鏈接)。
- 結論
>運行Llama 3本地賦予用戶具有隱私,成本效益和控制權。 本指南展示了開源工具和框架的力量,用於構建複雜的AI應用程序而不依賴雲服務。 提供的示例展示了與流行開發環境的易於集成以及創建自定義AI解決方案的潛力。
以上是如何在本地運行Llama 3:完整的指南的詳細內容。更多資訊請關注PHP中文網其他相關文章!

Google正在領導這一轉變。它的“ AI概述”功能已經為10億用戶提供服務,在任何人單擊鏈接之前提供完整的答案。 [^2] 其他球員也正在迅速獲得地面。 Chatgpt,Microsoft Copilot和PE

2022年,他創立了社會工程防禦初創公司Doppel,以此做到這一點。隨著網絡犯罪分子越來越高級的AI模型來渦輪增壓,Doppel的AI系統幫助企業對其進行了大規模的對抗 - 更快,更快,

瞧,通過與合適的世界模型進行交互,可以實質上提高生成的AI和LLM。 讓我們來談談。 對創新AI突破的這種分析是我正在進行的《福布斯》列的最新覆蓋範圍的一部分,包括

勞動節2050年。全國范圍內的公園充滿了享受傳統燒烤的家庭,而懷舊遊行則穿過城市街道。然而,慶祝活動現在具有像博物館般的品質 - 歷史重演而不是紀念C

為了幫助解決這一緊急且令人不安的趨勢,在2025年2月的TEM期刊上進行了同行評審的文章,提供了有關該技術深擊目前面對的最清晰,數據驅動的評估之一。 研究員

從大大減少制定新藥所需的時間到創造更綠色的能源,企業將有巨大的機會打破新的地面。 不過,有一個很大的問題:嚴重缺乏技能的人

幾年前,科學家發現某些類型的細菌似乎通過發電而不是吸收氧氣而呼吸,但是它們是如何做到的,這是一個謎。一項發表在“雜誌”雜誌上的新研究確定了這種情況的發生方式:Microb

在本週的RSAC 2025會議上,Snyk舉辦了一個及時的小組,標題為“前100天:AI,政策和網絡安全如何碰撞”,其中包括全明星陣容:前CISA董事Jen Easterly;妮可·珀洛斯(Nicole Perlroth),前記者和帕特納(Partne)


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

Atom編輯器mac版下載
最受歡迎的的開源編輯器

記事本++7.3.1
好用且免費的程式碼編輯器

DVWA
Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中

mPDF
mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

PhpStorm Mac 版本
最新(2018.2.1 )專業的PHP整合開發工具