GPT4All 是基於大量乾淨的助手資料(包括程式碼、故事和對話)訓練而成的聊天機器人,資料包括~800k 條GPT-3.5-Turbo 產生數據,基於LLaMa 完成,M1 Mac、Windows 等環境都能運行。或許就像它的名字所暗示的那樣,人人都能用上個人 GPT 的時代已經來了。
自從 OpenAI 發布 ChatGPT 後,最近幾個月聊天機器人熱度不減。
雖然 ChatGPT 功能強大,但 OpenAI 幾乎不可能將其開源。不少人都在做開源的努力,像是前段時間 Meta 開源的 LLaMA。其是一系列模型的總稱,參數量從 70 億到 650 億不等,其中,130 億參數的 LLaMA 模型「在大多數基準上」可以勝過參數量達 1750 億的 GPT-3。
LLaMA 的開源可是利好眾多研究者,例如史丹佛在LLaMA 的基礎上加入指令微調(instruct tuning),訓練了一個名為Alpaca(羊駝)的70 億參數新模型(基於LLaMA 7B )。結果顯示,只有 7B 參數的輕量級模型 Alpaca 效能可媲美 GPT-3.5 這樣的超大規模語言模型。
又例如,我們接下來要介紹的這個模型 GPT4All,也是一種基於 LLaMA 的新型 7B 語言模型。專案上線兩天,Star 量已經突破 7.8k。
專案網址:https://github.com/nomic-ai/gpt4all
簡單來講,GPT4All 在GPT-3.5-Turbo 的800k在以資料上進行訓練,包括文字問題、故事描述、多輪對話和代碼。
根據項目顯示,M1 Mac、Windows 等環境都能運作。
我們先來看看效果。如下圖所示,使用者可以和GPT4All 進行無障礙交流,例如詢問該模型:「我可以在筆記本上運行大型語言模型嗎?」GPT4All 回答是:「是的,你可以使用筆記本來訓練和測試神經網絡或其他自然語言(如英語或中文)的機器學習模型。重要的是,你需要足夠可用的記憶體(RAM) 來適應這些模型的大小…」
接下來,如果你不清楚到底需要多少內存,你還可以繼續詢問GPT4All,然後它給出答案。從結果來看,GPT4All 進行多輪對話的能力還是很強的。
在M1 Mac 上的即時取樣
有人將這項研究稱為「改變遊戲規則,有了GPT4All 的加持,現在在MacBook 上本地就能運行GPT。」
與GPT-4 相似的是,GPT4All 也提供了一份「技術報告」。
技術報告網址:https://s3.amazonaws.com/static.nomic.ai/gpt4all/2023_GPT4All_Technical_Report.pdf
#這份初步的技術報告簡要描述了GPT4All 的搭建細節。研究者公開了收集的資料、資料整理程序、訓練程式碼和最終的模型權重,以促進開放研究和可重複性,此外還發布了模型的量化4 位(quantized 4-bit)版本,這意味著幾乎任何人都可以在CPU 上運行該模型。
接下來,讓我們看看這份報告中寫了什麼。
GPT4All 技術報告
1、資料收集與整理
在2023 年3 月20 日至2023 年3 月26 日期間,研究者使用GPT-3.5-Turbo OpenAI API 收集了約100 萬對prompt 回答。
首先,研究者透過利用三個公開可用的資料集來收集不同的問題 /prompt 樣本:
- LAION OIG 的統一chip2 子集
- Stackoverflow Questions 的一個隨機子樣本集Coding questions
- Bigscience/P3 子樣本集進行指令調優
以上是筆記本就能運行的ChatGPT平替來了,附完整版技術報告的詳細內容。更多資訊請關注PHP中文網其他相關文章!

斯坦福大學以人為本人工智能研究所發布的《2025年人工智能指數報告》對正在進行的人工智能革命進行了很好的概述。讓我們用四個簡單的概念來解讀它:認知(了解正在發生的事情)、欣賞(看到好處)、接納(面對挑戰)和責任(弄清我們的責任)。 認知:人工智能無處不在,並且發展迅速 我們需要敏銳地意識到人工智能發展和傳播的速度有多快。人工智能係統正在不斷改進,在數學和復雜思維測試中取得了優異的成績,而就在一年前,它們還在這些測試中慘敗。想像一下,人工智能解決複雜的編碼問題或研究生水平的科學問題——自2023年

Meta的Llama 3.2:多模式和移動AI的飛躍 Meta最近公佈了Llama 3.2,這是AI的重大進步,具有強大的視覺功能和針對移動設備優化的輕量級文本模型。 以成功為基礎

本週的AI景觀:進步,道德考慮和監管辯論的旋風。 OpenAI,Google,Meta和Microsoft等主要參與者已經釋放了一系列更新,從開創性的新車型到LE的關鍵轉變

連接的舒適幻想:我們在與AI的關係中真的在蓬勃發展嗎? 這個問題挑戰了麻省理工學院媒體實驗室“用AI(AHA)”研討會的樂觀語氣。事件展示了加油

介紹 想像一下,您是科學家或工程師解決複雜問題 - 微分方程,優化挑戰或傅立葉分析。 Python的易用性和圖形功能很有吸引力,但是這些任務需要強大的工具

Meta's Llama 3.2:多式聯運AI強力 Meta的最新多模式模型Llama 3.2代表了AI的重大進步,具有增強的語言理解力,提高的準確性和出色的文本生成能力。 它的能力t

數據質量保證:與Dagster自動檢查和良好期望 保持高數據質量對於數據驅動的業務至關重要。 隨著數據量和源的增加,手動質量控制變得效率低下,容易出現錯誤。

大型機:AI革命的無名英雄 雖然服務器在通用應用程序上表現出色並處理多個客戶端,但大型機是專為關鍵任務任務而建立的。 這些功能強大的系統經常在Heavil中找到


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

MinGW - Minimalist GNU for Windows
這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。

PhpStorm Mac 版本
最新(2018.2.1 )專業的PHP整合開發工具

SublimeText3 Linux新版
SublimeText3 Linux最新版

SecLists
SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

Atom編輯器mac版下載
最受歡迎的的開源編輯器