搜尋
首頁科技週邊人工智慧LLM將成歷史?開源bGPT或顛覆深度學習範式:直接模擬二進制,開啟類比數位世界新紀元!

微軟亞洲研究院推出的最新成果bGPT,這種基於位元組的Transformer模型,為我們探索數位世界開闢了新的大門。

與傳統基於詞表的語言模型不同,bGPT具有獨特之處,即其能夠直接處理原始二進位數據,不受特定格式或任務的限制。其旨在全面模擬數位世界,為模型的發展開啟了新的可能性。

LLM將成歷史?開源bGPT或顛覆深度學習範式:直接模擬二進制,開啟類比數位世界新紀元!

論文:#https://www.php.cn/link/ee88b3cea2051be97bcddf2e0d9a28f6

#程式碼:https://www.php.cn/link/359499f804ea7988921bf86c9377fb95

#模型:https://www.php.cn/link/4b459ea1a5917be436df5f0bd5b3c4ad

#計畫首頁:

LLM將成歷史?開源bGPT或顛覆深度學習範式:直接模擬二進制,開啟類比數位世界新紀元!


LLM將成歷史?開源bGPT或顛覆深度學習範式:直接模擬二進制,開啟類比數位世界新紀元!

##################################################################1 https://www.php.cn/link/71af59614c8b42af334933e9261e53be###############研究小組在他們的研究論文中展示了bGPT在建模方面的巨大潛力。透過進行位元組級處理,bGPT不僅能夠產生文字、影像和音頻,還能夠模擬電腦的行為,包括格式轉換演算法和CPU狀態的建模。這種將所有資料視為位元組序列的方法使得bGPT能夠將不同類型的資料整合到同一個框架中。 ############一經發布,bGPT的論文在X(Twitter)上引起了廣泛熱議,突顯了深度學習模式的潛在變革,為模型真正理解和模擬數字世界中的各種活動開啟了新可能性。 #########二進位資料:構成數位世界的基礎DNA#########二進位資料是數位世界的基石,它貫穿了電腦處理器以及我們日常使用的電子產品的操作系統,是所有資料、設備和軟體的核心。因此,基於這個基礎,bGPT的目標是透過研究二元資料序列來理解數位系統的內在邏輯,從而重塑和模擬各種複雜的數位現象。 ############bGPT透過位元組級的處理,不僅能應用於常規的AI生成和理解任務,還能處理更多的非傳統應用。例如,它能直接模擬MIDI——一種音樂傳輸和儲存的標準格式,這在先前的研究中由於MIDI的二進位本質而避免了直接建模。 ############但bGPT天生適合此類任務,能夠精確模擬音樂資料的轉換演算法,將ABC記譜法轉換為MIDI格式時,達到極低的錯誤率(0.0011 BPB) 。 ############在實際應用中,bGPT通常能夠準確地完成ABC符號與MIDI檔案之間的轉換,有時甚至能修正原始檔案中的錯誤,使音樂轉換更加準確。 ##############################bGPT自動將ABC記譜法轉換成MIDI格式(上圖)與原始MIDI資料(下圖)的對比,凸顯了關鍵的差異:雖然原MIDI數據中漏掉了一拍(見下圖),導致和弦伴奏斷開,但由bGPT轉換的結果(見上圖)正確填補了這一缺失,確保了和弦伴奏的流暢性。 ############研究團隊也將CPU建模作為硬體行為模擬的代表性任務:此任務要求模型接收低階機器指令序列作為輸入,其目標是準確預測每個指令執行後CPU狀態如何更新,直到程式停止。 ############在這個任務中,bGPT展現出超過99.99%的準確率,顯示了位元組模型在處理原生二進位資料方面的強大能力和可擴展性。 ################

在提供了程式和初始CPU狀態的情況下,bGPT能夠準確地預測CPU執行的完整過程,直到程式終止。在這個範例中,bGPT精確地處理了所有CPU指令。為了便於理解,這裡將實際的位元組序列轉換成了更易讀的格式。

從位元組到萬物:突破邊界,朝向統一的數據建模進發

bGPT不僅能處理原生二進位數據,還能將多種數據類型融合進一個統一的模型架構中,視一切資料為位元組序列。

這種方法不僅簡化了資料建模流程,也使得從任何資料來源的整合變得輕而易舉,且無需為特定資料類型自訂模型。

研究團隊在論文中舉例了傳統文字、圖像及音訊文件,展現了bGPT在統一資料建模方面的能力。他們訓練的bGPT模型擁有約1億參數。

實驗結果表明,在與GPT-2(文字模型)、ViT(視覺模型)和AST(音訊模型)等同規模模型的比較中,bGPT在不同資料類型上均展現出了可媲美的性能。

bGPT在文字生成方面的表現非常出色。由於其位元組層級的文本編碼,該模型無需依賴詞彙表,從而支援所有語言。

它的分層Transformer架構,儘管計算開銷與GPT-2相近,卻能產生長達8KB的文本,大大超出了GPT-2的長度限制。在經過Wikipedia資料進行預訓練後,bGPT生成的文字在風格和主題上都與GPT-2不相上下,證明了其在文字生成方面的強大能力。

bGPT在Wikipedia資料集上進行預訓練,產生的文字範例品質和主題一致性與GPT-2相當。

bGPT可以透過預測影像位元組序列中的下一個位元組來產生影像。該模型在ImageNet資料集上進行了預訓練,生成的影像解析度為32x32像素。

雖然在當前規模下,透過位元組序列準確地捕捉影像的二維空間關係有所困難,導致生成的影像存在偽影和雜訊,但紋理和光影效果通常還是比較準確的。

此外,這些產生的影像均能被正常解碼為BMP檔。研究團隊指出,透過擴大bGPT的規模,類似OpenAI開發的iGPT在像素序列建模方面的方法,或許可以實現更高品質、更逼真的影像生成。

這些是由在ImageNet資料集上進行預訓練的bGPT所產生的一組影像。雖然影像的紋理和光影效果通常比較準確,但在這些生成的影像中辨識主要物體卻有一定難度。

bGPT將音訊資料視為位元組序列,能產生1秒長、取樣率為8000 Hz的音訊取樣。

該模型在LibriSpeech資料集上完成了預訓練,並進一步在Speech Commands v2資料集上進行微調和演示。 bGPT產生的音訊樣本保持了較高的準確度,其中一些樣本幾乎與真實音訊無法區分。以下是展示bGPT在音訊生成領域能力的範例集。

透過bGPT探索位元組構成的數字世界

#傳統語言模型,不管它們有多強大,主要專注於處理自然語言文本。 bGPT模型透過基於位元組的處理機制,打破了這種僅限於文字處理的局限性,開啟了一個全新的資料處理範疇。

這一進步讓bGPT有能力無縫地處理包括文字、圖像、音訊在內的各種數據類型,甚至能處理來自演算法和硬體的原生二進位數據,為全面模擬和理解數位世界鋪平了道路。

雖然bGPT展現出了引人注目的能力,但其在計算開銷方面的局限性,如當前在常規顯卡上僅能處理最大8KB的字節序列,對於那些需要產生或處理大量資料的應用來說,構成了明顯的限制。未來的工作計畫將集中在開發更有效率的演算法和利用硬體的進步上,旨在提高處理更大規模資料序列的能力。

全球的科技愛好者已經開始展望bGPT未來的潛力,從網路修剪和自我學習的優化到超大規模網路的自我重構能力,這些討論指向了一個共同的願景:bGPT最終可能實現一個統一的模型,能夠處理和輸出所有類型的位元組數據,真正成為數位世界的全面模擬器。

LLM將成歷史?開源bGPT或顛覆深度學習範式:直接模擬二進制,開啟類比數位世界新紀元!

研究團隊已將bGPT的程式碼和模型開源。這意味著你可以在自己的資料集上直接訓練bGPT,無需做出任何模型架構上的調整,便可探索字節模型在數位領域的廣闊前景。

以上是LLM將成歷史?開源bGPT或顛覆深度學習範式:直接模擬二進制,開啟類比數位世界新紀元!的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
使用Lamini-Analytics Vidhya微調開源LLM使用Lamini-Analytics Vidhya微調開源LLMApr 12, 2025 am 10:20 AM

最近,隨著大語言模型和AI的興起,我們看到了自然語言處理方面的無數進步。文本,代碼和圖像/視頻生成等域中的模型具有存檔的人類的推理和P

Python中使用OpenCV和Roboflow進行性別檢測 - 分析VidhyaPython中使用OpenCV和Roboflow進行性別檢測 - 分析VidhyaApr 12, 2025 am 10:19 AM

介紹 從面部圖像中檢測性別是計算機視覺的眾多迷人應用之一。在這個項目中,我們將OpenCV結合在一起,以解決位置與性別分類的Roboflow API

生成AI在個性化廣告內容中的作用是什麼?生成AI在個性化廣告內容中的作用是什麼?Apr 12, 2025 am 10:18 AM

介紹 自易貨系統概念以來,廣告世界一直在進化。廣告商找到了創造性的方法來引起我們的關注。在當前年齡,消費者期望BR

Openai' o1-preview vs o1-mini:向前邁出的一步Openai' o1-preview vs o1-mini:向前邁出的一步Apr 12, 2025 am 10:04 AM

介紹 9月12日,OpenAI發布了一項名為“與LLM的學習推理”的更新。他們介紹了O1模型,該模型是使用強化學習來應對複雜推理任務的訓練。是什麼設置了此mod

如何使用OpenAI O1構建遊戲? - 分析Vidhya如何使用OpenAI O1構建遊戲? - 分析VidhyaApr 12, 2025 am 10:03 AM

介紹 OpenAI O1模型家族大大提高了推理能力和經濟表現,尤其是在科學,編碼和解決問題方面。 Openai的目標是創建越來越高的AI和O1模型

流行的LLM代理工具用於客戶查詢管理流行的LLM代理工具用於客戶查詢管理Apr 12, 2025 am 10:01 AM

介紹 如今,客戶查詢管理的世界正在以前所未有的速度移動,每天都有新的工具成為頭條新聞。大型語言模型(LLM)代理是在這種情況下的最新創新,增強了Cu

100天企業的AI實施計劃100天企業的AI實施計劃Apr 12, 2025 am 09:56 AM

介紹 採用生成AI可能是任何公司的變革旅程。但是,Genai實施過程通常會繁瑣且令人困惑。 Niit Lim的董事長兼聯合創始人Rajendra Singh Pawar

Pixtral 12B與QWEN2-VL-72BPixtral 12B與QWEN2-VL-72BApr 12, 2025 am 09:52 AM

介紹 人工智能革命引起了創造力的新時代,文本對圖像模型正在重新定義藝術,設計和技術的交集。 pixtral 12b和qwen2-vl-72b是兩個開創性的力量。

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
3 週前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
3 週前By尊渡假赌尊渡假赌尊渡假赌

熱工具

Atom編輯器mac版下載

Atom編輯器mac版下載

最受歡迎的的開源編輯器

SecLists

SecLists

SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中

SublimeText3 Linux新版

SublimeText3 Linux新版

SublimeText3 Linux最新版

EditPlus 中文破解版

EditPlus 中文破解版

體積小,語法高亮,不支援程式碼提示功能