元象發布了全球首個上下文視窗長度256K的開源大模型XVERSE-Long-256K。這個模型支援輸入25萬漢字,使得大模型應用能夠進入「長文本時代」。該模型完全開源,可以無條件免費商用,並且還附帶詳細的手把手訓練教程,這讓海量的中小企業、研究者和開發者能夠更早地實現「大模型自由」。
全球主流長文本大模型圖譜
參數量和高品質資料量決定了大模型的計算複雜度,而長文本技術(Long Context)是大模型應用發展“殺手鐧”,因技術新、研發難度高,目前多為閉源付費提供。
XVERSE-Long-256K支援超長文字輸入,可用於大規模資料分析、多重文件閱讀理解、跨領域知識融合,有效提升大模型應用的深度與廣度:一、為律師、金融分析師或顧問、prompt 工程師、科研人員等解決分析處理較長文本的工作;二、在角色扮演或聊天應用中,緩解模型「忘記」之前對話的記憶力問題,或胡說八道的「幻覺」問題等等;三、更好支援智能體(AI Agent)基於歷史資訊進行規劃與決策;四、幫助AI原生應用保持連貫、個人化的使用者體驗。
至此,XVERSE-Long-256K填補了開源生態空白,還與元象此前70億、130億、650億參數大模型組成“高性能全家桶”,將國產開源提升至國際一流水平。 元像大模型系列
免費下載元像大模型
- GitHub:https://github.com/xverse- ai/XVERSE-13B
- hugging face:https://huggingface.co/xverse/XVERSE-13B-256K
- 魔搭:https://modelscope.cn/models/xverse/ XVERSE-13B-256K
- 詢問傳送:opensource@xverse.cn
使用者可登入大模型官網(chat.xverse.cn)或小程式立即體驗 XVERSE-Long -256K。
高效能定位評測表現優異
為確保業界對元像大模式有全面、客觀和長期的認知,研究者參考權威產業測評,制定了六個維度的9項綜合測評體系。 XVERSE-Long-256K 均表現出色,超越其他長文模型。
全球主流長文本開源大模型評測結果
XVERSE-Long-256K 通過了常見的長文本大模型效能壓力測試「海撈針」。該測驗在長文本語料中隱藏一個與其內容無關的句子,並透過自然語言提問讓大模型準確地提取該句子。
長篇小說 閱讀理解
#目前國內大多數大型模式只支援中英雙語,但元象支持40多種語言。我們對16萬字符的俄語經典小說《鋼鐵是如何煉成的》和41萬字符的德語歷史傳記《人類群星閃耀時》進行了測試。
《鋼鐵是如何煉成的(俄文版)》測試
《人類群星閃耀時(德文版)》測試
法律法條 精準應用
#以《中華人民共和國民法典》為例,展示對法律術語的解釋,以及對案例進行邏輯分析、結合實際的彈性應用:
《民法》測試
手把手教你訓練長文本大模型
1. 技術挑戰
- 模型訓練:GPU顯存的佔用與序列長度的平方成正比,使訓練量急遽上升。
- 模型結構:序列越長,模型的attention越分散,模型越容易忘記前序內容。
- 推理速度:模型序列越長,將大幅度降低模型推理速度。
2. 元象技術路線
# 長文本大模型技術是在近一年內發展出來的新技術,其主要技術方案為:
- 直接進行長序列的預訓練,但會導致訓練量成平方倍的提升。
- 透過位置編碼的插值或外推拓展序列長度,這種方法會降低位置編碼的分辨率,從而降低大模型輸出效果。
元象長文字大模型訓練流程
#第一階段:##ABF 繼續預訓練
- GitHub:https://github.com/xverse-ai/XVERSE-13B
- hugging face:https://huggingface.co /xverse/XVERSE-13B-256K
- 魔搭:https://modelscope.cn/models/xverse/XVERSE-13B-256K
- #詢問傳送:opensource@xverse.cn
以上是無條件免費商用的全球最長開源模型XVERSE-Long-256K的詳細內容。更多資訊請關注PHP中文網其他相關文章!

介紹 恭喜!您經營一家成功的業務。通過您的網頁,社交媒體活動,網絡研討會,會議,免費資源和其他來源,您每天收集5000個電子郵件ID。下一個明顯的步驟是

介紹 在當今快節奏的軟件開發環境中,確保最佳應用程序性能至關重要。監視實時指標,例如響應時間,錯誤率和資源利用率可以幫助MAIN

“您有幾個用戶?”他扮演。 阿爾特曼回答說:“我認為我們上次說的是每週5億個活躍者,而且它正在迅速增長。” “你告訴我,就像在短短幾週內翻了一番,”安德森繼續說道。 “我說那個私人

介紹 Mistral發布了其第一個多模式模型,即Pixtral-12b-2409。該模型建立在Mistral的120億參數Nemo 12B之上。是什麼設置了該模型?現在可以拍攝圖像和Tex

想像一下,擁有一個由AI驅動的助手,不僅可以響應您的查詢,還可以自主收集信息,執行任務甚至處理多種類型的數據(TEXT,圖像和代碼)。聽起來有未來派?在這個a


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

mPDF
mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

WebStorm Mac版
好用的JavaScript開發工具

VSCode Windows 64位元 下載
微軟推出的免費、功能強大的一款IDE編輯器

EditPlus 中文破解版
體積小,語法高亮,不支援程式碼提示功能

MantisBT
Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。