搜尋
首頁科技週邊人工智慧無條件免費商用的全球最長開源模型XVERSE-Long-256K

元象發布了全球首個上下文視窗長度256K的開源大模型XVERSE-Long-256K。這個模型支援輸入25萬漢字,使得大模型應用能夠進入「長文本時代」。該模型完全開源,可以無條件免費商用,並且還附帶詳細的手把手訓練教程,這讓海量的中小企業、研究者和開發者能夠更早地實現「大模型自由」。

無條件免費商用的全球最長開源模型XVERSE-Long-256K全球主流長文本大模型圖譜

參數量和高品質資料量決定了大模型的計算複雜度,而長文本技術(Long Context)是大模型應用發展“殺手鐧”,因技術新、研發難度高,目前多為閉源付費提供。

 XVERSE-Long-256K支援超長文字輸入,可用於大規模資料分析、多重文件閱讀理解、跨領域知識融合,有效提升大模型應用的深度與廣度:一、為律師、金融分析師或顧問、prompt 工程師、科研人員等解決分析處理較長文本的工作;二、在角色扮演或聊天應用中,緩解模型「忘記」之前對話的記憶力問題,或胡說八道的「幻覺」問題等等;三、更好支援智能體(AI Agent)基於歷史資訊進行規劃與決策;四、幫助AI原生應用保持連貫、個人化的使用者體驗。


至此,XVERSE-Long-256K填補了開源生態空白,還與元象此前70億、130億、650億參數大模型組成“高性能全家桶”,將國產開源提升至國際一流水平。
無條件免費商用的全球最長開源模型XVERSE-Long-256K元像大模型系列

免費下載元像大模型

  • GitHub:https://github.com/xverse- ai/XVERSE-13B
  • hugging face:https://huggingface.co/xverse/XVERSE-13B-256K
  • 魔搭:https://modelscope.cn/models/xverse/ XVERSE-13B-256K
  • 詢問傳送:opensource@xverse.cn

使用者可登入大模型官網(chat.xverse.cn)或小程式立即體驗 XVERSE-Long -256K。

 高效能定位評測表現優異
為確保業界對元像大模式有全面、客觀和長期的認知,研究者參考權威產業測評,制定了六個維度的9項綜合測評體系。 XVERSE-Long-256K 均表現出色,超越其他長文模型。
 無條件免費商用的全球最長開源模型XVERSE-Long-256K全球主流長文本開源大模型評測結果 

XVERSE-Long-256K 通過了常見的長文本大模型效能壓力測試「海撈針」。該測驗在長文本語料中隱藏一個與其內容無關的句子,並透過自然語言提問讓大模型準確地提取該句子。

長篇小說 閱讀理解

#目前國內大多數大型模式只支援中英雙語,但元象支持40多種語言。我們對16萬字符的俄語經典小說《鋼鐵是如何煉成的》和41萬字符的德語歷史傳記《人類群星閃耀時》進行了測試。

無條件免費商用的全球最長開源模型XVERSE-Long-256K《鋼鐵是如何煉成的(俄文版)》測試 無條件免費商用的全球最長開源模型XVERSE-Long-256K

《人類群星閃耀時(德文版)》測試

法律法條 精準應用

#以《中華人民共和國民法典》為例,展示對法律術語的解釋,以及對案例進行邏輯分析、結合實際的彈性應用:

無條件免費商用的全球最長開源模型XVERSE-Long-256K無條件免費商用的全球最長開源模型XVERSE-Long-256K無條件免費商用的全球最長開源模型XVERSE-Long-256K《民法》測試 

手把手教你訓練長文本大模型
 

 1.  技術挑戰

  1. 模型訓練:GPU顯存的佔用與序列長度的平方成正比,使訓練量急遽上升。
  2. 模型結構:序列越長,模型的attention越分散,模型越容易忘記前序內容。
  3. 推理速度:模型序列越長,將大幅度降低模型推理速度。

 2. 元象技術路線
# 長文本大模型技術是在近一年內發展出來的新技術,其主要技術方案為:

  1. 直接進行長序列的預訓練,但會導致訓練量成平方倍的提升。
  2. 透過位置編碼的插值或外推拓展序列長度,這種方法會降低位置編碼的分辨率,從而降低大模型輸出效果。

無條件免費商用的全球最長開源模型XVERSE-Long-256K

元象長文字大模型訓練流程

#第一階段:##ABF 繼續預訓練

    GitHub:https://github.com/xverse-ai/XVERSE-13B
  • hugging face:https://huggingface.co /xverse/XVERSE-13B-256K
  • 魔搭:https://modelscope.cn/models/xverse/XVERSE-13B-256K
  • #詢問傳送:opensource@xverse.cn

以上是無條件免費商用的全球最長開源模型XVERSE-Long-256K的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:机器之心。如有侵權,請聯絡admin@php.cn刪除
及時工程中的思想圖是什麼及時工程中的思想圖是什麼Apr 13, 2025 am 11:53 AM

介紹 在迅速的工程中,“思想圖”是指使用圖理論來構建和指導AI的推理過程的新方法。與通常涉及線性S的傳統方法不同

優化您的組織與Genai代理商的電子郵件營銷優化您的組織與Genai代理商的電子郵件營銷Apr 13, 2025 am 11:44 AM

介紹 恭喜!您經營一家成功的業務。通過您的網頁,社交媒體活動,網絡研討會,會議,免費資源和其他來源,您每天收集5000個電子郵件ID。下一個明顯的步驟是

Apache Pinot實時應用程序性能監視Apache Pinot實時應用程序性能監視Apr 13, 2025 am 11:40 AM

介紹 在當今快節奏的軟件開發環境中,確保最佳應用程序性能至關重要。監視實時指標,例如響應時間,錯誤率和資源利用率可以幫助MAIN

Chatgpt擊中了10億用戶? Openai首席執行官說:'短短幾週內翻了一番Chatgpt擊中了10億用戶? Openai首席執行官說:'短短幾週內翻了一番Apr 13, 2025 am 11:23 AM

“您有幾個用戶?”他扮演。 阿爾特曼回答說:“我認為我們上次說的是每週5億個活躍者,而且它正在迅速增長。” “你告訴我,就像在短短幾週內翻了一番,”安德森繼續說道。 “我說那個私人

pixtral -12b:Mistral AI'第一個多模型模型 - 分析Vidhyapixtral -12b:Mistral AI'第一個多模型模型 - 分析VidhyaApr 13, 2025 am 11:20 AM

介紹 Mistral發布了其第一個多模式模型,即Pixtral-12b-2409。該模型建立在Mistral的120億參數Nemo 12B之上。是什麼設置了該模型?現在可以拍攝圖像和Tex

生成AI應用的代理框架 - 分析Vidhya生成AI應用的代理框架 - 分析VidhyaApr 13, 2025 am 11:13 AM

想像一下,擁有一個由AI驅動的助手,不僅可以響應您的查詢,還可以自主收集信息,執行任務甚至處理多種類型的數據(TEXT,圖像和代碼)。聽起來有未來派?在這個a

生成AI在金融部門的應用生成AI在金融部門的應用Apr 13, 2025 am 11:12 AM

介紹 金融業是任何國家發展的基石,因為它通過促進有效的交易和信貸可用性來推動經濟增長。交易的便利和信貸

在線學習和被動攻擊算法指南在線學習和被動攻擊算法指南Apr 13, 2025 am 11:09 AM

介紹 數據是從社交媒體,金融交易和電子商務平台等來源的前所未有的速度生成的。處理這種連續的信息流是一個挑戰,但它提供了

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
3 週前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
4 週前By尊渡假赌尊渡假赌尊渡假赌

熱工具

mPDF

mPDF

mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

WebStorm Mac版

WebStorm Mac版

好用的JavaScript開發工具

VSCode Windows 64位元 下載

VSCode Windows 64位元 下載

微軟推出的免費、功能強大的一款IDE編輯器

EditPlus 中文破解版

EditPlus 中文破解版

體積小,語法高亮,不支援程式碼提示功能

MantisBT

MantisBT

Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。