搜尋
首頁科技週邊人工智慧媲美GPT-4的開源模型洩漏! Mistral老闆剛剛證實:正式版本還會更強

Mistral-Medium竟然意外洩漏?先前僅能透過API獲得,效能直逼GPT-4。

CEO最新發聲:確有其事,繫早期客戶員工外流。但仍表示敬請期待

媲美GPT-4的開源模型洩漏! Mistral老闆剛剛證實:正式版本還會更強圖片

換句話說,這個版本尚且還是舊的,實際版本效能還會更好。

這兩天,這個名為「Miqu」的神祕模型在大模型社群裡炸了鍋,不少人還懷疑這是LIama的微調版本。

媲美GPT-4的開源模型洩漏! Mistral老闆剛剛證實:正式版本還會更強圖片

Mistral CEO解釋說,他們對Mistral Medium進行了重新訓練,並在基於Llama 2的基礎上進行了改進。這是為了盡快向早期客戶提供接近GPT-4效能的API。預訓練工作在Mistral 7B發布當天就完成了。

如今真相大白,CEO還賣關子,不少網友在底下戳戳手期待。

媲美GPT-4的開源模型洩漏! Mistral老闆剛剛證實:正式版本還會更強圖片

媲美GPT-4的開源模型洩漏! Mistral老闆剛剛證實:正式版本還會更強圖片

Mistral-Medium意外洩漏

我們還是重新來回顧整個事件。 1月28日,一個名叫Miqu Dev的神秘用戶在HuggingFace上發布一組文件「miqu-1-70b」。

媲美GPT-4的開源模型洩漏! Mistral老闆剛剛證實:正式版本還會更強圖片

檔案指出新LLM的「提示格式」以及使用者互動方式與Mistral相同。

同一天,4chan上一個匿名用戶發布了關於miqu-1-70b檔案的連結。

於是乎一些網友注意到了這個神祕的模型,並且開始進行一些基準測試。

結果驚人發現,它在EQ-Bench 上獲得83.5 分(本地評估),超過世界上除GPT-4之外的所有其他大模型

一時間,網友們強烈呼籲將這個大模型加入排行榜中,並找出背後的真實模型。

大致懷疑方向主要有三:

  • 與Mistral-Medium是同一個模型

有網友曬出了對比效果:它知道標準答案還說得過去,但不可能連俄語措辭也跟Mistral-Medium完全相同吧。

媲美GPT-4的開源模型洩漏! Mistral老闆剛剛證實:正式版本還會更強圖片

  • Miqu應該是LIama 2的微調版本。

但另外的網友發現,它並不是MoE模型,且與LIama 2架構相同、參數相同、層數相同,。

媲美GPT-4的開源模型洩漏! Mistral老闆剛剛證實:正式版本還會更強圖片

不過馬上就受到其他網友的質疑,Mistral 7b也具有與 llama 7B 相同的參數和層數。

相反,這更像是Mistral早期非MoE版本模型

媲美GPT-4的開源模型洩漏! Mistral老闆剛剛證實:正式版本還會更強圖片

不過討論來討論去,不可否認的是在不少人心中,這已經是最接近GPT-4的模型了。

媲美GPT-4的開源模型洩漏! Mistral老闆剛剛證實:正式版本還會更強圖片

如今,Mistral 聯合創始人兼首席執行官Arthur Mensch承認洩露,是他們一位早期客戶員工過於熱情,洩露了他們訓練並公開發布的一個舊模型量化版本。

至於Perplexity這邊CEO也澄清說,他們從未獲得Mistral Medium的權重。

媲美GPT-4的開源模型洩漏! Mistral老闆剛剛證實:正式版本還會更強圖片

網友擔心是否會撤下這個版本。

媲美GPT-4的開源模型洩漏! Mistral老闆剛剛證實:正式版本還會更強圖片

有趣的是,Mensch並沒有要求刪除HuggingFace上的貼文。

媲美GPT-4的開源模型洩漏! Mistral老闆剛剛證實:正式版本還會更強圖片

而是留下評論說:可能會考慮歸屬問題。

參考連結:
[1]https://www.reddit.com/r/LocalLLaMA/comments/1af4fbg/llm_comparisontest_miqu170b/

[2] https://twitter.com/teortaxesTex/status/1752427812466593975
[3]https://twitter.com/N8Programs/status/1752441060133892503
#[4] https://twitter.com/AravSrinivas/status/1752803571035504858

####

以上是媲美GPT-4的開源模型洩漏! Mistral老闆剛剛證實:正式版本還會更強的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
及時工程中的思想圖是什麼及時工程中的思想圖是什麼Apr 13, 2025 am 11:53 AM

介紹 在迅速的工程中,“思想圖”是指使用圖理論來構建和指導AI的推理過程的新方法。與通常涉及線性S的傳統方法不同

優化您的組織與Genai代理商的電子郵件營銷優化您的組織與Genai代理商的電子郵件營銷Apr 13, 2025 am 11:44 AM

介紹 恭喜!您經營一家成功的業務。通過您的網頁,社交媒體活動,網絡研討會,會議,免費資源和其他來源,您每天收集5000個電子郵件ID。下一個明顯的步驟是

Apache Pinot實時應用程序性能監視Apache Pinot實時應用程序性能監視Apr 13, 2025 am 11:40 AM

介紹 在當今快節奏的軟件開發環境中,確保最佳應用程序性能至關重要。監視實時指標,例如響應時間,錯誤率和資源利用率可以幫助MAIN

Chatgpt擊中了10億用戶? Openai首席執行官說:'短短幾週內翻了一番Chatgpt擊中了10億用戶? Openai首席執行官說:'短短幾週內翻了一番Apr 13, 2025 am 11:23 AM

“您有幾個用戶?”他扮演。 阿爾特曼回答說:“我認為我們上次說的是每週5億個活躍者,而且它正在迅速增長。” “你告訴我,就像在短短幾週內翻了一番,”安德森繼續說道。 “我說那個私人

pixtral -12b:Mistral AI'第一個多模型模型 - 分析Vidhyapixtral -12b:Mistral AI'第一個多模型模型 - 分析VidhyaApr 13, 2025 am 11:20 AM

介紹 Mistral發布了其第一個多模式模型,即Pixtral-12b-2409。該模型建立在Mistral的120億參數Nemo 12B之上。是什麼設置了該模型?現在可以拍攝圖像和Tex

生成AI應用的代理框架 - 分析Vidhya生成AI應用的代理框架 - 分析VidhyaApr 13, 2025 am 11:13 AM

想像一下,擁有一個由AI驅動的助手,不僅可以響應您的查詢,還可以自主收集信息,執行任務甚至處理多種類型的數據(TEXT,圖像和代碼)。聽起來有未來派?在這個a

生成AI在金融部門的應用生成AI在金融部門的應用Apr 13, 2025 am 11:12 AM

介紹 金融業是任何國家發展的基石,因為它通過促進有效的交易和信貸可用性來推動經濟增長。交易的便利和信貸

在線學習和被動攻擊算法指南在線學習和被動攻擊算法指南Apr 13, 2025 am 11:09 AM

介紹 數據是從社交媒體,金融交易和電子商務平台等來源的前所未有的速度生成的。處理這種連續的信息流是一個挑戰,但它提供了

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
3 週前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
4 週前By尊渡假赌尊渡假赌尊渡假赌

熱工具

WebStorm Mac版

WebStorm Mac版

好用的JavaScript開發工具

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中

Atom編輯器mac版下載

Atom編輯器mac版下載

最受歡迎的的開源編輯器

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具