Mistral-Medium意外洩漏？衝上榜單的這個神秘模型讓AI社群討論爆了-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

Mistral-Medium意外洩漏？衝上榜單的這個神秘模型讓AI社群討論爆了

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Feb 01, 2024 am 10:30 AM

產業miqu

「我現在 100% 確信 Miqu 與 Perplexity Labs 上的 Mistral-Medium 是同一個模型。」

近日，一則關於「Mistral-Medium 模型洩露」的消息引起了大家的注意。

據傳聞，有關一個名為「Miqu」的新模型的洩漏訊息與評估語言模型情緒智商的基準EQ-Bench有關。根據相關數據顯示，EQ-Bench與MMLU的相關性約為0.97，與Arena Elo的相關性約為0.94。有趣的是，Miqu在這個基準評估中直接超越了除了GPT-4以外的所有大型模型，並且它的得分與Mistral-Medium非常接近。這一消息引起了廣泛的關注和討論。

Mistral-Medium意外洩漏？衝上榜單的這個神秘模型讓AI社群討論爆了

^{圖片來源：https://x.com/N8Programs/status/1752441060133892503?s=20}

#開源位址：https://huggingface.co/miqudev/miqu-1-70b

這麼強大的模型，但專案的發布者卻是一位神秘人士：

Mistral-Medium意外洩漏？衝上榜單的這個神秘模型讓AI社群討論爆了

有人問「who made you」， Miqu 直接自報家門：「I was created by the Mistral Al team.」

Mistral-Medium意外洩漏？衝上榜單的這個神秘模型讓AI社群討論爆了

有人分別向兩個模型發送了同一道測試問題，收到的答案都是用俄語表達的。測試者加深了懷疑：「它似乎知道標準謎題，但如果是惡作劇者，根本不可能將其調整為同樣用俄語回答。」

Mistral-Medium意外洩漏？衝上榜單的這個神秘模型讓AI社群討論爆了

在翻譯過程中，表述也近乎相同。

Mistral-Medium意外洩漏？衝上榜單的這個神秘模型讓AI社群討論爆了

Miqu 到底來自何方？它真的是 Mistral-Medium 嗎？

在持續兩天的熱議中，多位開發者針對兩個模型做了對比，對比的結果指向以下幾種可能性：

1、Miqu 就是Mistral-Medium ；

2、Miqu 確實是來自MistralAI 的一個模型，但是是一些早期的MoE 實驗版本或其他版本；

3、Miqu 是Llama2 的微調版本。

在前面，我們介紹了支持第一種可能性的開發者所給出的理由。隨著事件的發酵，更多開發者投入了解密一般的行動中，對兩個模型進行了更深入的測試。一位 reddit 網友熬夜肝出的測試表明，Miqu 更像是 MistralAI 模型的早期版本。

Mistral-Medium意外洩漏？衝上榜單的這個神秘模型讓AI社群討論爆了

這位開發者將模型應用於四個專業的德語線上資料保護培訓 / 考試。測試資料、問題及所有指令都是用德語進行的，而字符卡是英語的。這可以測試翻譯能力和跨語言理解能力。

具體測試方法如下：

在提供資訊之前，用德語指示模型：「我將給你一些訊息，請注意這些訊息，但回答時才需用『OK』來確認你已理解，不要多說其他的。」這是為了測試模型對指令的理解和執行能力。
在提供主題的所有資訊後，向模型提出考題。這是一個選擇題（A/B/C），其中第一個問題和最後一個問題相同，但選項順序和字母（X/Y/Z）被更改。每次測驗包含 4-6 個考題，總共 18 個多項選擇題。
根據模型給出的正確答案數量來進行排名，首先考慮的是在提供了課程資訊後的答案，其次是在沒有提前提供資訊的情況下盲目回答的答案，以應對平手狀況。所有測驗都是獨立的單元，每次測驗之間會清除上下文，各個會話之間不保留任何記憶或狀態。

詳細測試報告如下：

miqudev/miqu-1-70b GGUF Q5_K_M，32K 上下文， Mistral 格式：只對4 4 4 5=17/18 道選擇題給了正確答案。沒有先前的訊息，只回答問題，給出正確答案：4 3 1 5=13/18。沒有依照說明用 "OK" 確認資料輸入。

在測試過程中，開發者發現 Miqu 與 Mixtral 有許多相似之處：出色的德語拼寫和語法雙語；在回復中添加翻譯；在回復中添加註釋和評論。

不過，在這位開發者的測驗中，Miqu 與 Mixtral-8x7B-Instruct-v0.1（4-bit）相比表現差一些，仍優於 Mistral Small 和 Medium。但它並不比 Mixtral 8x7B Instruct 好很多。這位開發者猜測，Miqu 可能是洩漏的 MistralAI 模型，是一個較舊的，可能是概念驗證模型。

這是我們目前看到的支持第二種說法的最詳細的測試。

不過，也有開發者認為，Miqu 和 MistralAI 沒有關係，反而更像 Llama 70B，因為其架構與 Llama 70B「完全相同」，「不是專家混合模型」。

Mistral-Medium意外洩漏？衝上榜單的這個神秘模型讓AI社群討論爆了

同樣地，也有人測試之後發現，Miqu 的確更像Llama：

Mistral-Medium意外洩漏？衝上榜單的這個神秘模型讓AI社群討論爆了

但從得分差距來看，Miqu 和Llama 70B 顯然又不是同一個模型。

Mistral-Medium意外洩漏？衝上榜單的這個神秘模型讓AI社群討論爆了

所以，有人總結，要嘛Miqu 是Llama 微調版本，要嘛是Mistral-Medium 的早期版本：

Mistral-Medium意外洩漏？衝上榜單的這個神秘模型讓AI社群討論爆了

前者為真的話，Miqu 可能是在Mistral-Medium 資料集上微調的Llama 70B：

Mistral-Medium意外洩漏？衝上榜單的這個神秘模型讓AI社群討論爆了

假如後者為真，Miqu 只是Mistral API 的蒸餾，這或許將是「美國偽造登月」等級的鬧劇：

Mistral-Medium意外洩漏？衝上榜單的這個神秘模型讓AI社群討論爆了

最後一個問題，洩漏者是誰？

根據許多 X 平台使用者提供的線索，這次疑似洩漏的模型最初是發在一個名叫 4chan 的網站上的。這個網站是一個完全匿名的即時訊息論壇，使用者不需要註冊就能發表圖文言論。

Mistral-Medium意外洩漏？衝上榜單的這個神秘模型讓AI社群討論爆了

當然，這些結論均屬主觀想法。對於所有的 AI 研究者來說，這波劇情需要一個「真相」來終結。

^{參考連結：https://www.reddit.com/r/LocalLLaMA/comments/1af4fbg/llm_comparisontest_miqu170b/}

以上是Mistral-Medium意外洩漏？衝上榜單的這個神秘模型讓AI社群討論爆了的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文轉載於：机器之心。如有侵權，請聯絡admin@php.cn刪除

DSA如何弯道超车NVIDIA GPU？Sep 20, 2023 pm 06:09 PM

你可能听过以下犀利的观点：1.跟着NVIDIA的技术路线，可能永远也追不上NVIDIA的脚步。2.DSA或许有机会追赶上NVIDIA，但目前的状况是DSA濒临消亡，看不到任何希望另一方面，我们都知道现在大模型正处于风口位置，业界很多人想做大模型芯片，也有很多人想投大模型芯片。但是，大模型芯片的设计关键在哪，大带宽大内存的重要性好像大家都知道，但做出来的芯片跟NVIDIA相比，又有何不同？带着问题，本文尝试给大家一点启发。纯粹以观点为主的文章往往显得形式主义，我们可以通过一个架构的例子来说明Sam

阿里云通义千问14B模型开源！性能超越Llama2等同等尺寸模型Sep 25, 2023 pm 10:25 PM

2021年9月25日，阿里云发布了开源项目通义千问140亿参数模型Qwen-14B以及其对话模型Qwen-14B-Chat，并且可以免费商用。Qwen-14B在多个权威评测中表现出色，超过了同等规模的模型，甚至有些指标接近Llama2-70B。此前，阿里云还开源了70亿参数模型Qwen-7B，仅一个多月的时间下载量就突破了100万，成为开源社区的热门项目Qwen-14B是一款支持多种语言的高性能开源模型，相比同类模型使用了更多的高质量数据，整体训练数据超过3万亿Token，使得模型具备更强大的推

ICCV 2023揭晓：ControlNet、SAM等热门论文斩获奖项Oct 04, 2023 pm 09:37 PM

在法国巴黎举行了国际计算机视觉大会ICCV（InternationalConferenceonComputerVision）本周开幕作为全球计算机视觉领域顶级的学术会议，ICCV每两年召开一次。ICCV的热度一直以来都与CVPR不相上下，屡创新高在今天的开幕式上，ICCV官方公布了今年的论文数据：本届ICCV共有8068篇投稿，其中有2160篇被接收，录用率为26.8%，略高于上一届ICCV2021的录用率25.9%在论文主题方面，官方也公布了相关数据：多视角和传感器的3D技术热度最高在今天的开

复旦大学团队发布中文智慧法律系统DISC-LawLLM，构建司法评测基准，开源30万微调数据Sep 29, 2023 pm 01:17 PM

随着智慧司法的兴起，智能化方法驱动的智能法律系统有望惠及不同群体。例如，为法律专业人员减轻文书工作，为普通民众提供法律咨询服务，为法学学生提供学习和考试辅导。由于法律知识的独特性和司法任务的多样性，此前的智慧司法研究方面主要着眼于为特定任务设计自动化算法，难以满足对司法领域提供支撑性服务的需求，离应用落地有不小的距离。而大型语言模型（LLMs）在不同的传统任务上展示出强大的能力，为智能法律系统的进一步发展带来希望。近日，复旦大学数据智能与社会计算实验室（FudanDISC）发布大语言模型驱动的中

百度文心一言全面向全社会开放，率先迈出重要一步Aug 31, 2023 pm 01:33 PM

8月31日，文心一言首次向全社会全面开放。用户可以在应用商店下载“文心一言APP”或登录“文心一言官网”（https://yiyan.baidu.com）进行体验据报道，百度计划推出一系列经过全新重构的AI原生应用，以便让用户充分体验生成式AI的理解、生成、逻辑和记忆等四大核心能力今年3月16日，文心一言开启邀测。作为全球大厂中首个发布的生成式AI产品，文心一言的基础模型文心大模型早在2019年就在国内率先发布，近期升级的文心大模型3.5也持续在十余个国内外权威测评中位居第一。李彦宏表示，当文心

AI技术在蚂蚁集团保险业务中的应用：革新保险服务，带来全新体验Sep 20, 2023 pm 10:45 PM

保险行业对于社会民生和国民经济的重要性不言而喻。作为风险管理工具，保险为人民群众提供保障和福利，推动经济的稳定和可持续发展。在新的时代背景下，保险行业面临着新的机遇和挑战，需要不断创新和转型，以适应社会需求的变化和经济结构的调整近年来，中国的保险科技蓬勃发展。通过创新的商业模式和先进的技术手段，积极推动保险行业实现数字化和智能化转型。保险科技的目标是提升保险服务的便利性、个性化和智能化水平，以前所未有的速度改变传统保险业的面貌。这一发展趋势为保险行业注入了新的活力，使保险产品更贴近人民群众的实际

致敬TempleOS，有开发者创建了启动Llama 2的操作系统，网友：8G内存老电脑就能跑Oct 07, 2023 pm 10:09 PM

不得不说，Llama2的「二创」项目越来越硬核、有趣了。自Meta发布开源大模型Llama2以来，围绕着该模型的「二创」项目便多了起来。此前7月，特斯拉前AI总监、重回OpenAI的AndrejKarpathy利用周末时间，做了一个关于Llama2的有趣项目llama2.c，让用户在PyTorch中训练一个babyLlama2模型，然后使用近500行纯C、无任何依赖性的文件进行推理。今天，在Karpathyllama2.c项目的基础上，又有开发者创建了一个启动Llama2的演示操作系统，以及一个

快手黑科技“子弹时间”赋能亚运转播，打造智慧观赛新体验Oct 11, 2023 am 11:21 AM

杭州第19届亚运会不仅是国际顶级体育盛会，更是一场精彩绝伦的中国科技盛宴。本届亚运会中，快手StreamLake与杭州电信深度合作，联合打造智慧观赛新体验，在击剑赛事的转播中，全面应用了快手StreamLake六自由度技术，其中“子弹时间”也是首次应用于击剑项目国际顶级赛事。中国电信杭州分公司智能亚运专班组长芮杰表示，依托快手StreamLake自研的4K3D虚拟运镜视频技术和中国电信5G/全光网，通过赛场内部署的4K专业摄像机阵列实时采集的高清竞赛视频，

See all articles