「非常接近GPT-4」的WizardLM-2被微軟緊急撤回，有什麼內幕？-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回，有什麼內幕？

PHPz

Apr 30, 2024 pm 04:40 PM

gitai模型

前段時間，微軟搞了個烏龍：隆重地開源了 WizardLM-2，又在不久後撤回得乾乾淨淨。

目前可查詢的WizardLM-2 發布訊息，這是一個「真正媲美GPT-4」的開源大模型，在復雜聊天、多語言、推理和代理方面的性能得到了提高。

系列包含三個模型：WizardLM-2 8x22B、WizardLM-2 70B 和 WizardLM-2 7B。其中：

WizardLM-2 8x22B 是最先進的模型，也是高度複雜任務內部評估後得出的最佳開源 LLM。
WizardLM-2 70B 具備頂級推理能力，是同等規模的首選；
WizardLM-2 7B 是速度最快的，其效能可與現有的10 倍大的開源領先模型相媲美。

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回，有什麼內幕？

此外，透過人類偏好評估，WizardLM-28x22B 的能力「只是稍微落後於GPT-4-1106 預覽版，但明顯強於CommandRPlus 和GPT4-0314。開源里程碑嗎？

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回，有什麼內幕？當大家忙著下載模型的時候，團隊卻突然撤回了一切：部落格、GitHub、HuggingFace 全部 404。

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回，有什麼內幕？

圖源：https://wizardlm.github.io/WizardLM2/

團隊的解釋是：

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回，有什麼內幕？

所有Huggingface 的朋友們，大家好！很抱歉，我們刪除了模型。我們已經有一段時間沒有發布幾個月前的模型了，所以我們現在不熟悉新的發布流程：我們不小心遺漏了模型發布流程中的一個必要項目 — 毒性測試。這是目前所有新模型都需要完成的步驟。

我們目前正在快速完成這項測試，然後將盡快重新發布我們的模型。不用擔心，感謝關心和理解。

但AI 社群對WizardLM-2 的關注和討論沒有停止，疑點有幾個：

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回，有什麼內幕？第一，被刪除的開源專案不只是WizardLM-2，團隊所有的Wizard 系列工作都不見了，包括先前的WizardMath 和WizardCoder。

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回，有什麼內幕？

第二，有人質疑，刪除模型權重的同時，為何連部落格也刪除？如果是只是缺少測試部分，沒必要撤回得乾乾淨淨。

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回，有什麼內幕？

團隊的解釋是：「根據相關規定。」具體什麼規定？目前沒人知道。

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回，有什麼內幕？

第三，有人猜測 WizardLM 背後的團隊已經被解僱，撤回 Wizard 系列專案也是被迫的。

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回，有什麼內幕？

不過，這種猜測被團隊否定了：

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回，有什麼內幕？

##來源：https://x.com/_Mira___Mira_/status/1783716276944486751

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回，有什麼內幕？

#來源：https://x.com/ DavidFSWD/status/1783682898786152470

而且我們現在搜尋作者的名字，也沒有從微軟官網完全消失：

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回，有什麼內幕？

圖源：https://www.microsoft.com/en-us/research/people/qins/

第四，有人猜測，微軟撤回這個開源模型，一是因為效能太接近GPT-4，二是因為和OpenAI 的技術路線「撞車」了。

具體是什麼路線呢？我們可以看看當初部落格頁面的技術細節。

團隊表示，透過LLM 訓練，自然界中人類生成的資料日益枯竭，而AI 精心創建的資料和AI Step-by-Step 監督的模型將是通往更強大AI 的唯一途徑。

在過去的一年裡，微軟團隊建立了一個完全由人工智慧驅動的合成訓練系統，如下圖所示。

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回，有什麼內幕？

大概分成幾個版塊：

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回，有什麼內幕？

資料預處理：

資料分析：使用這個pipeline 來獲得新來源資料的不同屬性的分佈，這有助於對資料有一個初步的了解。
加權採樣：最佳訓練資料的分佈往往與人類聊天語料的自然分佈不一致，需要根據實驗經驗調整訓練資料中各屬性的權重。

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回，有什麼內幕？

Evol Lab：

Evol-Instruct：投入了大量精力重新評估了最初Evol-Instruct 方法中存在的各種問題，並對其進行了初步修改，新方法能讓各種智能體自動產生高品質的指令。
Evol-Answer：引導模型多次產生和重寫回复，可以提高其邏輯性、正確性和親和力。

AI Align AI（AAA）：

協同教學：收集WizardLM 和各種授權開源和專有的最先進模型，然後讓它們協同教學並相互提高，教學內容包括模擬聊天、品質評判、改進建議和縮小技能差距等。
Self-Teaching：WizardLM 可以透過激活學習，為監督學習產生新的進化訓練數據，為強化學習產生偏好數據。

學習：

監督學習。
階段 - DPO：為了更有效地進行離線強化學習，將優選資料分割成不同的片段，並逐級改進模型。
RLEIF：採用指令品質獎勵模型（IRM）與過程監督獎勵模型（PRM）結合的方法，使得在線上強化學習中實現更精確的正確性。

最後要說的是，任何猜測都是徒勞的，讓我們期待一下 WizardLM-2 的複出吧。

以上是「非常接近GPT-4」的WizardLM-2被微軟緊急撤回，有什麼內幕？的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文轉載於：51CTO.COM。如有侵權，請聯絡admin@php.cn刪除

META的新AI助手：生產力助推器還是時間下沉？May 01, 2025 am 11:18 AM

Meta攜手Nvidia、IBM和Dell等合作夥伴，拓展了Llama Stack的企業級部署整合。在安全方面，Meta推出了Llama Guard 4、LlamaFirewall和CyberSecEval 4等新工具，並啟動了Llama Defenders計劃，以增強AI安全性。此外，Meta還向10個全球機構（包括致力於改善公共服務、醫療保健和教育的初創企業）發放了總額150萬美元的Llama Impact Grants。由Llama 4驅動的全新Meta AI應用，被設想為Meta AI

80％的Zers將嫁給AI：研究May 01, 2025 am 11:17 AM

公司開創性的人類互動公司Joi AI介紹了“ AI-Iatsionship”一詞來描述這些不斷發展的關係。 Joi AI的關係治療師Jaime Bronstein澄清說，這並不是要取代人類C

AI使互聯網的機器人問題變得更糟。這家耗資20億美元的創業公司在前線May 01, 2025 am 11:16 AM

在線欺詐和機器人攻擊對企業構成了重大挑戰。零售商與機器人ho積產品，銀行戰斗帳戶接管以及社交媒體平台與模仿者鬥爭。 AI的興起加劇了這個問題，Rende

賣給機器人：將創造或破壞業務的營銷革命May 01, 2025 am 11:15 AM

AI代理人有望徹底改變營銷，並可能超過以前技術轉變的影響。這些代理代表了生成AI的重大進步，不僅是處理諸如chatgpt之類的處理信息，而且還採取了Actio

計算機視覺技術如何改變NBA季后賽主持人May 01, 2025 am 11:14 AM

人工智能對關鍵NBA遊戲4決策的影響兩場關鍵遊戲4 NBA對決展示了AI在主持儀式中改變遊戲規則的角色。首先，丹佛的尼古拉·喬基奇（Nikola Jokic）錯過了三分球，導致亞倫·戈登（Aaron Gordon）的最後一秒鐘。索尼的鷹

AI如何加速再生醫學的未來May 01, 2025 am 11:13 AM

傳統上，擴大重生醫學專業知識在全球範圍內要求廣泛的旅行，動手培訓和多年指導。現在，AI正在改變這一景觀，克服地理局限性並通過EN加速進步

Intel Foundry Direct Connect 2025的關鍵要點May 01, 2025 am 11:12 AM

英特爾正努力使其製造工藝重回領先地位，同時努力吸引無晶圓廠半導體客戶在其晶圓廠製造芯片。為此，英特爾必須在業界建立更多信任，不僅要證明其工藝的競爭力，還要證明合作夥伴能夠以熟悉且成熟的工作流程、一致且高可靠性地製造芯片。今天我聽到的一切都讓我相信英特爾正在朝著這個目標前進。新任首席執行官譚立柏的主題演講拉開了當天的序幕。譚立柏直率而簡潔。他概述了英特爾代工服務的若干挑戰，以及公司為應對這些挑戰、為英特爾代工服務的未來規劃成功路線而採取的措施。譚立柏談到了英特爾代工服務正在實施的流程，以更以客