搜尋
首頁科技週邊人工智慧「非常接近GPT-4」的WizardLM-2被微軟緊急撤回,有什麼內幕?

前段時間,微軟搞了個烏龍:隆重地開源了 WizardLM-2,又在不久後撤回得乾乾淨淨。

目前可查詢的WizardLM-2 發布訊息,這是一個「真正媲美GPT-4」的開源大模型,在復雜聊天、多語言、推理和代理方面的性能得到了提高。

系列包含三個模型:WizardLM-2 8x22B、WizardLM-2 70B 和 WizardLM-2 7B。其中:

  • WizardLM-2 8x22B 是最先進的模型,也是高度複雜任務內部評估後得出的最佳開源 LLM。
  • WizardLM-2 70B 具備頂級推理能力,是同等規模的首選;
  • WizardLM-2 7B 是速度最快的,其效能可與現有的10 倍大的開源領先模型相媲美。

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回,有什麼內幕?

此外,透過人類偏好評估,WizardLM-28x22B 的能力「只是稍微落後於GPT-4-1106 預覽版,但明顯強於CommandRPlus 和GPT4-0314。開源里程碑嗎?

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回,有什麼內幕?當大家忙著下載模型的時候,團隊卻突然撤回了一切:部落格、GitHub、HuggingFace 全部 404。

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回,有什麼內幕?

圖源:https://wizardlm.github.io/WizardLM2/

團隊的解釋是:

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回,有什麼內幕?

所有Huggingface 的朋友們,大家好!很抱歉,我們刪除了模型。我們已經有一段時間沒有發布幾個月前的模型了,所以我們現在不熟悉新的發布流程:我們不小心遺漏了模型發布流程中的一個必要項目 — 毒性測試。這是目前所有新模型都需要完成的步驟。

我們目前正在快速完成這項測試,然後將盡快重新發布我們的模型。不用擔心,感謝關心和理解。

但AI 社群對WizardLM-2 的關注和討論沒有停止,疑點有幾個:

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回,有什麼內幕?第一,被刪除的開源專案不只是WizardLM-2,團隊所有的Wizard 系列工作都不見了,包括先前的WizardMath 和WizardCoder。

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回,有什麼內幕?

第二,有人質疑,刪除模型權重的同時,為何連部落格也刪除?如果是只是缺少測試部分,沒必要撤回得乾乾淨淨。

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回,有什麼內幕?

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回,有什麼內幕?

團隊的解釋是:「根據相關規定。」具體什麼規定?目前沒人知道。

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回,有什麼內幕?

#

第三,有人猜測 WizardLM 背後的團隊已經被解僱,撤回 Wizard 系列專案也是被迫的。

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回,有什麼內幕?

不過,這種猜測被團隊否定了:

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回,有什麼內幕?

##來源:https://x.com/_Mira___Mira_/status/1783716276944486751

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回,有什麼內幕?

#來源:https://x.com/ DavidFSWD/status/1783682898786152470

而且我們現在搜尋作者的名字,也沒有從微軟官網完全消失:

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回,有什麼內幕?

圖源:https://www.microsoft.com/en-us/research/people/qins/

第四,有人猜測,微軟撤回這個開源模型,一是因為效能太接近GPT-4,二是因為和OpenAI 的技術路線「撞車」了。

具體是什麼路線呢?我們可以看看當初部落格頁面的技術細節。

團隊表示,透過LLM 訓練,自然界中人類生成的資料日益枯竭,而AI 精心創建的資料和AI Step-by-Step 監督的模型將是通往更強大AI 的唯一途徑。

在過去的一年裡,微軟團隊建立了一個完全由人工智慧驅動的合成訓練系統,如下圖所示。

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回,有什麼內幕?

大概分成幾個版塊:

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回,有什麼內幕?

資料預處理:

  1. 資料分析:使用這個pipeline 來獲得新來源資料的不同屬性的分佈,這有助於對資料有一個初步的了解。
  2. 加權採樣:最佳訓練資料的分佈往往與人類聊天語料的自然分佈不一致,需要根據實驗經驗調整訓練資料中各屬性的權重。

「非常接近GPT-4」的WizardLM-2被微軟緊急撤回,有什麼內幕?

Evol Lab:

  1. Evol-Instruct:投入了大量精力重新評估了最初Evol-Instruct 方法中存在的各種問題,並對其進行了初步修改,新方法能讓各種智能體自動產生高品質的指令。
  2. Evol-Answer:引導模型多次產生和重寫回复,可以提高其邏輯性、正確性和親和力。

AI Align AI(AAA):

  1. 協同教學:收集WizardLM 和各種授權開源和專有的最先進模型,然後讓它們協同教學並相互提高,教學內容包括模擬聊天、品質評判、改進建議和縮小技能差距等。
  2. Self-Teaching:WizardLM 可以透過激活學習,為監督學習產生新的進化訓練數據,為強化學習產生偏好數據。

學習:

  1. 監督學習。
  2. 階段 - DPO:為了更有效地進行離線強化學習,將優選資料分割成不同的片段,並逐級改進模型。
  3. RLEIF:採用指令品質獎勵模型(IRM)與過程監督獎勵模型(PRM)結合的方法,使得在線上強化學習中實現更精確的正確性。

最後要說的是,任何猜測都是徒勞的,讓我們期待一下 WizardLM-2 的複出吧。

以上是「非常接近GPT-4」的WizardLM-2被微軟緊急撤回,有什麼內幕?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
META的新AI助手:生產力助推器還是時間下沉?META的新AI助手:生產力助推器還是時間下沉?May 01, 2025 am 11:18 AM

Meta攜手Nvidia、IBM和Dell等合作夥伴,拓展了Llama Stack的企業級部署整合。在安全方面,Meta推出了Llama Guard 4、LlamaFirewall和CyberSecEval 4等新工具,並啟動了Llama Defenders計劃,以增強AI安全性。此外,Meta還向10個全球機構(包括致力於改善公共服務、醫療保健和教育的初創企業)發放了總額150萬美元的Llama Impact Grants。 由Llama 4驅動的全新Meta AI應用,被設想為Meta AI

80%的Zers將嫁給AI:研究80%的Zers將嫁給AI:研究May 01, 2025 am 11:17 AM

公司開創性的人類互動公司Joi AI介紹了“ AI-Iatsionship”一詞來描述這些不斷發展的關係。 Joi AI的關係治療師Jaime Bronstein澄清說,這並不是要取代人類C

AI使互聯網的機器人問題變得更糟。這家耗資20億美元的創業公司在前線AI使互聯網的機器人問題變得更糟。這家耗資20億美元的創業公司在前線May 01, 2025 am 11:16 AM

在線欺詐和機器人攻擊對企業構成了重大挑戰。 零售商與機器人ho積產品,銀行戰斗帳戶接管以及社交媒體平台與模仿者鬥爭。 AI的興起加劇了這個問題,Rende

賣給機器人:將創造或破壞業務的營銷革命賣給機器人:將創造或破壞業務的營銷革命May 01, 2025 am 11:15 AM

AI代理人有望徹底改變營銷,並可能超過以前技術轉變的影響。 這些代理代表了生成AI的重大進步,不僅是處理諸如chatgpt之類的處理信息,而且還採取了Actio

計算機視覺技術如何改變NBA季后賽主持人計算機視覺技術如何改變NBA季后賽主持人May 01, 2025 am 11:14 AM

人工智能對關鍵NBA遊戲4決策的影響 兩場關鍵遊戲4 NBA對決展示了AI在主持儀式中改變遊戲規則的角色。 首先,丹佛的尼古拉·喬基奇(Nikola Jokic)錯過了三分球,導致亞倫·戈登(Aaron Gordon)的最後一秒鐘。 索尼的鷹

AI如何加速再生醫學的未來AI如何加速再生醫學的未來May 01, 2025 am 11:13 AM

傳統上,擴大重生醫學專業知識在全球範圍內要求廣泛的旅行,動手培訓和多年指導。 現在,AI正在改變這一景觀,克服地理局限性並通過EN加速進步

Intel Foundry Direct Connect 2025的關鍵要點Intel Foundry Direct Connect 2025的關鍵要點May 01, 2025 am 11:12 AM

英特爾正努力使其製造工藝重回領先地位,同時努力吸引無晶圓廠半導體客戶在其晶圓廠製造芯片。為此,英特爾必須在業界建立更多信任,不僅要證明其工藝的競爭力,還要證明合作夥伴能夠以熟悉且成熟的工作流程、一致且高可靠性地製造芯片。今天我聽到的一切都讓我相信英特爾正在朝著這個目標前進。 新任首席執行官譚立柏的主題演講拉開了當天的序幕。譚立柏直率而簡潔。他概述了英特爾代工服務的若干挑戰,以及公司為應對這些挑戰、為英特爾代工服務的未來規劃成功路線而採取的措施。譚立柏談到了英特爾代工服務正在實施的流程,以更以客

AI出了問題嗎?現在在那里為此保險AI出了問題嗎?現在在那里為此保險May 01, 2025 am 11:11 AM

全球專業再保險公司Chaucer Group和Armilla AI解決了圍繞AI風險的日益嚴重的問題,已聯手引入了新型的第三方責任(TPL)保險產品。 該政策保護業務不利

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

VSCode Windows 64位元 下載

VSCode Windows 64位元 下載

微軟推出的免費、功能強大的一款IDE編輯器

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中

Atom編輯器mac版下載

Atom編輯器mac版下載

最受歡迎的的開源編輯器

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3 英文版

SublimeText3 英文版

推薦:為Win版本,支援程式碼提示!