搜尋
首頁科技週邊人工智慧挑戰OpenAI,微軟自研5000億參數絕密武器曝光!前GoogleDeepMind高層帶隊

不需要OpenAI,微軟或許也會成為AI領頭羊!

外媒Information爆料稱,微軟內部正在開發自家首款5000億參數的大模型MAl-1。

挑戰OpenAI,微軟自研5000億參數絕密武器曝光!前GoogleDeepMind高層帶隊

這剛好是,納德拉帶領團隊證明自己的時候到了。

在向OpenAI投資100多億美元之後,微軟才獲得了GPT-3.5/GPT-4先進模型的使用權,但終究不是長久之計。

甚至,先前有傳言稱,微軟已經淪落為OpenAI的一個IT部門。

在過去的一年,每個人熟知的,微軟在LLM方面的研究,主要集中在小體積phi的更新,例如P​​hi-3的開源。

而在大模型的專攻上,除了圖靈系列,微軟內部還未透露半點風聲。

就在今天,微軟技術長Kevin Scott證實,MAI大模型確實正在開發中。

挑戰OpenAI,微軟自研5000億參數絕密武器曝光!前GoogleDeepMind高層帶隊

顯然,微軟秘密籌備大模型的計劃,是為了能夠開發出一款全新LLM,能夠與OpenAI、Google、Anthropic頂尖模型競爭。

畢竟,納德拉曾說過,「如果OpenAI明天消失了,也無關緊要」。

「我們有的是人才、有的是算力、有的是數據,我們什麼都不缺。我們在他們之下,在他們之上,在他們周圍」。

挑戰OpenAI,微軟自研5000億參數絕密武器曝光!前GoogleDeepMind高層帶隊

看來,微軟的底氣,就是自己。

挑戰OpenAI,微軟自研5000億參數絕密武器曝光!前GoogleDeepMind高層帶隊

自研5000億MAI-1大模型

據介紹,MAI-1大模型由前GoogleDeepMind負責人Mustafa Suleyman,負責監督。

值得一提的是,Suleyman在加入微軟之前,還是AI新創Inflection AI創辦人兼CEO。

創辦於2022年,一年的時間,他帶領團隊推出了大模型Inflection(目前已更新到了2.5版本),以及日活破百萬的高情商AI助手Pi 。

不過因為找不到正確的商業模式,Suleyman和另一位聯創,以及大部分員工,在3月共同加入微軟。

挑戰OpenAI,微軟自研5000億參數絕密武器曝光!前GoogleDeepMind高層帶隊

也就是說,Suleyman和團隊負責這個新專案MAI-1,會為此帶來更多的前沿大模型的經驗。

還是要提一句,MAI-1模型是微軟自研發的,並非從Inflection模型繼承而來。

據兩位微軟員工稱,「MAI-1與Inflection先前發布的模型不同」。不過,訓練過程可能會用到其訓練資料和技術。

擁有5000億參數,MAI-1的參數規模將遠遠超出,微軟以往訓練的任何小規模開源模型。

這也意味著,它將需要更多的算力、數據,訓練成本也是高昂的。

為了訓練這款新模型,微軟已經預留了一大批配備英偉達GPU的伺服器,並一直在編制訓練資料以優化模型。

其中,包括來自GPT-4產生的文本,以及外部來源(網路公共資料)的各種資料集。

大小模型,我都要

相較之下,GPT-4曾被曝出有1.8兆參數,Meta、Mistral等AI公司發布較小開源模型,則有700億參數。

當然,微軟採取的是多管齊下的策略,也就是大小模型一起研發。

其中,最經典的便是Phi-3了——一個能夠塞進手機的小模型,而且最小尺寸3.8B性能碾壓GPT-3.5。

挑戰OpenAI,微軟自研5000億參數絕密武器曝光!前GoogleDeepMind高層帶隊

Phi-3 mini在量化到4bit的情況下,只佔用大約1.8GB的內存,用iPhone14每秒可產生12個token 。

挑戰OpenAI,微軟自研5000億參數絕密武器曝光!前GoogleDeepMind高層帶隊

在網友拋出「應該用更低成本訓練AI,不是更好嗎」的問題後,Kevin Scott回覆到:

這並不是一個非此即彼的關係。在許多AI應用中,我們結合使用大型前緣模型和更小、更有針對性的模型。我們做了大量工作,確保SLM在設備上和雲端中都能很好地運作。我們在訓練SLM方面累積了大量經驗,甚至將其中一些工作開源,供他人研究和使用。我認為,在可預見的未來,這種大與小的結合還會持續下去。

挑戰OpenAI,微軟自研5000億參數絕密武器曝光!前GoogleDeepMind高層帶隊

這表明,微軟既要開發成本低廉、可整合到應用程式中,並能在行動裝置上運行的SLM,也要開發更大、更先進的AI模型。

目前,微軟自稱是一家「Copilot公司」。得到AI加持的Copilot聊天機器人,可以完成撰寫電子郵件、快速總結文件等任務。

而未來,下一步的機會在哪裡?

大小模型兼顧,正體現了充滿創新活力的微軟,更願意探索AI的新路徑。

不給OpenAI當「IT」了?

話又說回來,自研MAI-1,並不代表微軟將會拋棄OpenAI。

首席技術長Kevin Scott在今早的貼文中首先,肯定了微軟與OpenAI合作五年的堅固「友誼」。

我們一直在為合作夥伴OpenAI建造大型超算,來訓練前沿的AI模型。然後,兩家都會將模型,應用到自家的產品和服務中,讓更多的人受益。

而且,每一代新的超算都將比上一代,更加強大,因此OpenAI訓出的每個前沿模型,都要比上一個更加先進。

我們將繼續沿著這條路走下去——不斷建立更強大的超算,讓OpenAI能夠訓練出引領整個產業的模型。我們的合作將會產生越來越大的影響力。

前段時間,外媒曝光了,微軟和OpenAI聯手打造AI超算「星際之門」,將斥資高達1150億美元。

據稱,最快將在2028年推出超算,並在2030年之前進一步擴展。

挑戰OpenAI,微軟自研5000億參數絕密武器曝光!前GoogleDeepMind高層帶隊

包括先前,微軟工程師向創業家Kyle Corbitt爆料稱,微軟正在緊鑼密鼓地建設10萬個H100,以供OpenAI訓練GPT- 6。

挑戰OpenAI,微軟自研5000億參數絕密武器曝光!前GoogleDeepMind高層帶隊

種種跡象表明,微軟與O​​penAI之間合作,只會更加牢固。

此外,Scott也表示,「除了與OpenAI的合作,微軟多年來一直都在讓MSR和各產品團隊開發AI模型」。

AI模型幾乎深入了,微軟的所有產品、服務和營運過程。團隊有時也需要進行客製化工作,不論是從零開始訓模型,還是對現有模型進行微調。

未來,還會有更多類似的這樣的情況。

這些模型中,有些被命名為Turing、MAI等,還有的命名為Phi,我們並將其開源。

雖然我的表達可能沒有那麼引人注目,但這是現實。對於我們這些極客來說,鑑於這一切在實踐中的複雜性,這是一個非常令人興奮的現實。

解密「圖靈」模型

除了MAI、Phi系列模型,代號「Turing」是微軟在2017年在內部開啟的計劃,旨在打造一款大模型,並應用到所有產品線中。

挑戰OpenAI,微軟自研5000億參數絕密武器曝光!前GoogleDeepMind高層帶隊

經過3年研發,他們在2020年首次發表170億參數的T-NLG模型,創下當時有史以來最大參數規模的LLM記錄。

挑戰OpenAI,微軟自研5000億參數絕密武器曝光!前GoogleDeepMind高層帶隊

到了2021年,微軟聯手英偉達發布了5,300億參數的Megatron-Turing(MT-NLP),在一系列廣泛的自然語言任務中表現出了「無與倫比」的準確性。

挑戰OpenAI,微軟自研5000億參數絕密武器曝光!前GoogleDeepMind高層帶隊

同年,視覺語言模型Turing Bletchley首次面世。

去年8月,該多模態模型已經迭代到了V3版本,並且已經整合進Bing等相關產品中,以提供更出色的圖像搜尋體驗。

挑戰OpenAI,微軟自研5000億參數絕密武器曝光!前GoogleDeepMind高層帶隊

此外,微軟也在2021年和2022年發布了「圖靈通用語言表示模型」-T-ULRv5和T-ULRv6兩個版本。

目前,「圖靈」模型已經用在了,Word中的智慧查詢(SmartFind),Xbox中的問題匹配(Question Matching)上。

還有團隊研發的影像超解析度模型Turing Image Super-Resolution(T-ISR),已在必應地圖中應用,可以為全球用戶提高航空影像的品質.

挑戰OpenAI,微軟自研5000億參數絕密武器曝光!前GoogleDeepMind高層帶隊

目前,MAI-1新模型具體會在哪裡得到應用,還未確定,將取決於其性能表現。

順便提一句,關於MAI-1更多的信息,可能會在5月21日-23日微軟Build開發者大會上首次展示。

接下來,就是坐等MAI-1發布了。

以上是挑戰OpenAI,微軟自研5000億參數絕密武器曝光!前GoogleDeepMind高層帶隊的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
5個用於微調LLM的負擔得起的雲平台5個用於微調LLM的負擔得起的雲平台Apr 25, 2025 am 10:30 AM

微調大語言模型(LLM)很昂貴,需要強大的GPU和實質性的計算資源。 但是,負擔得起

DeepSeek V3 vs Llama 4:哪種模型統治至高無上? - 分析VidhyaDeepSeek V3 vs Llama 4:哪種模型統治至高無上? - 分析VidhyaApr 25, 2025 am 10:27 AM

在不斷發展的大語言模型的景觀中,DeepSeek V3 vs Llama 4已成為開發人員,研究人員和AI愛好者的最熱門對決之一。無論您是針對燃燒速度的輸液而優化

什麼是開源和開放重量模型?什麼是開源和開放重量模型?Apr 25, 2025 am 10:19 AM

DeepSeek模型和Google的Gemma 3強調了“開放” AI模型開發的增長趨勢,強調了出色的推理能力和輕量級設計。 Openai準備通過即將到來的Quo為這個生態系統做出貢獻

下一個項目的前13個高級抹布技術下一個項目的前13個高級抹布技術Apr 25, 2025 am 10:07 AM

AI可以大規模產生真正相關的答案嗎?我們如何確保它了解複雜的多轉交談?我們如何避免自信地吐出不正確的事實?這些是Mo的挑戰

Llama 4型號:Meta AI正在開放購買最好的! - 分析VidhyaLlama 4型號:Meta AI正在開放購買最好的! - 分析VidhyaApr 25, 2025 am 10:06 AM

Meta的Llama 4:開源AI Powerhouses的三重奏 Meta AI通過同時發布了Llama 4 Banner下的三種開創性的大語言模型(LLM),從而破壞了AI景觀:Scout,Maverick和Beamemoth。 這一舉動與SH進行了對比

代理商OPS的十大工具代理商OPS的十大工具Apr 25, 2025 am 10:05 AM

當AI代理承擔更複雜的任務時,簡單地構建它們還不夠。管理他們的績效,可靠性和效率同樣至關重要。這就是代理商操作的來源。它可以幫助組織監視,優化,

7個免費的chatgpt替代品來創建吉卜力風格的圖像7個免費的chatgpt替代品來創建吉卜力風格的圖像Apr 25, 2025 am 09:48 AM

解鎖吉卜力風格的AI藝術的魔力:免費,簡單的方法! AI生成的藝術的最近激增模仿了吉卜力的吉卜力工作室的迷人風格,這吸引了互聯網。 雖然OpenAI的GPT-4O提供了令人印象深刻的功能,但需求量很高。

AI通過圖靈測試:GPT-4.5揭示了未來AI通過圖靈測試:GPT-4.5揭示了未來Apr 25, 2025 am 09:42 AM

這篇博客文章探討了2025年聖地亞哥UC研究的開創性結果,其中高級語言模型(LLMS)(如GPT-4.5)令人信服地通過了現代化的圖靈測試,通常在模仿人類對話的能力方面表現出色的真實人物

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

SecLists

SecLists

SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

SublimeText3 英文版

SublimeText3 英文版

推薦:為Win版本,支援程式碼提示!

Atom編輯器mac版下載

Atom編輯器mac版下載

最受歡迎的的開源編輯器

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境