为了训练ChatGPT,微软可谓下了足够多的血本。
ChatGPT消耗的总算力约为3640PF-days,假如每秒计算一千万亿次,需要计算3640天。
微软将3万多个英伟达A100芯片连起来,为OpenAI耗资数亿美元量身打造了超算。
要是这么耗下去,微软腰包恐怕也吃不消。
其实,取代英伟达芯片的计划,已经从2019年起,就开始在公司内部秘密展开了。
The Information报道称,大约在5年前,微软就开始研发一种芯片,内部代号「雅典娜」(Athena),300人共同研发。
而最初的计划,是用台积电的5nm工艺打造。
自研Athena,挑战英伟达
不用多说,「雅典娜」是专为训练大型语言模型(LLM)而设计的。
而现在,微软想要把GPT-4能力全部装进包括Bing、Microsoft 365和GitHub在内的全家桶中,必定需要大量的算力支持。
让人震惊的是,开发类似于Athena这种芯片的成本,可能约为每年1亿美元。
在训练模型时,研究人员可以借助「雅典娜」的功能来处理新数据,同时,还能进行推理。
这样一来,以前处理人工智能软件必须使用专用计算机的局面就得到缓解了,毕竟,专门用来跑AI的计算机从来都不够用。
因为,之前只有英伟达才生产这种芯片,而供货量的缺少也就使得整个科技行业都感受到了这种短缺。
也正因如此,微软才不得不专门为一部分内部团队提供专用芯片。
此前,研究公司SemiAnalysis曾估算,ChatGPT每日烧70万美元,每查询一次,就需要0.36美分。
如果「雅典娜」具有竞争力,就能够将每颗芯片的成本降低1/3。
Forrester Research的高级云分析师Tracy Woo表示,AI的爆火让各大公司都涌入其中,而芯片的缺乏不仅给供货商带来压力,还给AI科技公司带来了压力。
像谷歌和亚马逊这样大体量的科技公司有足够的资本设计和开发属于自己的芯片,其它的公司也得眸足劲儿紧跟步伐。
说回到微软的「雅典娜」。
其实微软的AI芯片项目发布的时机纯属偶然,并不是蓄谋已久。
今年年初,OpenAI和微软对于LLM的训练有了质的飞跃。知情人士表示,ChatGPT的发布引爆了网络,也正因如此,微软才急匆匆地加快了「雅典娜」的问世。
要知道,ChatGPT的用户已经超过1亿了。
据预测,微软可能最早在明年大面积应用「雅典娜」,范围包括微软内部和OpenAI。他们还在犹豫的是,要不要把「雅典娜」提供给Azure云计算服务的客户。
微软方面表示,大多数客户不需要训练自己的LLM,因此也就不需要芯片加持。
然而如果真要给的话,微软可得干过英伟达。毕竟,英伟达的芯片已经辛勤耕耘十五载,畅销所有开发者。
研究公司SemiAnalysis的首席分析师Dylan Patel表示,ChatGPT的运营成本大概是每天70万美元,大概每次查询0.36美分。而这些成本的主要来源,就是服务器,实在是太贵了。
但如果OpenAI用上自己研发的「雅典娜」,还能pk过英伟达的话,那么成本能直降三分之一。
他进一步表示,微软未来还希望在所有旗下的应用程序中都使用LLM,比如Bing、Office 365、GitHub等等。而如果继续使用目前的硬件进行部署,那每年得花数百亿美元。
此外,微软自研芯片还有另一个数据支撑。
微软的高层预测了究竟需要多少图形处理单元来支撑AI工作。而其中一位知情者表示,完全依赖英伟达的芯片的话,成本高的吓人。
虽说去年微软和英伟达刚刚达成了一个建设超算的合作项目,但在芯片这方面,「雅典娜」还是和英伟达的产品存在竞争关系。
不过,对于这一敏感话题,英伟达拒绝置评。
以上是3万个A100太贵,微软300人秘密自研AI芯片5年!台积电5nm,ChatGPT省钱约30%的详细内容。更多信息请关注PHP中文网其他相关文章!

斯坦福大学以人为本人工智能研究所发布的《2025年人工智能指数报告》对正在进行的人工智能革命进行了很好的概述。让我们用四个简单的概念来解读它:认知(了解正在发生的事情)、欣赏(看到好处)、接纳(面对挑战)和责任(弄清我们的责任)。 认知:人工智能无处不在,并且发展迅速 我们需要敏锐地意识到人工智能发展和传播的速度有多快。人工智能系统正在不断改进,在数学和复杂思维测试中取得了优异的成绩,而就在一年前,它们还在这些测试中惨败。想象一下,人工智能解决复杂的编码问题或研究生水平的科学问题——自2023年

Meta的Llama 3.2:多模式和移动AI的飞跃 Meta最近公布了Llama 3.2,这是AI的重大进步,具有强大的视觉功能和针对移动设备优化的轻量级文本模型。 以成功为基础

本周的AI景观:进步,道德考虑和监管辩论的旋风。 OpenAI,Google,Meta和Microsoft等主要参与者已经释放了一系列更新,从开创性的新车型到LE的关键转变

连接的舒适幻想:我们在与AI的关系中真的在蓬勃发展吗? 这个问题挑战了麻省理工学院媒体实验室“用AI(AHA)”研讨会的乐观语气。事件展示了加油

介绍 想象一下,您是科学家或工程师解决复杂问题 - 微分方程,优化挑战或傅立叶分析。 Python的易用性和图形功能很有吸引力,但是这些任务需要强大的工具

Meta's Llama 3.2:多式联运AI强力 Meta的最新多模式模型Llama 3.2代表了AI的重大进步,具有增强的语言理解力,提高的准确性和出色的文本生成能力。 它的能力t

数据质量保证:与Dagster自动检查和良好期望 保持高数据质量对于数据驱动的业务至关重要。 随着数据量和源的增加,手动质量控制变得效率低下,容易出现错误。

大型机:AI革命的无名英雄 虽然服务器在通用应用程序上表现出色并处理多个客户端,但大型机是专为关键任务任务而建立的。 这些功能强大的系统经常在Heavil中找到


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

Atom编辑器mac版下载
最流行的的开源编辑器

mPDF
mPDF是一个PHP库,可以从UTF-8编码的HTML生成PDF文件。原作者Ian Back编写mPDF以从他的网站上“即时”输出PDF文件,并处理不同的语言。与原始脚本如HTML2FPDF相比,它的速度较慢,并且在使用Unicode字体时生成的文件较大,但支持CSS样式等,并进行了大量增强。支持几乎所有语言,包括RTL(阿拉伯语和希伯来语)和CJK(中日韩)。支持嵌套的块级元素(如P、DIV),

螳螂BT
Mantis是一个易于部署的基于Web的缺陷跟踪工具,用于帮助产品缺陷跟踪。它需要PHP、MySQL和一个Web服务器。请查看我们的演示和托管服务。

Dreamweaver Mac版
视觉化网页开发工具

记事本++7.3.1
好用且免费的代码编辑器