


30,000 個の A100 は高すぎるため、Microsoft の 300 人が 5 年間秘密裏に独自の AI チップを開発しました。 TSMC 5nm、ChatGPT は約 30% 節約
ChatGPT をトレーニングするために、Microsoft は十分な資金を費やしました。
ChatGPT が消費する総計算能力は、1 秒あたり 1 京回計算すると、約 3640PF 日かかります。
Microsoft は、30,000 個を超える Nvidia A100 チップを接続し、数億ドルをかけて OpenAI 用にオーダーメイドのスーパーコンピューターを構築しました。
この消費が続くと、Microsoft の財布が耐えられなくなる可能性があります。
実は、Nvidiaチップの置き換え計画は2019年から社内で秘密裏に進められてきました。
The Information は、約 5 年前に Microsoft が社内コードネーム「Athena」というチップの開発を開始し、300 名が共同開発したと報じました。
当初の計画ではTSMCの5nmプロセスを使用する予定でした。
NVIDIA に挑戦するために自社開発した Athena
言うまでもなく、「Athena」は大規模言語モデル (LLM) のトレーニング用に特別に設計されています。
さて、Microsoft が GPT-4 のすべての機能を Bing、Microsoft 365、GitHub を含む FamilyMart バケットに組み込みたい場合は、間違いなく大量のコンピューティング能力サポートが必要になります。
驚くべきことに、Athena のようなチップの開発コストは年間約 1 億ドルかかる可能性があります。
モデルをトレーニングする際、研究者は「Athena」の機能を使用して、新しいデータを処理し、同時に推論を実行できます。
このようにして、人工知能ソフトウェアを処理するために専用のコンピューターを使用しなければならないという以前の状況は緩和されました。結局のところ、AI を実行するためだけに使用されるコンピューターだけでは決して十分ではありませんでした。
なぜなら、以前は NVIDIA だけがこの種のチップを生産していたため、供給不足によりテクノロジー業界全体がこの不足を感じているからです。
まさにこのため、Microsoft は一部の社内チームに専用チップを提供しなければなりません。
以前、調査会社セミアナリシスは、ChatGPTが1日当たり70万米ドルを消費し、各クエリのコストは0.36セントだったと推定していた。
「Athena」が競争力がある場合、各チップのコストを1/3に削減できます。
Forrester ResearchのシニアクラウドアナリストであるTracy Woo氏は、AIの爆発的な普及により大手企業がAIに殺到しており、チップ不足はサプライヤーに圧力をかけるだけでなく、AI技術企業にも圧力をかけていると述べた。 。
Google や Amazon のような大手テクノロジー企業は、独自のチップを設計、開発するのに十分な資本を持っており、他の企業もそのペースに追いつく必要があります。
Microsoft の「Athena」について話しましょう。
実際、MicrosoftのAIチッププロジェクトのリリースのタイミングは全くの偶然であり、計画されたものではありませんでした。
今年の初めに、OpenAI と Microsoft は LLM トレーニングにおいて質的飛躍を遂げました。事情に詳しい関係者によると、ChatGPTのリリースはインターネットに爆発的な影響を与え、そのためMicrosoftは「Athena」のリリースを急ぐことになったという。
ご存知のとおり、ChatGPT には 1 億人を超えるユーザーがいます。
Microsoft は、早ければ来年にも Microsoft と OpenAI 内を含めて大規模に「Athena」を適用する可能性があると予測されています。彼らがまだ迷っているのは、Azureクラウドコンピューティングサービスの顧客に「Athena」を提供するかどうかだ。
Microsoft は、ほとんどの顧客は独自の LLM をトレーニングする必要がないため、チップのサポートは必要ないと述べています。
しかし、本当にそれを実現したいのであれば、MicrosoftはNVIDIAよりもうまくやる必要があります。結局のところ、NVIDIA のチップは 15 年間懸命に働き続けており、すべての開発者にとってベストセラーとなっています。
調査会社セミアナリシスの首席アナリストであるディラン・パテル氏は、ChatGPTの運用コストは1日あたり約70万米ドル、つまり1クエリあたり約0.36セントであると述べた。これらのコストの主な原因はサーバーであり、サーバーは高価すぎます。
しかし、OpenAIが独自に開発した「Athena」を使用し、Nvidiaに勝つことができれば、コストは3分の1に削減できます。
さらに、Microsoft は将来、Bing、Office 365、GitHub などのすべてのアプリケーションで LLM を使用したいと考えていると述べました。現在のハードウェアを導入に使用し続けると、毎年数百億ドルのコストがかかります。
さらに、Microsoft の自社開発チップには別のデータ サポートがあります。
Microsoft 幹部は、AI の作業をサポートするためにどれだけの数のグラフィックス処理ユニットが必要になるかを予測しています。この件に詳しい関係者の1人は、Nvidiaチップに完全に依存すると法外な費用がかかるだろうと語った。
マイクロソフトとNVIDIAは昨年、スーパーコンピューターを構築するための協力プロジェクトに合意したばかりだが、チップの点では「Athena」は依然としてNVIDIAの製品と競合している。
ただし、NVIDIA はこのデリケートな話題についてコメントすることを拒否しました。
以上が30,000 個の A100 は高すぎるため、Microsoft の 300 人が 5 年間秘密裏に独自の AI チップを開発しました。 TSMC 5nm、ChatGPT は約 30% 節約の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

Microsoft PowerBIチャートでデータ視覚化の力を活用する 今日のデータ駆動型の世界では、複雑な情報を非技術的な視聴者に効果的に伝えることが重要です。 データの視覚化は、このギャップを橋渡しし、生データを変換するi

エキスパートシステム:AIの意思決定力に深く飛び込みます 医療診断から財務計画まで、あらゆることに関する専門家のアドバイスにアクセスできることを想像してください。 それが人工知能の専門家システムの力です。 これらのシステムはプロを模倣します

まず第一に、これがすぐに起こっていることは明らかです。さまざまな企業が、現在AIによって書かれているコードの割合について話しており、これらは迅速なクリップで増加しています。すでに多くの仕事の移動があります

映画業界は、デジタルマーケティングからソーシャルメディアまで、すべてのクリエイティブセクターとともに、技術的な岐路に立っています。人工知能が視覚的なストーリーテリングのあらゆる側面を再構築し始め、エンターテイメントの風景を変え始めたとき

ISROの無料AI/MLオンラインコース:地理空間技術の革新へのゲートウェイ インド宇宙研究機関(ISRO)は、インドのリモートセンシング研究所(IIRS)を通じて、学生と専門家に素晴らしい機会を提供しています。

ローカル検索アルゴリズム:包括的なガイド 大規模なイベントを計画するには、効率的なワークロード分布が必要です。 従来のアプローチが失敗すると、ローカル検索アルゴリズムは強力なソリューションを提供します。 この記事では、Hill ClimbingとSimulについて説明します

このリリースには、GPT-4.1、GPT-4.1 MINI、およびGPT-4.1 NANOの3つの異なるモデルが含まれており、大規模な言語モデルのランドスケープ内のタスク固有の最適化への動きを示しています。これらのモデルは、ようなユーザー向けインターフェイスをすぐに置き換えません

Chip Giant Nvidiaは、月曜日に、AI Supercomputersの製造を開始すると述べました。これは、大量のデータを処理して複雑なアルゴリズムを実行できるマシンを初めて初めて米国内で実行します。発表は、トランプSI大統領の後に行われます


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

VSCode Windows 64 ビットのダウンロード
Microsoft によって発売された無料で強力な IDE エディター

DVWA
Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、

SublimeText3 Linux 新バージョン
SublimeText3 Linux 最新バージョン

ドリームウィーバー CS6
ビジュアル Web 開発ツール

MantisBT
Mantis は、製品の欠陥追跡を支援するために設計された、導入が簡単な Web ベースの欠陥追跡ツールです。 PHP、MySQL、Web サーバーが必要です。デモおよびホスティング サービスをチェックしてください。
