LLMは歴史になるでしょうか？オープンソースの bGPT は深層学習のパラダイムを覆す可能性があります。バイナリを直接シミュレートし、アナログデジタル世界の新時代を切り開きます。

LLMは歴史になるでしょうか？オープンソースの bGPT は深層学習のパラダイムを覆す可能性があります。バイナリを直接シミュレートし、アナログデジタル世界の新時代を切り開きます。

PHPz

Mar 13, 2024 pm 07:20 PM

モデル電車エミュレータ

Microsoft Research Asia によって発表された最新の成果 bGPT、このバイトベースの Transformer モデルは、デジタル世界を探索するための新しい扉を開きます。

従来の語彙ベースの言語モデルとは異なり、bGPT は、特定の形式やタスクに制限されることなく、生のバイナリデータを直接処理できるという点で独特です。デジタル世界を完全にシミュレートし、モデル開発の新たな可能性を開くことを目的としています。

#論文: #https://www.php.cn/link/ee88b3cea2051be97bcddf2e0d9a28f6

コード:

https://www.php.cn/link/359499f804ea7988921bf86c9377fb95モデル：

https://www.php.cn/link/4b459ea1a5917be436df5f0bd5b3c4ad プロジェクトのホームページ:

https ://www.php.cn/link/71af59614c8b42af334933e9261e53be研究チームは、研究論文の中で、モデリングにおける bGPT の大きな可能性を実証しました。バイトレベルの処理を実行することにより、bGPT はテキスト、画像、オーディオを生成するだけでなく、フォーマット変換アルゴリズムや CPU 状態のモデリングなど、コンピューターの動作をシミュレートすることもできます。すべてのデータをバイトのシーケンスとして扱うこのアプローチにより、bGPT は異なるタイプのデータを同じフレームワークに統合できます。

bGPT の論文は公開されると、この活動が新たな可能性を開くということで広範な議論を引き起こしました。

バイナリデータ: デジタル世界を構成する基本 DNA

バイナリデータは、コンピュータプロセッサと電子機器の動作を通じて実行されるデジタル世界の基礎です。私たちが毎日使用する製品システムは、すべてのデータ、機器、ソフトウェアの中核です。したがって、この基盤に基づいて、bGPT の目標は、バイナリデータシーケンスを研究することによってデジタルシステムの内部ロジックを理解し、それによってさまざまな複雑なデジタル現象を再構成してシミュレーションすることです。

bGPT は、従来の AI 生成やバイトレベルの処理によるタスクの理解に適用できるだけでなく、より非従来的なアプリケーションも処理できます。たとえば、音楽の送信と保存のための標準フォーマットである MIDI を直接シミュレートできますが、これまでの研究では MIDI のバイナリ特性により直接モデリングが避けられてきました。

しかし、bGPT は音楽データの変換アルゴリズムを正確にシミュレートし、ABC 記譜法を MIDI 形式に変換する際の非常に低いエラー率 (0.0011 BPB) を達成することができます。。

実際のアプリケーションでは、bGPT は通常、ABC シンボルと MIDI ファイル間の変換を正確に完了することができ、場合によっては元のファイルのエラーを修正して音楽変換をより正確にすることもできます。

bGPT は、ABC 記譜法を MIDI 形式 (上記) と元の MIDI データ ( の比較) に自動的に変換します。下の図) は重要な違いを強調しています。元の MIDI データ (下の図を参照) ではビートが欠落しており、コード伴奏が切断されていますが、bGPT 変換の結果 (上の図を参照) では、この欠落部分が正しく埋められています。、コード伴奏の滑らかさを確保します。

研究チームは、CPU モデリングもハードウェア動作シミュレーションの代表的なタスクであると考えています。このタスクでは、モデルが一連の低レベル機械命令を入力として受け取る必要があり、その目標は各命令の実行を正確に予測するためのプログラムを停止するまでの CPU ステータスの更新方法。

このタスクでは、bGPT は 99.99% 以上の精度を示し、ネイティブバイナリデータの処理におけるバイトモデルの能力とスケーラビリティを実証しました。

プログラムと初期 CPU 状態が与えられると、bGPT はプログラムが終了するまでの CPU 実行の完全なプロセスを正確に予測できます。この例では、bGPT はすべての CPU 命令を正確に処理します。理解を容易にするために、実際のバイトシーケンスは、より読みやすい形式に変換されます。

バイトからすべてへ: 境界を突破し、統合データモデリングへ移行

bGPT は、ネイティブバイナリデータを処理できるだけでなく、複数のデータタイプを統合して統合することもできます。モデルアーキテクチャでは、すべてのデータはバイトシーケンスとみなされます。

このアプローチにより、データモデリングプロセスが簡素化されるだけでなく、特定のデータ型に合わせてモデルをカスタマイズする必要がなく、あらゆるデータソースからの統合が簡単になります。

研究チームは論文の中で従来のテキスト、画像、音声ファイルの例を挙げ、統合データモデリングにおけるbGPTの機能を実証しました。彼らがトレーニングした bGPT モデルには約 1 億個のパラメータがあります。

実験結果は、GPT-2 (テキストモデル)、ViT (ビジュアルモデル)、AST (オーディオモデル) と同じスケールのモデルと比較して、bGPT は異なるモデルでより優れたパフォーマンスを発揮することを示しています。データ型どちらも同等のパフォーマンスを示しました。

bGPT はテキスト生成において非常に優れたパフォーマンスを発揮します。バイトレベルのテキストエンコーディングのおかげで、このモデルは語彙に依存しないため、すべての言語をサポートできます。

その階層型 Transformer アーキテクチャでは、計算オーバーヘッドは GPT-2 と同様ですが、最大 8KB のテキストを生成できます。これは GPT-2 の長さ制限を大幅に超えています。 Wikipedia データで事前トレーニングした後、bGPT によって生成されたテキストはスタイルとトピックの両方で GPT-2 に匹敵し、テキスト生成におけるその強力な能力が証明されました。

bGPT は Wikipedia データセットで事前トレーニングされており、生成されたテキストサンプルの品質とトピックの一貫性は GPT-2 に匹敵します。

bGPT は、一連の画像バイトの次のバイトを予測することで画像を生成できます。モデルは ImageNet データセットで事前トレーニングされており、生成された画像の解像度は 32x32 ピクセルです。

現在のスケールではありますが、バイトシーケンスを通じて画像の 2 次元の空間関係を正確にキャプチャすることは困難であり、生成された画像、テクスチャ、光にアーティファクトやノイズが発生します。また、シャドウ効果は通常、まだ比較的正確です。

さらに、これらの生成された画像は通常どおり BMP ファイルにデコードできます。研究チームは、OpenAIが開発したiGPTのピクセルシーケンスモデリング手法と同様に、bGPTの規模を拡大することで、より高品質でよりリアルな画像生成が実現できる可能性があると指摘しました。

これらは、ImageNet データセットで事前トレーニングされた bGPT によって生成された一連の画像です。画像のテクスチャと照明効果は一般に正確ですが、生成された画像内の主なオブジェクトを識別するのは困難な場合があります。

bGPT はオーディオデータをバイトのシーケンスとして扱い、8000 Hz のサンプリングレートで 1 秒の長さのオーディオサンプルを生成できます。

モデルは LibriSpeech データセットで事前トレーニングされ、さらに微調整され、Speech Commands v2 データセットで実証されました。 bGPT によって生成されたオーディオサンプルは高レベルの精度を維持しており、一部のサンプルは実際のオーディオとほとんど区別できません。以下は、オーディオ生成の分野における bGPT の機能を示す一連の例です。

bGPT でバイトのデジタル世界を探索する

従来の言語モデルは、どれほど強力であっても、主に自然言語テキストの処理に焦点を当てています。。 bGPT モデルは、バイトベースの処理メカニズムを通じてテキスト処理の制限を打ち破り、新しいデータ処理カテゴリを切り開きます。

この進歩により、bGPT は、テキスト、画像、オーディオ、さらにはアルゴリズムやハードウェアからのネイティブバイナリデータを含むさまざまなデータタイプをシームレスに処理できるようになり、完全にシミュレーションおよび実行する道が開かれます。デジタルの世界を理解する。

bGPT は魅力的な機能を実証していますが、計算オーバーヘッドの点で制限があります。たとえば、現在、従来のグラフィックカードでは最大 8KB のバイトシーケンスしか処理できません。これは明らかな問題を引き起こします。大量のデータを生成または処理する必要があるアプリケーションの制限。今後の作業計画は、より効率的なアルゴリズムの開発とハードウェアの進歩の活用に焦点を当て、より大きなデータシーケンスを処理する能力の向上を目指します。

世界中のテクノロジー愛好家は、ネットワークプルーニングと自己学習の最適化から、超大規模ネットワークの自己再構築機能に至るまで、bGPT の将来の可能性に期待し始めています。これらの議論は共通のビジョンを示しています。bGPT は最終的に、あらゆる種類のバイトデータを処理および出力できる統合モデルを実現し、真にデジタル世界の包括的なシミュレーターになる可能性があります。

研究チームは、bGPT のコードとモデルをオープンソース化しました。これは、モデルアーキテクチャを調整せずに、独自のデータセットで bGPT を直接トレーニングし、デジタル分野におけるバイトモデルの幅広い可能性を探ることができることを意味します。

以上がLLMは歴史になるでしょうか？オープンソースの bGPT は深層学習のパラダイムを覆す可能性があります。バイナリを直接シミュレートし、アナログデジタル世界の新時代を切り開きます。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

メタの新しいAIアシスタント：生産性ブースターまたはタイムシンク？May 01, 2025 am 11:18 AM

Metaは、NVIDIA、IBM、Dellなどのパートナーと協力して、Llama Stackのエンタープライズレベルの展開統合を拡大しました。セキュリティの観点から、MetaはLlama Guard 4、Llamafirewall、Cyberseceval 4などの新しいツールを立ち上げ、AIセキュリティを強化するためにLlama Defendersプログラムを開始しました。さらに、METAは、公共サービス、ヘルスケア、教育の改善に取り組んでいる新興企業を含む、Llama Impact Grantsの150万ドルを10のグローバル機関に分配しています。 Llama 4を搭載した新しいメタAIアプリケーションは、メタAIとして考案されました

Gen Zersの80％はAI：研究と結婚しますMay 01, 2025 am 11:17 AM

人間との相互作用の先駆者であるJoi Aiは、これらの進化する関係を説明するために「AI-lationships」という用語を導入しました。 Joi Aiの関係療法士であるJaime Bronsteinは、これらが人間cを置き換えることを意図していないことを明確にしています

AIはインターネットのボット問題を悪化させています。この20億ドルのスタートアップは最前線にありますMay 01, 2025 am 11:16 AM

オンライン詐欺とボット攻撃は、企業にとって大きな課題をもたらします。小売業者は、ボットの買いだめ製品、銀行の戦闘口座の買収、ソーシャルメディアプラットフォームと戦い、なりすまし者と闘っています。 AIの台頭は、この問題を悪化させます

ロボットへの販売：あなたのビジネスを作ったり壊したりするマーケティング革命May 01, 2025 am 11:15 AM

AIエージェントは、マーケティングに革命をもたらす態勢が整っており、以前の技術的変化の影響を上回る可能性があります。これらのエージェントは、生成AIの大幅な進歩を表し、ChatGPTのような情報を処理するだけでなく、Actioも取る

コンピュータービジョンテクノロジーがどのようにNBAプレーオフを司会しているかMay 01, 2025 am 11:14 AM

重要なNBAゲーム4の決定に対するAIの影響 2つの重要なゲーム4 NBAマッチアップは、司会におけるAIのゲームを変える役割を紹介しました。最初に、デンバーのニコラ・ジョキッチの逃した3ポインターは、アーロン・ゴードンの最後の2秒の路地につながりました。ソニーのホー

AIがどのように再生医療の未来を加速しているかMay 01, 2025 am 11:13 AM

伝統的に、再生医療の専門知識を拡大すると、世界的に大規模な旅行、実践的なトレーニング、長年のメンターシップが必要でした。現在、AIはこの風景を変えており、地理的な制限を克服し、ENを通じて進歩を加速しています

Intel Foundry Direct Connect 2025からのキーテイクアウトMay 01, 2025 am 11:12 AM

Intelは、製造プロセスを主要な位置に戻すように取り組んでいますが、Fab Semiconductorの顧客を引き付けてFabでチップを作成しようとしています。この目的のために、Intelは、そのプロセスの競争力を証明するだけでなく、パートナーが馴染みのある成熟したワークフローでチップを製造できることを実証するために、業界へのより多くの信頼を築かなければなりません。今日私が聞いたことはすべて、インテルがこの目標に向かっていると信じています。新しいCEOのタンリバイの基調講演がその日をキックオフしました。タンリバイは簡単で簡潔です。彼は、IntelのFoundry Servicesにおけるいくつかの課題と、これらの課題に対処し、将来のIntelのFoundry Servicesの成功したルートを計画するために企業が行った対策を概説しています。 Tan Libaiは、IntelのOEMサービスが顧客をより多くするために実装されているプロセスについて話しました

AIが間違っていましたか？今、そのための保険がありますMay 01, 2025 am 11:11 AM

AIのリスクを取り巻く増大する懸念に対処するために、グローバルな専門家保険会社であるChaucer GroupとArmilla AIは、新しいサードパーティの責任（TPL）保険商品を導入するために力を合わせました。このポリシーは、企業を守ります

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

SecLists

SecLists は、セキュリティテスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティテスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティテストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジングペイロード、機密データパターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテストマシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。