検索
ホームページテクノロジー周辺機器AI4 つのポスト 00 世代の狂気のオープンソース計画: インターネット全体が大規模なモデル コーパスに変換され、1 億トークンの埋め込みコストはわずか 1 ドル

Arxiv 上のすべての論文はトークンに変換され、総量はわずか 14.1 GB です。

これは、最新の注目のオープンソース プロジェクトである Alexander によって達成された偉業です。

実際、これは最初のステップにすぎません。

最終的に、彼らはインターネット全体を トークン に変えたいと考えています。言い換えれば、ChatGPT のような大規模なモデルが世界を理解する方法にすべてを変換します。

そのようなデータセットが誕生すれば、GPT-4のような大規模モデルを開発するための新たな強力なツールとなり、すぐそこまで来ている天文学や地理を理解できるようになるのではないでしょうか? !

このニュースが出るとすぐに、すぐに大きな注目を集めました。

4 つのポスト 00 世代の狂気のオープンソース計画: インターネット全体が大規模なモデル コーパスに変換され、1 億トークンの埋め込みコストはわずか 1 ドル

ネチズンは epic を称賛しました。

4 つのポスト 00 世代の狂気のオープンソース計画: インターネット全体が大規模なモデル コーパスに変換され、1 億トークンの埋め込みコストはわずか 1 ドル


4 つのポスト 00 世代の狂気のオープンソース計画: インターネット全体が大規模なモデル コーパスに変換され、1 億トークンの埋め込みコストはわずか 1 ドル

##そしてこの後ろには、平均年齢が 4 人だけです。 20 歳 10 代の若者が始めて、すべての Arxiv 論文データ セットがリリースされ、来週埋め込み検索プラットフォームがリリースされる予定です。

Arxiv のすべての論文から始めましょう

400 万以上のプロジェクト、6 億のトークン、30 億 7000 万のベクトル次元。

Alexander と呼ばれるこのオープンソース プロジェクトは、Arxiv 上の各論文から始まります。

選んだ手法はエンベディングで、簡単に言えば、現実世界のさまざまなオブジェクトをコンピューターが理解できるベクトルに視覚化することです。

4 つのポスト 00 世代の狂気のオープンソース計画: インターネット全体が大規模なモデル コーパスに変換され、1 億トークンの埋め込みコストはわずか 1 ドル#最も古典的な例は、元の画像をグレースケール ピクセルとして表すことです。

4 つのポスト 00 世代の狂気のオープンソース計画: インターネット全体が大規模なモデル コーパスに変換され、1 億トークンの埋め込みコストはわずか 1 ドル

#この技術の最大の特徴は、人間が知覚する意味的な類似性を表現できることです。

たとえば、同じ意味の単語が 10 個ある場合、キーワードで論文を見つけるのは困難です。ただし、埋め込みは可能なので、検索、クラスタリング、推奨、分類などに適しています。

実用性と効率性を考慮して、開発チームは論文のタイトルと要約のみを埋め込むことを選択しました。

さまざまなモデルをテストした後、最終的に、タスクの指示を提供するだけでさまざまなタスク

(分類、検索、クラスタリングなど) に適した InstructorXL テキスト埋め込みモデルを使用することを選択しました。テキスト評価など)

およびフィールド (科学、金融、医学など) >>来週、Arxiv 検索がリリースされる予定です。これまでのプロセスでは、最初に最も近い 100 個の記事に対して類似性検索を実行し、次にこれらの埋め込みをオンザフライで計算し、2 番目のより複雑な検索を実行します。

最終的な目標は、インターネット全体を組み込んだ計画です。

20 歳の少年のクレイジーなオープンソース計画

このようなクレイジーなオープンソース計画を立ち上げたい主な理由は 2 つあります。

一方では、巨大な価値を埋め込むことです。世の中の多くの問題は検索、クラスタリング、推奨、分類にすぎませんが、これらは埋め込みが非常に得意なことです。前述したように、いくつかの複雑なパズルを解くことができます。

一方、費用は1回限りで非常に安価です。ほとんどの場合、同じファイルに対して 2 回目の計算を実行する必要はありません。現在、1 億トークンごとにかかる費用は $

1$

だけです。 しかし、オープンな埋め込みデータ セットが見つからなかったため、この組織が誕生しました。

将来的にはさらに多くのデータ セットも公開される予定で、これらのデータ セットはこれらのユーザーによって選択されることになります。公式 Web サイト上の公開データセットに加えて、残りのオープンソース プロジェクトでも投票チャネルが開設されています。

4 つのポスト 00 世代の狂気のオープンソース計画: インターネット全体が大規模なモデル コーパスに変換され、1 億トークンの埋め込みコストはわずか 1 ドル注目すべきは、その背後には平均年齢わずか 20 歳のティーンエイジャーのチームがあるということです。

4 つのポスト 00 世代の狂気のオープンソース計画: インターネット全体が大規模なモデル コーパスに変換され、1 億トークンの埋め込みコストはわずか 1 ドル

そしてチーム名も非常に横暴です、Macrocosm (マクロワールド) Alliance。

ズームインする限り、人間は 1 つの生き物になります。

公式紹介によると、彼らは ChatGPT やその他の同様の製品のプラグインの構築に取り組んでおり、学習、教育、学習を支援するための大規模なモデルに基づいたコア製品、パーソナルリサーチアシスタントも開発しています。科学研究。

興味のあるお友達は、下のリンクをクリックして詳細をご覧ください~

https://alex.macrocosm.so/download

以上が4 つのポスト 00 世代の狂気のオープンソース計画: インターネット全体が大規模なモデル コーパスに変換され、1 億トークンの埋め込みコストはわずか 1 ドルの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。
最高の迅速なエンジニアリング技術の最新の年次編集最高の迅速なエンジニアリング技術の最新の年次編集Apr 10, 2025 am 11:22 AM

私のコラムに新しいかもしれない人のために、具体化されたAI、AI推論、AIのハイテクブレークスルー、AIの迅速なエンジニアリング、AIのトレーニング、AIのフィールディングなどのトピックなど、全面的なAIの最新の進歩を広く探求します。

ヨーロッパのAI大陸行動計画:GigaFactories、Data Labs、Green AIヨーロッパのAI大陸行動計画:GigaFactories、Data Labs、Green AIApr 10, 2025 am 11:21 AM

ヨーロッパの野心的なAI大陸行動計画は、人工知能のグローバルリーダーとしてEUを確立することを目指しています。 重要な要素は、AI GigaFactoriesのネットワークの作成であり、それぞれが約100,000の高度なAIチップを収容しています。

Microsoftの簡単なエージェントストーリーは、より多くのファンを作成するのに十分ですか?Microsoftの簡単なエージェントストーリーは、より多くのファンを作成するのに十分ですか?Apr 10, 2025 am 11:20 AM

AIエージェントアプリケーションに対するMicrosoftの統一アプローチ:企業の明確な勝利 新しいAIエージェント機能に関するマイクロソフトの最近の発表は、その明確で統一されたプレゼンテーションに感銘を受けました。 TEで行き詰まった多くのハイテクアナウンスとは異なり

従業員へのAI戦略の販売:Shopify CEOのマニフェスト従業員へのAI戦略の販売:Shopify CEOのマニフェストApr 10, 2025 am 11:19 AM

Shopify CEOのTobiLütkeの最近のメモは、AIの能力がすべての従業員にとって基本的な期待であると大胆に宣言し、会社内の重大な文化的変化を示しています。 これはつかの間の傾向ではありません。これは、pに統合された新しい運用パラダイムです

IBMは、完全なAI統合でZ17メインフレームを起動しますIBMは、完全なAI統合でZ17メインフレームを起動しますApr 10, 2025 am 11:18 AM

IBMのZ17メインフレーム:AIを強化した事業運営の統合 先月、IBMのニューヨーク本社で、Z17の機能のプレビューを受け取りました。 Z16の成功に基づいて構築(2022年に開始され、持続的な収益の成長の実証

5 chatgptプロンプトは他の人に依存して停止し、自分を完全に信頼する5 chatgptプロンプトは他の人に依存して停止し、自分を完全に信頼するApr 10, 2025 am 11:17 AM

揺るぎない自信のロックを解除し、外部検証の必要性を排除します! これらの5つのCHATGPTプロンプトは、完全な自立と自己認識の変革的な変化に向けて導きます。 ブラケットをコピー、貼り付け、カスタマイズするだけです

AIはあなたの心に危険なほど似ていますAIはあなたの心に危険なほど似ていますApr 10, 2025 am 11:16 AM

人工知能のセキュリティおよび研究会社であるAnthropicによる最近の[研究]は、これらの複雑なプロセスについての真実を明らかにし始め、私たち自身の認知領域に不穏に似た複雑さを示しています。自然知能と人工知能は、私たちが思っているよりも似ているかもしれません。 内部スヌーピング:人類の解釈可能性研究 人類によって行われた研究からの新しい発見は、AIの内部コンピューティングをリバースエンジニアリングすることを目的とする機械的解釈可能性の分野の大きな進歩を表しています。AIが何をするかを観察するだけでなく、人工ニューロンレベルでそれがどのように行うかを理解します。 誰かが特定のオブジェクトを見たり、特定のアイデアについて考えたりしたときに、どのニューロンが発射するかを描くことによって脳を理解しようとすることを想像してください。 a

Dragonwingは、QualcommのEdge Momentumを紹介していますDragonwingは、QualcommのEdge Momentumを紹介していますApr 10, 2025 am 11:14 AM

Qualcomm's DragonWing:企業とインフラストラクチャへの戦略的な飛躍 Qualcommは、新しいDragonwingブランドで世界的に企業やインフラ市場をターゲットにして、モバイルを超えてリーチを積極的に拡大しています。 これは単なるレブランではありません

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

強力な PHP 統合開発環境

AtomエディタMac版ダウンロード

AtomエディタMac版ダウンロード

最も人気のあるオープンソースエディター

Safe Exam Browser

Safe Exam Browser

Safe Exam Browser は、オンライン試験を安全に受験するための安全なブラウザ環境です。このソフトウェアは、あらゆるコンピュータを安全なワークステーションに変えます。あらゆるユーティリティへのアクセスを制御し、学生が無許可のリソースを使用するのを防ぎます。

SublimeText3 Linux 新バージョン

SublimeText3 Linux 新バージョン

SublimeText3 Linux 最新バージョン

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい