ホームページ >テクノロジー周辺機器 >AI >2024年のトップ20の生成AI開発
2024年、生成AIの分野は革新的なブレークスルーを行いました。一連の画期的なイノベーションは、生成的AIの分野に革命をもたらし、さまざまな産業を再構築し、毎日の経験を改善します。新しいオープンソースモデルやマルチモーダル機能からAIエージェントやその他のテクノロジーまで、2024年の進歩は、技術の境界を突破したいという人々の共通の欲求を反映しています。この記事では、AIの未来を形成し続ける2024年に生成AI開発を定義する上でトップ10の進歩を探ります。
2024年1月10日: Openaiは、特定のタスクのGPTを作成、カスタマイズ、共有できるプラットフォームであるChatGpt Storeの発売により、新年を開始します。この開発は、GPTビルドツールと何百万ものカスタムGPTを開発者とユーザーが利用できるようにすることにより、AIスペースに革命をもたらしました。ストアは当初は有料ユーザーにしか開いていませんでしたが、すぐにあらゆる存在の革新的なアプリケーションの中心になりました。
2024年1月15日: MicrosoftはCopilot Proと呼ばれる高度なサービスを開始し、GPT-4ターボを含む高度なモデルへの優先アクセスを提供します。 10月、Microsoftは「Copilot Voice」機能を開始し、ユーザーがCopilotとリアルタイムの音声会話をすることができました。オーディオの理解と生成にOpenaiのGPT-4Oモデルを使用しています。
同社はまた、「Think Deep」やCopilot Visionなどの機能を提供する早期アクセスプログラムであるCopilot Labsを立ち上げました。 「Depting In Depting」により、Copilotは複雑なクエリを推測することができ、「Copilot Vision」により、Copilotはユーザーが閲覧するにつれてWebサイトを表示および議論することができます。
2024年3月4日:人類は、テキストと画像を処理できるマルチモーダル生成AIモデルシリーズであるClaude 3を発売します。 Claude 3スイートには、ヘイク、ソネット、オーパスの3つの異なるモデルが含まれており、スケールと効率が向上しています。
5月、Anthropicは、Claude TeamプログラムとiOSアプリを通じてClaude Chatbot製品を拡大しました。チームプログラムは、中小企業向けに調整されており、Claudeの高度な機能への拡張可能なアクセスを提供します。このアプリにより、モバイルデバイス上のClaudeの生成機能へのシームレスなアクセスが可能になります。
2024年9月、Anthropicは、高度なAIツールを必要とする大規模な組織向けに設計されたソリューションであるClaude Enterpriseをリリースしました。その主な機能には、カスタム微調整、拡張トークン限界、およびデータセキュリティの強化が含まれます。
その後、11月に、人類はクロード3.5ベータのリリースを発表しました。このモデルは、動的メモリ、レイテンシの低下、効率の向上など、会話のAI機能を高度にしています。
2024年3月12日: Cognition Labsは、ソフトウェアエンジニアリングタスクを実行できる自律AIアシスタントであるDevin AIを発売します。自然言語のプロンプトに従って、コードをデバッグし、新しいコードを生成し、ソフトウェア開発の問題を解決できます。
2024年3月17日: Elon MuskのXaiは、Apache-2.0ライセンスの下でGROK-1モデルのアーキテクチャと体重パラメーターをオープンソースにするためのライセンスをリリースします。この動きは、AIコミュニティ内の透明性とコラボレーションを促進するように設計されています。 3月下旬、Xaiは最新のモデルGROK-1.5をリリースしました。これにより、推論機能が改善され、128,000のトークンコンテキストの長さが拡張されました。
4月、XaiはGrok-1.5 Visionを通じてGrokの機能を拡大し、マルチモーダル生成AIモデルの構築に向けた最初のステップをマークしました。この新しいモデルは、ドキュメント、チャート、グラフィック、スクリーンショット、写真など、さまざまな視覚情報を処理できます。
8月、XaiはGrok-2とGrok-2 Miniの発売を続け、アップグレードされたパフォーマンス、推論、画像生成機能の強化を提供しました。これらのモデルは、Xプレミアムサブスクライバーが利用できるようになり、AIに生成された画像をプラットフォームに統合しています。
10月下旬、Grokは視覚的なアップグレードを行い、画像を理解して分析できるようにしました。これにより、視覚的なデータ解釈が必要なアプリケーションの実用性が広がります。
2024年3月18日: GPUテクノロジー会議(GTC)で、NvidiaはBlackwell Architectureをリリースし、生成AI時代のニーズを満たすことを目指しています。フラッグシップ製品B100およびB200データセンターアクセラレータは、Genaiワークロードの大幅なパフォーマンスの改善を提供します。 Blackwellプラットフォームは、これらの加速器をNvidiaのARMベースのGrace CPUと統合して、Genaiアプリケーションに包括的なソリューションを提供します。
このイベント中に、Nvidiaは、Nvidia Nim(Nvidia Intelligent Microservices)の保護下で一連の生成AIマイクロサービスも開始しました。これらのサービスにより、開発者は幅広いCUDA GPUに基づいてカスタムAI Copilotsを作成および展開できます。これは、データ処理、LLMのカスタマイズ、推論、検索強化の生成、保護測定の実装に役立ちます。
2023年4月14日: ElevenLabsはプロの音声クローニングサービスを開始し、ユーザーがサウンドのほぼ完璧なデジタルレプリカを作成できるようにします。最小限のオーディオ入力に基づいて機能するインスタント音声クローニング機能とは異なり、このサービスは、より広いデータセットに基づいて非常に現実的な音声出力を生成します。サービスの開始は、2023年7月に英語のクローンを発売したときに始まり、8月までにサービスは30の異なる言語に拡大しました。
2024年4月18日:メタは、8Bと70Bのパラメーターサイズで、第3世代のオープンソースLLM LLAMA 3を発売します。 Llama 3は、公開されているリソースで約15兆マーカーでトレーニングされており、コーディング、推論、多言語のタスクで優れたパフォーマンスを示しています。
これに基づいて、Metaは7月にLlama 3.1をリリースし、最大405bのパラメーターを使用しました。さまざまなベンチマークでは、この反復はGPT-4OやClaude 3.5 Sonnetなどのモデルを上回ります。
その後、メタは9月にLlama 3.2を開発し、テキストと画像を処理できます。このバージョンには、それぞれ110億と900億のパラメーターを持つ2つの視覚モデルがあります。また、モバイルハードウェア用に最適化された10億と30億のパラメーターを備えた軽量のプレーンテキストモデルも提供します。
2024年5月13日: OpenAIはGPT-4O(「All-Around」)を発売します - テキスト、画像、オーディオを処理および生成できる多言語のマルチモーダルGenaiモデル。 GPT-4oは、音声、多言語、視覚的なタスクで新しいベンチマークを設定し、大規模なマルチタスク言語理解(MMLU)ベンチマークで88.7ポイントを獲得します。そのコンテキストウィンドウは128,000マーカーで、前身のGPT-4ターボの2倍の高速で半分の価格のAPIを提供します。このモデルは、AI機能に大きな進歩を遂げ、さまざまなモダリティでより包括的で効率的な処理機能を提供します。
また読む:2024年のOpenai:Highs、Lows、およびその間のすべて
2024年5月14日: Google I/O 2024会議で、Googleは生成AIを検索プラットフォームに統合するというニュースを発表しました。この拡張により、ユーザーはクエリによって生成されたAIの要約を受け取ることができ、より包括的で包括的な情報を提供することができます。この機能はもともとSearch Generative Experience(SGE)と名付けられ、後にAIの概要と改名されました。
このイベント中に、Googleは、1分以上長さの高品質の1080pビデオを生成できる高度なAIビデオ生成モデルであるVEOも発売しました。このマルチモーダルモデルは、テキスト、画像、ビデオキューを解釈して、タイムラプス写真や空中映像など、さまざまな映画スタイルでコンテンツを作成します。 Googleは、VEOの機能をYouTubeショーツなどのプラットフォームに統合する予定で、ユーザーのコンテンツ作成ツールを強化する予定です。
残りのコンテンツは、上記に似ています。同じように書き直すことができ、元の意味を変更し、画像形式と場所を維持します。 スペースの制限により、ここでは1つずつ拡大しません。 書き直しは流fluentで読みやすくする必要があることに注意してください。
以上が2024年のトップ20の生成AI開発の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。