ホームページ >テクノロジー周辺機器 >AI >2023 年の人工知能開発トレンド TOP5
2022 年は、AI/ML の分野で多くの画期的な進歩が見られました。 Google、Meta、Microsoft などの大手テクノロジー企業は、量子コンピューティングから生成人工知能に至るまで、新たなイノベーションで大きな進歩を遂げています。
たとえば、最大のブレークスルーには、国際数学オリンピックの問題を解くための Meta の HyperTreeProofSearch (HTPS)、タンパク質の折り畳み予測のための DeepMind の Alpha Fold と Meta AI の ESMFold、表現型間の相関関係をシミュレートするための Google の DeepNull などがあります。変動効果とゲノムワイド関連研究(GWAS)の改善など。
次に、2023 年の予測をいくつか見てみましょう。
ChatGPT は、優れた会話機能でインターネット上で人気があります。これは、1,760 億個のパラメータを持ち、より大きなモデル サイズに依存する OpenAI の GPT-3 に基づいて構築されています。 GPT-3 の 2 倍、3 倍、さらには 10 倍のパラメーターを持つ LLM は他にもありますが、DeepMind または Meta の一部のモデル (小規模言語モデル (SLM) とも呼ばれる) には、論理推論と予測において GPT-3 よりも多くのパラメーターがあります。複数のタスクで。
モデルのサイズを縮小することに加えて、GPT-4 などのより大きなモデルには約 100 兆個のパラメーターがあることが予想されます。現在最大のモデルは 1 兆 6,000 億個のパラメータを備えた Google Switch Transformer モデルであるため、その増加は非常に大きくなります。
ただし、レイテンシと予測可能性を高めるために、今後数年間で既存のモデルが特定の目的に合わせて微調整される可能性があります。最近、OpenAI は DaVinci アップデートを使用して GPT-3 を微調整しました。
テキストから画像への生成は、2022 年のチャートを打ち破るトレンドです。 AI によって生成されたアートを試したい愛好家の間では、DALL-E、Stable Diffusion、Midjourney などのモデルがリストの上位にあります。会話はテキストから画像、テキスト、ビデオ、テキスト、その他あらゆるものに急速に移り、3D モデルも生成できる複数のモデルが作成されました。
言語モデルが拡大し、伝播モデルが改善されるにつれて、テキストを何でもに変換する傾向はさらに高まることが予想されます。公開されているデータセットにより、生成 AI モデルのスケーラビリティが向上します。
これらのデータセットでは、説明可能な人工知能に関するセクションが紹介されており、生成モデルのトレーニングに使用される各画像のプロパティが重要になります。
人工知能を生成するトレンドに追いついた企業は、人工知能をクラウド サービスとして提供し始めています。 LLM や、GPT-3 や DALL-E などの生成モデルが一般公開されると、企業がそれらをサービスとして提供することがますます容易になり、FastSaaS が誕生しました。
最近、Shutterstock は DALL-E 2 を自社のプラットフォームに統合する計画を立てており、Microsoft VS Code は拡張機能として Copilot を追加し、TikTok はアプリ内のテキストから画像への AI ジェネレーターを発表し、Canva は AI-on-そのプラットフォームの生成関数。
これは、タスクの生成と企業へのサービスの提供に依存してスーパーコンピューターを構築する傾向です。このように増え続けるデータセットと生成モデルにより、スーパーコンピューターの需要は高まっており、今後もさらに高まることが予想されています。 FastSaaS の競争により、次に必要となるのは、より優れた高性能コンピューティングです。
NVIDIA と Microsoft は最近協力して、クラウドネイティブのスーパーコンピューティング プラットフォームである Quantum-2 を作成しました。テスラは10月、自社のDojoスーパーコンピューターがテスラが開発したチップを使って完全にゼロから構築されたと発表した。間もなく、企業顧客にもアクセスが提供されるようだ。さらに、Cerebras は、1 エクサフロップスを超える AI コンピューティング能力を提供する 1,350 万コアの AI スーパーコンピューターである Andromeda を発売しました。最近、Jasper はより優れたパフォーマンスを達成するために Cerebras と提携しました。
ムーアの法則によって予測されたように、チップ サイズが小さくなるにつれて処理能力は増加します。そのため、スーパーコンピューターが大規模なモデルを実行するには、より小型のチップが必要であり、すでにチップの小型化が進んでいます。
近年、チップ業界は小型化を推進しており、メーカーはチップをより小さく、よりコンパクトにする方法を常に模索しています。例えば、Apple は M2 チップと A16 にそれぞれ 5nm チップと 4nm チップを使用していますが、TSMC は 2023 年に 3nm チップを開発すると予想されており、これにより AI/ML アルゴリズム開発の効率とパフォーマンスが向上します。
NVIDIA、Google、Microsoft などの企業がハードウェア サービスをクラウドに提供するにつれて、量子コンピューティングの分野でさらなるイノベーションが起こることは間違いありません。 。これにより、小規模テクノロジー企業は、重いハードウェアを必要とせずに AI/ML モデルをトレーニング、テスト、構築できるようになります。
今後数年間での量子コンピューティングの台頭は、ヘルスケア、金融サービスなど、他の多くの分野での使用が増加するため、開発者は必ず考慮する必要があります。
最近の発表では、量子コンピューターがヨーロッパ最速のスーパーコンピューターに接続され、古典コンピューターと量子コンピューターを組み合わせて問題をより迅速に解決できるようになりました。同様に、Nvidia も QODA (略して量子最適化デバイス アーキテクチャ) をリリースしました。これは、ハイブリッド量子古典コンピューター用の最初のプラットフォームです。
IBM は最近、年次 Quantum Summit 2022 で量子ハードウェアとソフトウェアを発表し、433 量子ビット (量子ビット) プロセッサーを使用した量子中心のスーパーコンピューティングの画期的なビジョンを概説しました。 Global Artificial Intelligence Summit で、IBM は来年、さまざまな分野でさらなるイノベーションの破壊者となる 1,000 量子ビットのシステムを実証すると発表しました。
以上が2023 年の人工知能開発トレンド TOP5の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。