ホームページ >テクノロジー周辺機器 >AI >AI ウィークリー ニュース: 馬化騰氏は、AI は 100 年に一度のチャンスである、OpenAI は iOS を使用してユーザーの粘着性を固定し、身体化されたインテリジェンスにより AI は現実世界を認識できると述べました | Insight Research
来週から、AI Weekly Insights は毎日更新されます (Daily AI Insights コラム)。引き続き Wall Street Insights と Wisdom Research をフォローしていただければ幸いです。
今週の AI ニュースに新たな追加 — ニュースの新しい視点
週刊ニュース
今週のハイライトのまとめ:
1. 馬化騰氏は、AI は電力業界の革命に匹敵すると述べましたが、美団はアルゴリズム採用を拡大し、大規模モデルを密かに開発しています。
2. OpenAI が chatGPT の iOS バージョンをリリースし、70 個のプラグインを Plus ユーザーに公開します
3. Meta は AI チップ MTIA をリリースしますが、これは発売までに 25 年かかりますが、引き続き NVIDIA GPU を使用します。
4. AI 描画における新たなマイルストーン - DragGAN により、ワンクリックで象が向きを変え、車が「変換」できるようになります。
5. 身体化された知能は、人工知能の次の波である AI の能動的な知覚を生み出します。
6. Yunchong Technology が大型モデルをリリース 垂直分野での商業化の道は国内大型モデルのチャンスです。
7. AI ブラック テクノロジー - ディズニーの「Beyond the Horizon」を自宅で体験できます。半機械の「スパイダーマン」は、人間とコンピューターの相互作用の認識を覆します。
ニュースを見る新しい視点
テンセントの 2023 年の株主総会で、馬化騰氏は次のように述べました。「当初、AI はインターネットにとって 10 年に 1 度のチャンスだと誰もが考えていましたが、今では AI に対する理解が 100 年前の発展にまで高まっています「テンセントは現在、AI技術の研究開発にも取り組んでいますが、短期的な成功を求めているわけではありません。将来的には、より多くの価値を創造していきます」私たちは、to-C 側だけでなく、to-B 側の機会も重視していきます。
さらに、美団は密かに大規模モデルを開発しており、3 月初旬からフィールドを展開しており、最近ではアルゴリズムチームも拡大しており、美団の大規模モデルを支援するために別の「プラットフォーム部門」を設立することも計画しています。特定のビジネス実装に合格します。
Jianzhi Research は次のように考えています: 現在の大規模モデル間の競争は非常に激しく、多くのオープンソースの大規模モデルの出現により、その進化が加速しています。しかし、オープンソースの大型モデルは商用化が難しく、主に学術研究で利用されることが課題ですが、一部の重要分野で海外のクローズドな先進大型モデルが利用されると、セキュリティ上のリスクが生じます。
したがって、国内の大型モデル開発の傾向は、豊富な中国予測ライブラリ、強力なローカライゼーションの利点、および高いセキュリティと機密性にあります。 将来、中国固有の大型モデルに対する市場の需要は非常に高まるでしょう。高い。
特に注目に値するのは、大規模なモデルとアプリケーションを組み合わせる商業的価値です。 openAIにしろ、マイクロソフトにしろ、グーグルにしろ、次々とエコロジー領域を拡大し始めていますが、これも国産AIの発展には避けられない道であり、研究開発の成果は最終的にはより大きな商品価値を生みだす必要があります。
速報リリース
1. OpenAI が chatGPT の iOS バージョンをリリースし、70 個のプラグインを Plus ユーザーに公開します
OpenA は今週、chatGPT の iOS バージョンを正式にリリースしました。ユーザーは iOS 16.1 以降のオペレーティング システム バージョンを使用する必要があります。そして、Android バージョンがすぐにリリースされることを約束します。
携帯電話のChatGPT は、デバイス間でのユーザー履歴レコードの同期をサポートしており、OpenAI のオープンソース音声認識システム Whisper も統合しています。ユーザーは音声を使用してコンテンツを入力でき、質問と回答、言語翻訳、教育コーチングを実行でき、自動生成が可能です。文章。
さらに、ChatGPT はネットワーク機能を PLUS ユーザーに開放し、70 個のサードパーティ プラグインの使用を可能にします。
Jianzhi Research は次のように考えています: モバイル アプリケーションのプロモーションであれ、オープンなサードパーティ プラグインの使用であれ、これらはユーザーのスティッキー性を向上させ、ユーザー シンキングをさらに実現するための OpenAI の取り組みです。
モバイル端末を開くと、PC 端末よりも便利で使いやすいため、ユーザーの使用頻度が大幅に増加します。 ChatGPT のリリース以来、ユーザーはモバイル デバイスで ChatGPT を使用したいと考えてきました。 ChatGPTの商業的価値と毎日のアクティブ量は、モバイル端末の開放により再び新たな高みに達するでしょう。さらに、訪問数が増加するにつれて、コンピューティング能力の需要はさらに拡大します。
さらに、サードパーティのプラグインは現在、PLUS の有料ユーザーのみに公開されていますが、現在の AI の導入の度合いから判断すると、完全に無料になるのも目前です。
2.メタがAI専用チップ-MTIAをリリース
MTIA は、トレーニングと推論用に設計されたプログラム可能なチップであり、その発売により、人工知能分野における Meta のハードウェアの強みが大幅に強化されました。結局のところ、テクノロジーの巨人間の競争はコアハードウェアから逃れることはできません。特に AI 開発の時代では、コンピューティング能力レベルが開発の基礎となります。コンピューティング能力を習得できなければ、開発プロセスは必然的に「他者」によってコントロールされることになります。 。
しかし、MTIA にはまだ最適化の余地がたくさんあります。 公開されるまでには 25 年かかると予想されています。 NNP および GPU のパフォーマンス テストに関しては、MTIA は低および中複雑度のモデルでは優れたパフォーマンスを示していますが、 高複雑度では依然として GPU に大きく遅れをとっています。
Jianzhi Research は、Meta は長期的に AI チップを開発すると考えています。結局のところ、チップは私たちの手のコアハードパワーです。しかし、高性能チップ開発への道のりは非常に長いです。このチップの設計も2020年には始まっていました。現時点では、Meta は引き続き NVIDIA GPU を使用しますが、結局のところ、2022 年に Meta は NVIDIA GPU を導入するためにデータセンターの破壊的設計を実施したばかりであり、将来的には主に RSC スーパーコンピューティング センターに依存して AI を開発することになります。
3. AI 描画の新たなマイルストーン - DragGAN があらゆる想像力を実現します
DragGAN は、AI 描画の分野における拡散モデルの独占的地位を完全に打ち破ります。 「Drag Your GAN」というタイトルの論文は、AI 描画界に爆発をもたらしました。この論文は、MPII、MIT、ペンシルベニア州立大学、Google などの研究者によって共同発表され、SIGGRAPH2023 に採択されました。
このモデルは、ほとんどすべての人々の写真編集のニーズを満たすことができ、オブジェクトの形状、細部、さらには向きや配置まで変更することができ、核爆弾レベルの Photoshop と呼ぶことができます。
ユーザーは、写真上にいくつかの操作点 (赤い点) と目標点 (青い点) を設定し、ドラッグ アンド ドロップするだけで新しい画像を生成します。
Jianzhi Research は次のように考えています: DragGAN の出現は、画像学習における機械トレーニングが新たなレベルに到達したことを示しています。 DragGAN はより強力な汎化機能を備えており、学習データを超える画像を作成できることは注目に値します。たとえば、ライオンの口の形状が完全に変更されました。これは、人々が当初考えていた修正ではなく、基本的に新たに生成されたコンテンツです。 . グラフ機能。
以前の方法と比較して、DragGAN は特定の分野のモデリングや補助ネットワークに依存せず、一般的なフレームワークを使用し、GAN を使用して画質を識別し、点追跡を使用して画像変形を完了します。 この強力な機能を使用すると、ビデオグラファーやフォトレタッチャーはとても楽しくなるでしょう。
4. 身体化された知能は、人工知能の次の波である AI の能動的な知覚を生み出します。
ITF World 2023 Semiconductor Conference で、NVIDIA CEO の Jensen Huang 氏は、人工知能の次の波は身体化された知能であるという大胆な発言をしました。
Jianzhi Research は次のように考えています:身体化された知能によってもたらされる AI の価値は、人型ロボットの価値よりもはるかに大きいです。身体化知能の最大の特徴は、主人公の視点から物理世界を自律的に認識し、擬人化された思考経路を使用して学習し、データが供給されるのを受動的に待つのではなく、人間が期待する行動フィードバックを提供する能力です。人間の五大感覚のうち、視覚は得られる情報の80%以上を占めており、機械にとって人間の言語を理解することも非常に重要であるため、マシンビジョンとマルチモーダル大型モデルが機械の自己を解く2つの鍵となる-知覚学習。詳細については、NVIDIA の人気の「身体化インテリジェンス」とは何ですか? を参照してください。 AIの価値はロボットの価値よりもはるかに大きいです。
5. Yunchong Technology が Congrong の大型モデルをリリース
人工知能プラットフォーム企業である Yunchong Technology は、広州で Congrong モデルをリリースし、対話、プログラミング、読解、高校入試における実際の質問への回答などの基本的な能力を実証しました。この大型モデルは現在、内部ベータ段階にあります。 このモデルは大規模なヴィンセント モデルであり、ヴィンセント ダイアグラムなどのマルチモーダル大規模モデルの機能をまだ完了できません。
公開テストでの性能: 応答速度は速いですが、内容の精度を向上させる必要があります。さらに、データベースの適時性は比較的低く、まだ 21 年前のものです。さらに、数学と推論能力におけるモデルのパフォーマンスはまだ期待に達していません。
Jianzhi Research は次のように考えています:国産の大型モデルの利点は、中国語のコーパスの豊富さが外国の先進的な大型モデルよりもはるかに高いことです。リーダーシップの点で ChatGPT に追いつくのは難しいですが、Congrong Big Model は今後の垂直産業のアプリケーション開発、特に金融、政府事務、金融の分野での独占的な産業モデルの開発をリードするでしょう。とモノづくりにこだわり、モデルの商品化を実現します。
AI ブラック テクノロジー
1. ディズニーの『ビヨンド・ザ・ホライゾン』を自宅で体験できます
外国の開発者 Nils Bakker は、Unreal Engine 5.1 ChatGPT Google Maps 3D Tiles API を使用して、ChatGPT を使用した「仮想空間伝送」システムの作成に成功しました。ユーザーは場所を入力するだけで、システムは一人称視点であなたを案内します. 世界中の美しい景色を眺めながら、地平線を飛び越える楽しさを自宅で体験してみませんか。
Google 3D Tiles と ChatGPT の API を組み合わせ、Unreal Engine の機能を使用して、ユーザーが没入型で宇宙旅行を体験できるようにします。家に寝ながら、地平線を飛び越える魅力を感じることができます。
Jianzhi Research は次のように考えています。: AI はまだ業界発展の初期段階にあり、想像力と創造性が非常に重要であり、業界の軌跡やビジネスチャンスは雨後の筍のように湧き出てくるでしょう。
2. 半機械の「スパイダーマン」が登場
日本のロボット企業 Jizai Arms は、人間が自由に制御可能なロボット アームを持つことができるクモのようなロボットの四肢システムを設計しました。このシステムは 6 本のアームで構成されており、装着したユーザーが制御できます。ロボットアームは最大 4 台まで設置可能で、注目すべきは、このシステムが人間と機械のインタラクションの方法を変えることです。
このプロテーゼは非常に柔軟で、さまざまな作業を実行できます。その用途は倉庫から病院の手術室まで多岐にわたります。将来的には、障害のある人々の生活の質の向上に役立つ可能性があります。
Jianzhi Research は次のように考えています: ロボット アームと現実の人間の「融合」は、人間と機械の統合の想像力の空間を開き、ロボット開発に対する人々の理解の上限を更新します。将来的には実現するでしょう。
来週の見どころ
OpenAI の最初のオープンソース大規模モデルを楽しみにしていますが、オープンソースの王としての Meta の地位を書き換えることができるでしょうか?
以上がAI ウィークリー ニュース: 馬化騰氏は、AI は 100 年に一度のチャンスである、OpenAI は iOS を使用してユーザーの粘着性を固定し、身体化されたインテリジェンスにより AI は現実世界を認識できると述べました | Insight Researchの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。