ホームページ >テクノロジー周辺機器 >AI >フィギュア' sヘリックス:人間のようなロボットをあなたの家にもたらすAI -AnalyticsVidhya

フィギュア' sヘリックス:人間のようなロボットをあなたの家にもたらすAI -AnalyticsVidhya

Lisa Kudrow
Lisa Kudrowオリジナル
2025-03-04 09:09:10764ブラウズ

図AIはヘリックスを発表します:Vision-Language-action(VLA)フレームワークを搭載した革新的なヒューマノイドロボット。 この革新的なアプローチにより、ヘリックスは前例のない人間のような能力で推論し、動作することができ、制御された産業ロボット工学と家庭環境の予測不可能なダイナミクスとのギャップを埋めることができます。 この詳細な概要では、最近リリースされたドキュメントとデモに基づいて、Helixの機能を調査します。

目次:

    ヘリックスの理解
  • アーキテクチャデザイン:システム1&システム2
    • システム2:「大きな脳」
    • システム1:正確なアクション実行
  • 重要な技術の進歩
  • デモビデオ
  • 共同食料品の取り扱い
  • 完全な上半身のモーターコントロール
  • 言語誘導オブジェクト操作
  • 要約

ヘリックスの理解:

ヘリックスは35度の自由度(DOF)を誇り、ヒューマノイドロボットに比類のない器用さと自律性を提供します。広範な手動プログラミングを必要とする従来のロボットとは異なり、Helixは単純な自然言語の指示を使用して複雑で長期的なタスクを動的に実行します。このブレークスルーは、多様なオブジェクトや予測不可能なシナリオへの適応性が最も重要であるホーム設定でのロボットの実用性を大幅に進歩させます。

アーキテクチャデザイン:システム1およびシステム2:

Helixのアーキテクチャは、人間の認知プロセスを反映しており、Kahnemanの「思考、速く、遅い」モデルからインスピレーションを得ています:

Figure's Helix: AI that Brings Human-Like Robots to your Home - Analytics Vidhya

    システム2:「Big Brain」:この70億パラメータービジョン言語モデル(VLM)は、高レベルの推論、言語理解、視覚シーンの理解を処理します。 抽象コマンド(「砂漠のアイテムを拾う」など)を実用的な手順に翻訳します。
  • システム1:正確なアクション実行:

    この80百万パラメーター視覚運動ポリシーにより、システム2の指示に基づいて、把握やオブジェクト操作などの正確なアクションを迅速かつ低レベルの制御が保証します。 そのコンパクトサイズにより、迅速なリアルタイムの応答が可能になります
  • 両方のシステムは、低電力埋め込みGPUで動作し、外部のコンピューティングリソースへの依存を排除​​し、商業的な実行可能性への道を開いています。 重要な技術の進歩:

    • Unified Neural Network: helixは、すべての動作(ピッキング、配置、引き出し操作、冷蔵、マルチロボット相互作用)に単一のニューラルネットワークを利用し、タスク固有の微調整の必要性を排除します。
    • on-fly行動生成:
    • ヘリックスは、目に見えないオブジェクトのインテリジェントな新しい行動を生成し、人間のプログラミングやデモンストレーションの必要性を最小限に抑えます。 コマーシャルの準備:
    • 埋め込まれたGPUアーキテクチャは、クラウドベースのシステムのレイテンシと依存関係の問題なしに即座に現実世界の適用性を保証します。
    • デモンストレーションビデオ:

    図AIは、いくつかの説得力のあるビデオを通してヘリックスの機能を紹介しています:

    共同食料品のストレージ:

    2つのヘリックス駆動のロボットは、馴染みのない食料品を共同で保存し、調整と適応性を示しています。
    1. オブジェクトの操作:ロボット自然言語コマンドに基づいて、さまざまなタスク(ピッキング、配置、引き出し操作、冷蔵庫の相互作用)を実行します。
    2. 概念的推論:
    3. ヘリックスは、「砂漠のアイテムを拾う」などの抽象的なコマンドを解釈し、言語を物理的な行動に接続する能力を紹介します。
    4. 共同食料品の取り扱い:
    5. このビデオは、単一のヘリックスインスタンスで制御された2つのロボットを強調し、多様でなじみのない食料品アイテムを効率的に保存します。 アイテムのハンドオフや引き出し/容器への配置を含む彼らの調整は、自然言語のプロンプト(「クッキーの袋を手にする...」、「開いた引き出しに置く」)によって駆動されます。 これは、Helixのマルチロボットコラボレーションとゼロショット一般化機能を示しています

    完全な上半身のモーターコントロール:

    このデモンストレーションでは、200HzでのHelixの35-DOFコントロールを紹介しています。 ロボットはオブジェクトをスムーズに操作し、上半身(胴体、頭、手首、指)全体を調整して、最適なリーチと精度を実現します。 これは、Helixのリアルタイムの器用さと安定性を強調し、ハイドフシステムに関連する課題を克服します。

    言語誘導オブジェクト操作:

    このビデオは、高レベルのコマンドを正確なアクションに変換するヘリックスの能力を強調しています。 「砂漠のアイテムを拾う」に応答して、ヘリックスはおもちゃのサボテンを識別して選択し、抽象的な言語の理解を複雑な運動制御にリンクする能力を示しています。

    概要:

    図AIのヘリックスは、ヒューマノイドロボット工学の著しい跳躍を表しています。その革新的なVLAフレームワークは、デュアルシステムアーキテクチャとオンボード処理機能と相まって、人間のような推論と器用さを可能にし、特にホーム環境での実際のアプリケーションに理想的に適しています。 ヘリックスの自然言語の指示を理解して応答する能力は、事前のトレーニングなしで幅広いオブジェクトを処理します。

以上がフィギュア' sヘリックス:人間のようなロボットをあなたの家にもたらすAI -AnalyticsVidhyaの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。