ホームページ > 記事 > テクノロジー周辺機器 > 大湾区科学フォーラム|深セン大学の黄輝教授:インテリジェントなグラフィック認識がロボットの「首詰まり」問題を解決
南方金融オールメディア研修生レポーター馬佳露南沙レポート
ロボット知能のさらなる発展は、実際の 3 次元の動的環境機能の欠如によって制限されています。 「5月20日、科学技術イノベーションの国家的リーダーで深セン大学コンピューター・ソフトウェア学部長の黄輝氏は、女性科学者サブフォーラム「群衆の中で彼女を探している」でインテリジェントなグラフィックス知覚に関する研究を紹介した。これにより、UAVによる三次元空間の全自動・自律探査が可能となり、より少ないデータ量でより高精度なモデリングが実現できます。この成果は現在、国際的にも評価されています。主導的な地位にあり、デジタルツインやインテリジェントロボット製造などの分野で使用できます。広く使用されています。
データサイズが小さくなり、精度が高くなります
中国科学院物理研究所はかつてデジタルツインの定義を広めました:デジタルツイン、英語名はDigital Twin(デジタルツイン)、デジタルマッピングやデジタルミラーリングとも呼ばれます。デジタルツインとは、特定のデバイスやシステムに基づいてデジタルの「コピー」を作成することであり、簡単に言うと、現実世界の物理的なオブジェクトをデジタルの仮想体験に変換することです。
2023 年初頭に、中国情報通信技術院が発表した「デジタル ツイン都市産業マップ調査報告書 (2022 年)」では、我が国のデジタル ツイン産業の発展段階は成長期にあり、デジタル ツインであることがわかりました。都市建設市場は活発であり、市場主体は絶えず拡大しています。デジタルツインは、「メタバース」の構築効率と実感を大幅に向上させることができ、「メタバース」の重要な要素となっており、「メタバース」の概念の普及に伴い、デジタルツインの最先端技術の活用はますます進んでいます。より人々に親しまれます。
これまでのデータ ツインでは、データを収集するために多くの人的資源と物的リソースが必要で、モデルを構築するために多くの計算が必要でした。 Huang Hui 氏は、データ収集のコストが高く、適時性が低く、3D モデリングのオブジェクトが構造化されておらず相関性がないことを指摘しました。これが、現在のデジタル ツインがインテリジェンス、モジュール性、軽量化を達成することを困難にしている問題点です。構造と一般化。
上記の問題に対応して、Huang Hui は過去 10 年間、困難を克服するために「インテリジェント グラフィックスと知覚コンピューティング」に焦点を当て、都市の 3 次元を完全に自動的に収集する Youshi 精密写真測量技術の提案を主導してきました。スナップショット、プロセス全体が継続的に計画され、エンドツーエンドでクラウドソーシングされ、最小限の視野角を使用して最大のカバレッジを達成し、大規模な都市シーンのデータ量を 200 削減します。幾何学的詳細損失を 0.6 メートル未満に抑えながら、データ収集装置への投資を 70% 削減できます。複数の情報と良性代謝の正確なマッピングを実現します。この技術は、都市部の高精度三次元航空測量という単一プロジェクトで幅広く活用されており、そのカバーエリアは世界トップクラスの地位を維持しています。
深セン市の約 2,200 平方キロメートルのモデリングを例に挙げると、実際のモデリングでは、困難な空域調整、多数の高度制限、頻繁な気象影響、劣悪なデータ品質、長い収集時間といった課題に直面しています。従来のモデリング手法を使用した場合、6,000万枚の画像データを収集し、60TBのモデルを構築するには2年かかり、総コストは1億5,000万かかります。この取得方法は周期が長く、周波数が低いため、都市双子の 3 次元基底のリアルタイム更新は達成できません。ウシの精密写真測量技術を最適化した結果、精度を落とすことなく2,000万枚の写真データを使用した6TBの小型モデルを8か月で構築することが可能となり、総コストは60%削減の6,000万に削減された。
デジタルツインは、群知能、無人運転、スマートシティ、国土安全保障、工業製造などの分野で重要な価値と重要性を持っています。 「Huang Hui氏は、Youshiの高精度写真測量技術は、ドローンを使用して3次元空間の完全自動かつ独立した探査を実行し、クラウドコンピューティングを実現することで、3次元都市再構築のコストと敷居を大幅に削減できると述べた。将来の高精度インテリジェント運転地図建設、現実の3次元ナビゲーション、高精度都市管理情報プラットフォームなどの分野。
三次元認識能力の欠如が「ロボットの首を絞める」
「デジタルツインシティ産業マップ調査報告書(2022)」では、近年、人工知能技術がモデリングの分野に徐々に応用されており、画像モデリングとビデオモデリングが将来の開発トレンドになると提案しています。 Huang Hui 氏によると、ロボット研究を支援するために人工知能を応用することで、データ分析の効率が向上し、より効率的な 3 次元モデリング ソリューションの発見に役立つ可能性があります。彼女と彼女のチームは、インテリジェント ロボットの研究をさらに進めるために、インテリジェント グラフィックスと人工知能を組み合わせる方法を研究していることを明らかにしました。インテリジェントなグラフ認識の課題は、ChatGPT と比較して大規模なトレーニングに利用できるデータが不足していることです。 Huang Hui氏は、ChatGPTが使用する元のデータは基本的に手作業で選別され、注釈が付けられており「きれい」だが、これが3次元空間にまで及ぶと難易度が大幅に上がると述べた。商品は 1,000 回撮影できますが、1,000 枚すべての写真で商品が完全かつ正確に説明されているとは限りません。これは、小規模な 3 次元空間データを処理するために人工知能モデルをトレーニングする場合、大量のデータを処理する必要があることを意味します。
ロボットには実際の 3 次元の動的環境機能が欠如しているため、ロボットの知能は行き詰まっています。 「なぜそんなに難しいのでしょうか?黄輝氏は、一般的な掃除ロボットの例えを使って説明しました。掃除ロボットを平らな面で動かし、障害物を感知して回避し、立ち往生を防ぐことは、今では簡単ではありません。 it、知的グラフィックス知覚 3次元空間内の物体の形状を判断し、物体の機能や動的・静的関係を判断できる必要がある より高度な知覚を実現できる身体化知能をロボットに与える必要があるそして、実際の三次元の複雑でダイナミックな環境に真に直面し、変化させることができ、人間のように「見る」ことができます。それは、理解することであり、見たものが得られるものです」と判断し、行動することができます。
20 年以上の基礎研究を経て、Huang Hui はチームを率いて、環境認識、幾何学的モデリング、意味論的理解、自律的な意思決定の連鎖全体を統合することを試みました。しかし、自然言語理解において大きな進歩を遂げたChatGPTなどの人工知能技術と比較すると、まだ解決されていない重要な科学的課題が多く、「道のりはまだ長い」という。詳細なコンテンツについては、21 Finance APP をダウンロードしてください
以上が大湾区科学フォーラム|深セン大学の黄輝教授:インテリジェントなグラフィック認識がロボットの「首詰まり」問題を解決の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。