大湾区科学フォーラム|深セン大学の黄輝教授:インテリジェントなグラフィック認識がロボットの「首詰まり」問題を解決
南方金融オールメディア研修生レポーター馬佳露南沙レポート
ロボット知能のさらなる発展は、実際の 3 次元の動的環境機能の欠如によって制限されています。 「5月20日、科学技術イノベーションの国家的リーダーで深セン大学コンピューター・ソフトウェア学部長の黄輝氏は、女性科学者サブフォーラム「群衆の中で彼女を探している」でインテリジェントなグラフィックス知覚に関する研究を紹介した。これにより、UAVによる三次元空間の全自動・自律探査が可能となり、より少ないデータ量でより高精度なモデリングが実現できます。この成果は現在、国際的にも評価されています。主導的な地位にあり、デジタルツインやインテリジェントロボット製造などの分野で使用できます。広く使用されています。
データサイズが小さくなり、精度が高くなります
中国科学院物理研究所はかつてデジタルツインの定義を広めました:デジタルツイン、英語名はDigital Twin(デジタルツイン)、デジタルマッピングやデジタルミラーリングとも呼ばれます。デジタルツインとは、特定のデバイスやシステムに基づいてデジタルの「コピー」を作成することであり、簡単に言うと、現実世界の物理的なオブジェクトをデジタルの仮想体験に変換することです。
2023 年初頭に、中国情報通信技術院が発表した「デジタル ツイン都市産業マップ調査報告書 (2022 年)」では、我が国のデジタル ツイン産業の発展段階は成長期にあり、デジタル ツインであることがわかりました。都市建設市場は活発であり、市場主体は絶えず拡大しています。デジタルツインは、「メタバース」の構築効率と実感を大幅に向上させることができ、「メタバース」の重要な要素となっており、「メタバース」の概念の普及に伴い、デジタルツインの最先端技術の活用はますます進んでいます。より人々に親しまれます。
これまでのデータ ツインでは、データを収集するために多くの人的資源と物的リソースが必要で、モデルを構築するために多くの計算が必要でした。 Huang Hui 氏は、データ収集のコストが高く、適時性が低く、3D モデリングのオブジェクトが構造化されておらず相関性がないことを指摘しました。これが、現在のデジタル ツインがインテリジェンス、モジュール性、軽量化を達成することを困難にしている問題点です。構造と一般化。
上記の問題に対応して、Huang Hui は過去 10 年間、困難を克服するために「インテリジェント グラフィックスと知覚コンピューティング」に焦点を当て、都市の 3 次元を完全に自動的に収集する Youshi 精密写真測量技術の提案を主導してきました。スナップショット、プロセス全体が継続的に計画され、エンドツーエンドでクラウドソーシングされ、最小限の視野角を使用して最大のカバレッジを達成し、大規模な都市シーンのデータ量を 200 削減します。幾何学的詳細損失を 0.6 メートル未満に抑えながら、データ収集装置への投資を 70% 削減できます。複数の情報と良性代謝の正確なマッピングを実現します。この技術は、都市部の高精度三次元航空測量という単一プロジェクトで幅広く活用されており、そのカバーエリアは世界トップクラスの地位を維持しています。
深セン市の約 2,200 平方キロメートルのモデリングを例に挙げると、実際のモデリングでは、困難な空域調整、多数の高度制限、頻繁な気象影響、劣悪なデータ品質、長い収集時間といった課題に直面しています。従来のモデリング手法を使用した場合、6,000万枚の画像データを収集し、60TBのモデルを構築するには2年かかり、総コストは1億5,000万かかります。この取得方法は周期が長く、周波数が低いため、都市双子の 3 次元基底のリアルタイム更新は達成できません。ウシの精密写真測量技術を最適化した結果、精度を落とすことなく2,000万枚の写真データを使用した6TBの小型モデルを8か月で構築することが可能となり、総コストは60%削減の6,000万に削減された。
デジタルツインは、群知能、無人運転、スマートシティ、国土安全保障、工業製造などの分野で重要な価値と重要性を持っています。 「Huang Hui氏は、Youshiの高精度写真測量技術は、ドローンを使用して3次元空間の完全自動かつ独立した探査を実行し、クラウドコンピューティングを実現することで、3次元都市再構築のコストと敷居を大幅に削減できると述べた。将来の高精度インテリジェント運転地図建設、現実の3次元ナビゲーション、高精度都市管理情報プラットフォームなどの分野。
三次元認識能力の欠如が「ロボットの首を絞める」
「デジタルツインシティ産業マップ調査報告書(2022)」では、近年、人工知能技術がモデリングの分野に徐々に応用されており、画像モデリングとビデオモデリングが将来の開発トレンドになると提案しています。 Huang Hui 氏によると、ロボット研究を支援するために人工知能を応用することで、データ分析の効率が向上し、より効率的な 3 次元モデリング ソリューションの発見に役立つ可能性があります。彼女と彼女のチームは、インテリジェント ロボットの研究をさらに進めるために、インテリジェント グラフィックスと人工知能を組み合わせる方法を研究していることを明らかにしました。インテリジェントなグラフ認識の課題は、ChatGPT と比較して大規模なトレーニングに利用できるデータが不足していることです。 Huang Hui氏は、ChatGPTが使用する元のデータは基本的に手作業で選別され、注釈が付けられており「きれい」だが、これが3次元空間にまで及ぶと難易度が大幅に上がると述べた。商品は 1,000 回撮影できますが、1,000 枚すべての写真で商品が完全かつ正確に説明されているとは限りません。これは、小規模な 3 次元空間データを処理するために人工知能モデルをトレーニングする場合、大量のデータを処理する必要があることを意味します。
ロボットには実際の 3 次元の動的環境機能が欠如しているため、ロボットの知能は行き詰まっています。 「なぜそんなに難しいのでしょうか?黄輝氏は、一般的な掃除ロボットの例えを使って説明しました。掃除ロボットを平らな面で動かし、障害物を感知して回避し、立ち往生を防ぐことは、今では簡単ではありません。 it、知的グラフィックス知覚 3次元空間内の物体の形状を判断し、物体の機能や動的・静的関係を判断できる必要がある より高度な知覚を実現できる身体化知能をロボットに与える必要があるそして、実際の三次元の複雑でダイナミックな環境に真に直面し、変化させることができ、人間のように「見る」ことができます。それは、理解することであり、見たものが得られるものです」と判断し、行動することができます。
20 年以上の基礎研究を経て、Huang Hui はチームを率いて、環境認識、幾何学的モデリング、意味論的理解、自律的な意思決定の連鎖全体を統合することを試みました。しかし、自然言語理解において大きな進歩を遂げたChatGPTなどの人工知能技術と比較すると、まだ解決されていない重要な科学的課題が多く、「道のりはまだ長い」という。詳細なコンテンツについては、21 Finance APP をダウンロードしてください
以上が大湾区科学フォーラム|深セン大学の黄輝教授:インテリジェントなグラフィック認識がロボットの「首詰まり」問題を解決の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

導入 人工知能は新しい時代に入りました。モデルが事前定義されたルールに基づいて単に情報を出力する時代は終わりました。今日のAIの最先端のアプローチは、Ragを中心に展開しています(検索装備

複雑なSQLクエリを書いたり、スプレッドシートを並べ替えたりせずに、データベースと話をしたり、単純な言語で質問したり、即座に答えを得たりすることを望んだことがありますか? LangchainのSQL Toolkit、Groq a

スタンフォード大学ヒト指向の人工知能研究所によってリリースされた2025年の人工知能インデックスレポートは、進行中の人工知能革命の良い概要を提供します。 4つの単純な概念で解釈しましょう:認知(何が起こっているのかを理解する)、感謝(利益を見る)、受け入れ(顔の課題)、責任(責任を見つける)。 認知:人工知能はどこにでもあり、急速に発展しています 私たちは、人工知能がどれほど速く発展し、広がっているかを強く認識する必要があります。人工知能システムは絶えず改善されており、数学と複雑な思考テストで優れた結果を達成しており、わずか1年前にこれらのテストで惨めに失敗しました。 2023年以来、複雑なコーディングの問題や大学院レベルの科学的問題を解決することを想像してみてください

メタのラマ3.2:マルチモーダルとモバイルAIの前進 メタは最近、ラマ3.2を発表しました。これは、モバイルデバイス向けに最適化された強力なビジョン機能と軽量テキストモデルを特徴とするAIの大幅な進歩です。 成功に基づいてo

今週のAIの風景:進歩、倫理的考慮、規制の議論の旋風。 Openai、Google、Meta、Microsoftのような主要なプレーヤーは、画期的な新しいモデルからLEの重要な変化まで、アップデートの急流を解き放ちました

つながりの慰めの幻想:私たちはAIとの関係において本当に繁栄していますか? この質問は、MIT Media Labの「AI(AHA)で人間を進める」シンポジウムの楽観的なトーンに挑戦しました。イベントではCondedgを紹介している間

導入 あなたが科学者またはエンジニアで複雑な問題に取り組んでいると想像してください - 微分方程式、最適化の課題、またはフーリエ分析。 Pythonの使いやすさとグラフィックスの機能は魅力的ですが、これらのタスクは強力なツールを必要とします

メタのラマ3.2:マルチモーダルAIパワーハウス Metaの最新のマルチモーダルモデルであるLlama 3.2は、AIの大幅な進歩を表しており、言語理解の向上、精度の向上、および優れたテキスト生成機能を誇っています。 その能力t


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

AtomエディタMac版ダウンロード
最も人気のあるオープンソースエディター

MantisBT
Mantis は、製品の欠陥追跡を支援するために設計された、導入が簡単な Web ベースの欠陥追跡ツールです。 PHP、MySQL、Web サーバーが必要です。デモおよびホスティング サービスをチェックしてください。

ZendStudio 13.5.1 Mac
強力な PHP 統合開発環境

EditPlus 中国語クラック版
サイズが小さく、構文の強調表示、コード プロンプト機能はサポートされていません

SecLists
SecLists は、セキュリティ テスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティ テスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティ テストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジング ペイロード、機密データ パターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテスト マシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。
