


Greater Bay Area Science Forum │ 심천대학교 Huang Hui 교수: 지능형 그래픽 인식으로 로봇의 '목이 막히는' 문제를 해결합니다.
Southern Finance 옴니미디어 연수생 기자 Ma Jialu가 Nansha에서 보도합니다
실제 3차원 동적 환경 기능이 부족하여 로봇 지능의 추가 개발이 제한됩니다. "5월 20일, 과학 기술 혁신 분야의 국가 리더이자 심천대학교 컴퓨터 및 소프트웨어 학부장인 Huang Hui는 여성 과학자 하위 포럼인 "군중 속에서 그녀를 찾아서"에서 지능형 그래픽 인식에 대한 자신의 연구를 소개했습니다. " 결과적으로 드론을 사용하여 3차원 공간을 완전 자동 및 자율적으로 탐색하고 더 적은 데이터량으로 더 높은 정밀도의 모델링을 달성합니다. 현재 이 성과는 국제적으로 선도적인 위치에 있습니다. 디지털 트윈, 지능형 로봇 제조 등 다양한 분야에 활용 가능합니다.
더 작은 데이터 크기, 더 높은 정확도
중국과학원 물리학연구소는 한때 디지털 트윈의 정의를 대중화했습니다. 디지털 트윈, 영어 이름은 Digital Twin(디지털 트윈)이며 디지털 매핑 및 디지털 미러링으로도 알려져 있습니다. 디지털 트윈은 특정 장치나 시스템을 기반으로 디지털 '복사본'을 생성하는 것을 의미합니다. 간단히 말하면 현실 세계의 물리적 사물을 디지털 가상 경험으로 변환하는 것입니다.
2023년 초 중국정보통신기술원에서 발표한 '디지털 트윈 시티 산업 지도 연구 보고서(2022)'에서는 우리나라 디지털 트윈 산업의 발전 단계가 성장기에 접어들고 있는 것으로 관찰됐다. 시장은 활발하고, 시장주체는 지속적으로 확대되고 있습니다. 디지털 트윈은 '메타버스'의 구축 효율성과 실제감을 크게 향상시킬 수 있으며, '메타버스' 개념의 대중화와 함께 디지털 트윈의 첨단 기술이 더욱 발전하고 있다. 사람들에게 더 친숙합니다.
과거에는 데이터 트윈이 데이터를 수집하는 데 많은 인력과 물적 자원이 필요했고, 모델 구축을 위해 많은 계산을 사용했습니다. Huang Hui는 데이터 수집 비용이 높고, 적시성이 낮으며, 3D 모델링 객체가 구조화되지 않고 상관되지 않는다는 점을 지적했습니다. 이는 현재의 디지털 트윈이 지능적, 모듈식, 경량화, 구조화 및 범용성을 갖추는 것을 어렵게 만드는 문제점입니다.
위 문제에 대응하여 지난 10년 동안 Huang Hui는 어려움을 극복하기 위해 "지능형 그래픽 및 지각 컴퓨팅"에 집중했으며, 3차원 도시 스냅샷을 자동으로 수집하는 Usee 정밀 사진 측량 기술을 제안하는 데 앞장섰습니다. 휴대용 드론을 통해 밀리미터 수준의 고화질 해상도를 제공합니다. 전체 프로세스는 지속적으로 계획되고 처음부터 끝까지 크라우드소싱되어 최소한의 시야각으로 최대의 범위를 보장하는 동시에 대규모 도시 장면 데이터의 양을 200배로 줄입니다. 기하학적 세부 손실이 0.6m 미만으로 데이터 수집 장비에 대한 투자가 70% 감소됩니다. 다양한 정보와 양성 신진대사를 정확하게 매핑합니다. 이 기술은 근접 고정밀 도시 3차원 항공 조사라는 단일 프로젝트에 널리 사용되었으며, 적용 범위는 세계에서 국제적으로 선도적인 위치를 유지하고 있습니다.
심천시의 약 2,200제곱킬로미터에 대한 모델링을 예로 들어 보겠습니다. 실제로 모델링은 어려운 공역 조정, 수많은 고도 제한, 빈번한 기상 영향, 열악한 데이터 품질 및 긴 수집 시간이라는 문제에 직면합니다. 기존 모델링 방식을 사용하면 6천만 장의 이미지 데이터를 수집하고 60TB 모델을 구축하는 데 2년이 걸리며 총 비용은 1억 5천만 달러가 소요된다. 수집 방법의 주기가 길고 빈도가 낮기 때문에 City Twin의 3차원 기반에 대한 실시간 업데이트가 불가능합니다. 우시의 정밀 사진 측량 기술을 최적화하면 정확도 저하 없이 2천만 장의 사진 데이터를 활용해 8개월 만에 6TB 소형 모델 구축이 가능해지며, 총 비용도 60% 절감되는 6천만 장으로 절감된다.
디지털 트윈은 군집 지능, 무인 운전, 스마트 도시, 국토 안보, 산업 제조 및 기타 분야에서 중요한 가치와 중요성을 갖습니다. "Huang Hui는 Youshi의 정밀 사진 측량 기술이 드론을 사용하여 3차원 공간에 대한 완전 자동 및 독립적 탐사를 수행하고 클라우드 컴퓨팅을 실현함으로써 3차원 도시 재건의 비용과 문턱을 크게 줄일 수 있다고 말했습니다. 미래의 정밀 지능형 주행 지도, 실생활 3차원 내비게이션, 고정밀 도시 관리 정보 플랫폼 등
3차원 인식 부족으로 "로봇 목에 걸려요"
'디지털 트윈시티 산업지도 연구보고서(2022)'에서는 최근 인공지능 기술이 모델링 분야에 점차 적용되고 있으며, 사진 모델링과 영상 모델링이 향후 발전 트렌드로 자리 잡았음을 제시하고 있다. Huang Hui에 따르면 로봇 연구를 지원하기 위해 인공 지능을 적용하면 데이터 분석의 효율성이 향상되고 보다 효율적인 3차원 모델링 솔루션을 찾는 데 도움이 될 수 있습니다. 그녀는 그녀와 그녀의 팀이 지능형 로봇에 대한 연구를 더욱 발전시키기 위해 지능형 그래픽과 인공지능을 결합하는 방법을 연구하고 있다고 밝혔습니다.
지능형 그래프 인식의 과제는 ChatGPT에 비해 대규모 교육에 사용할 수 있는 데이터가 부족하다는 것입니다. Huang Hui는 ChatGPT에서 사용하는 원본 데이터는 기본적으로 수동으로 선별하고 주석을 달았으며 "깨끗하다"고 말했습니다. 그러나 이것이 3차원 공간으로 확장되면 난이도가 크게 높아질 것입니다. 한 품목의 사진을 1,000번 촬영할 수 있지만 1,000장의 사진 모두가 품목을 완전하고 정확하게 설명하지 못할 수도 있습니다. 다시 말하면, 소규모의 3차원 공간 데이터를 처리하기 위해 인공지능 모델을 훈련할 때 많은 양의 데이터를 처리해야 한다는 뜻이다.
로봇 지능이 정체되는 이유는 실제 3차원 동적 환경 능력이 부족하기 때문입니다. "왜 그렇게 어려운가요? 황휘는 일반적인 청소 로봇에 비유하여 다음과 같이 설명했습니다. 이제 청소 로봇을 평평한 표면에서 움직이게 하고, 장애물을 감지하고 피하며, 막히는 것을 방지하는 것이 쉽지 않습니다. 즉, 지능형 그래픽 인식 3차원 공간에서 사물의 형태를 판단할 수 있어야 하며, 이후 사물의 기능과 동적, 정적 관계를 판단할 수 있어야 하며, 보다 진보된 인식을 가질 수 있는 로봇 체화 지능을 부여하는 것이 필요하다. , 실제 3차원의 복잡한 동적 환경을 진정으로 직면하고 변화시킬 수 있으며, 인간처럼 "보고" 이해하여 결정과 행동을 내릴 수 있습니다.
20년 이상의 기초 연구 끝에 Huang Hui는 환경 인식, 기하학적 모델링, 의미론적 이해 및 자율적 의사 결정의 전체 체인을 통합하기 위해 팀을 이끌었습니다. 그러나 자연어 이해에 있어 상당한 진전을 이룬 ChatGPT 등 인공지능 기술에 비하면 아직 해결되지 않은 핵심 과학적 문제가 많고, “아직 갈 길이 멀다”고 한다.더 많은 콘텐츠를 보려면 21 Finance APP을 다운로드하세요
위 내용은 Greater Bay Area Science Forum │ 심천대학교 Huang Hui 교수: 지능형 그래픽 인식으로 로봇의 '목이 막히는' 문제를 해결합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

Hiddenlayer의 획기적인 연구는 LLMS (Leading Lange Language Models)에서 중요한 취약점을 드러냅니다. 그들의 연구 결과는 "정책 인형극"이라는 보편적 인 바이 패스 기술을 보여줍니다.

환경 책임과 폐기물 감소에 대한 추진은 기본적으로 비즈니스 운영 방식을 바꾸는 것입니다. 이 혁신은 제품 개발, 제조 프로세스, 고객 관계, 파트너 선택 및 새로운 채택에 영향을 미칩니다.

Advanced AI 하드웨어에 대한 최근 제한은 AI 지배에 대한 확대 된 지정 학적 경쟁을 강조하여 중국의 외국 반도체 기술에 대한 의존도를 드러냅니다. 2024 년에 중국은 3,800 억 달러 상당의 반도체를 수입했습니다.

Google의 Chrome의 잠재적 인 강제 매각은 기술 산업 내에서 강력한 논쟁을 불러 일으켰습니다. OpenAi가 65%의 글로벌 시장 점유율을 자랑하는 주요 브라우저를 인수 할 가능성은 TH의 미래에 대한 중요한 의문을 제기합니다.

전반적인 광고 성장을 능가 함에도 불구하고 소매 미디어의 성장은 느려지고 있습니다. 이 성숙 단계는 생태계 조각화, 비용 상승, 측정 문제 및 통합 복잡성을 포함한 과제를 제시합니다. 그러나 인공 지능

깜박 거리는 스크린 모음 속에서 정적으로 오래된 라디오가 딱딱합니다. 이 불안정한 전자 제품 더미, 쉽게 불안정하게, 몰입 형 전시회에서 6 개의 설치 중 하나 인 "The-Waste Land"의 핵심을 형성합니다.

Google Cloud의 다음 2025 : 인프라, 연결 및 AI에 대한 초점 Google Cloud의 다음 2025 회의는 수많은 발전을 선보였으며 여기에서 자세히 설명하기에는 너무 많았습니다. 특정 공지 사항에 대한 심도있는 분석은 My의 기사를 참조하십시오.

이번 주 AI 및 XR : AI 구동 창의성의 물결은 음악 세대에서 영화 제작에 이르기까지 미디어와 엔터테인먼트를 통해 휩쓸고 있습니다. 헤드 라인으로 뛰어 들자. AI 생성 콘텐츠의 영향력 증가 : 기술 컨설턴트 인 Shelly Palme


핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

Video Face Swap
완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

인기 기사

뜨거운 도구

SublimeText3 Linux 새 버전
SublimeText3 Linux 최신 버전

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

Atom Editor Mac 버전 다운로드
가장 인기 있는 오픈 소스 편집기

에디트플러스 중국어 크랙 버전
작은 크기, 구문 강조, 코드 프롬프트 기능을 지원하지 않음

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경
