인출식 레일이 있는 서랍, 수직 회전축이 있는 도어, 수평 회전축이 있는 오븐 등 일상생활에서 사람들이 접하는 대부분의 가구는 "관절형 개체"입니다. 다양한 관절로 연결됩니다.
이러한 관절의 존재로 인해 연결되는 물체의 부품 중 다양한 부분이 관절에 의해 운동학적으로 구속되므로 이러한 부품은 1개의 자유도(1DoF)만 갖습니다. 이러한 품목은 우리 삶의 모든 곳에, 특히 일상생활의 중요한 부분입니다. 인간으로서 우리는 어떤 종류의 가구를 가지고 있더라도 그것을 조작하고 제어하는 방법을 빠르게 알아낼 수 있다는 것을 알고 있습니다. 이는 마치 우리가 이 물체의 모든 관절이 어떻게 움직이는지 아는 것과 같습니다.
그럼 로봇도 사람처럼 가구가 어떻게 움직일지 예측할 수 있을까요? 이런 예측 능력은 나오기 힘든데, 만약 로봇이 이런 능력을 배울 수 있다면 가정용 로봇에게는 큰 힘이 될 것입니다.
최근 CMU 로봇 공학 대학의 David Held 교수가 이끄는 R-PAD 연구실의 두 학생인 Ben Eisner와 Harry Zhang은 복잡한 관절 개체를 조작하는 데 획기적인 발전을 이루었고 3D 신경망 기반 FlowBot 3D를 출시했습니다. 일상적인 가구와 같은 관절로 연결된 물체의 움직임 궤적을 효과적으로 표현하고 예측하는 알고리즘입니다. 알고리즘은 두 부분으로 구성됩니다.
첫 번째 부분은 인식 부분으로, 3D 심층 신경망을 사용하여 조작된 가구 객체의 포인트 클라우드 데이터로부터 3차원 순간 운동 궤적(3D Articulated Flow)을 예측합니다.
알고리즘의 두 번째 부분은 정책 부분으로, 예측된 3D Articulated Flow를 사용하여 로봇의 다음 동작을 선택합니다. 둘 다 시뮬레이터에서 완전히 학습되며 재교육이나 조정 없이 실제 세계에서 직접 구현할 수 있습니다. FlowBot 3D 알고리즘의 도움으로 로봇은 인간처럼 일상 가구와 같은 관절로 연결된 물체를 마음대로 조작할 수 있습니다.
본 논문은 현재 세계 최고의 로봇공학 컨퍼런스인 Robotics Science and Systems (RSS) 2022에서 최우수 논문 후보(상위 3%)이며, 미국 뉴욕에서 전시될 예정입니다. 7월에는 최고의 논문의 영예를 놓고 다른 7개의 우수한 논문을 출판하고 경쟁했습니다.
- 논문 주소: https://arxiv.org/pdf/2205.04382.pdf
- 프로젝트 홈페이지: https://sites.google.com/view/articulated-flowbot-3d
FlowBot 3D는 시뮬레이터에만 의존하여 시뮬레이션된 데이터에서 지도 학습을 수행하여 일상 가구와 같은 관절 객체 부품의 순간적인 운동 궤적을 학습합니다(3D Articulated Flow). 3D Articulated Flow는 로봇의 다음 전략의 복잡성을 크게 단순화하고 일반화 및 효율성을 향상시킬 수 있는 시각적 포인트 클라우드 궤적 표현 방법입니다. 로봇은 관절 물체를 조작하는 작업을 완료하기 위해 이 순간적인 궤적을 따르고 폐쇄 루프에서 이 궤적을 다시 예측하기만 하면 됩니다.
기존 학계에서 가구 등 관절물체를 조작하는 기존 방식은 조작된 물체의 기하학적 특성(연결된 부품의 위치, 방향 등)을 통해 부품의 이동방향을 계산하거나, 공동 개체 조작의 복잡한 동작을 완료하기 위해 특정 개체의 작동을 배우는 전문가 전략(보통 인간의 전략)을 모방합니다. 이러한 학계의 전통적인 방법은 일반화가 잘 되지 않고, 데이터 활용의 효율성도 낮습니다. 이와 달리 FlowBot 3D는 인간이 시연 데이터를 제공할 필요가 없는 최초의 순수 시뮬레이터 기반 학습이며, 알고리즘을 통해 로봇은 각 부품의 순간적인 동작 궤적을 학습하여 최적의 객체 조작 경로를 계산할 수 있으므로 알고리즘은 일반화 가능성이 높습니다. FlowBot 3D가 시뮬레이터 교육 중에 보이지 않는 물체를 일반화하여 실제 일상 가구 항목을 현실 세계에서 직접 성공적으로 조작할 수 있는 것이 바로 이 기능입니다.
다음 애니메이션은 FlowBot 3D의 조작 과정을 보여줍니다. 왼쪽은 조작된 영상이고, 오른쪽은 포인트 클라우드 3D Articulated Flow의 예측된 순간 모션 궤적입니다. FlowBot 3D 알고리즘을 사용하면 먼저 로봇이 물체의 어느 부분을 조작할 수 있는지 식별한 다음 해당 부분의 이동 방향을 예측할 수 있습니다.
냉장고 문을 열어보세요:
ㅋㅋㅋ : 전반적으로 본 논문은 다음과 같은 분야에 상당한 기여를 하고 있다. 로봇 제어.그렇다면 FlowBot 3D는 이 기술을 어떻게 학습할까요?
FlowBot 3D의 구체적인 방법은 복잡하지 않으며 복잡한 실제 인간 데이터 없이 시뮬레이터에만 의존합니다. 또한 시뮬레이터의 또 다른 이점은 시뮬레이터에서 이러한 가정용 물체의 3D 데이터 파일(URDF)에 각 부품의 운동학적 제약 조건과 제약 조건의 특정 매개 변수가 포함되어 있으므로 각 부품의 운동 궤적이 시뮬레이터로 정확하게 계산할 수 있습니다.
시뮬레이터 훈련 중에 로봇은 조작 대상의 3차원 포인트 클라우드 데이터를 로봇 비전 모듈에 대한 입력 데이터로 관찰합니다. 비전 모듈(인식 모듈)은 PointNet++를 사용하여 외부 힘의 작용에 따라 입력 포인트 클라우드의 각 지점의 순간 동작 궤적에 대한 3D 연결 흐름을 예측합니다(예: 서랍이 1cm 열리면 문이 5도 열립니다). 외부), 열악한 형태로 표현된 3차원 좌표 벡터를 사용합니다. 이 운동 궤적의 실제 데이터는 순운동학을 통해 정확하게 계산될 수 있습니다. 다음 3차원 벡터 좌표에서 현재 3차원 벡터 좌표를 빼면 조작 대상 부분의 운동 궤적을 얻을 수 있다. 따라서 훈련 중에 지도 학습을 위해서는 예측된 3D Articulated 흐름의 L2 손실만 최소화하면 됩니다.
이 그림에서 파란색 점은 관찰된 포인트 클라우드 데이터이고 빨간색 화살표는 정면 3D Articulated Flow의 예상 이동 궤적을 나타냅니다.
이런 방식으로 학습하면 FlowBot 3D는 운동학적 제약 하에서 각 부품의 이동 방향과 동일한 힘으로 움직이는 부품의 각 지점의 상대 속도 및 상대 방향(속도)을 학습할 수 있습니다. 일반적인 가정용 공동 품목은 각기둥 모양이며 회전합니다. 서랍과 같은 트위치 부품의 경우 동일한 외력을 받으면 서랍 표면의 각 지점의 이동 방향과 속도가 동일합니다. 도어와 같은 회전 부품의 경우, 동일한 외력을 받을 때 도어 표면의 각 지점의 이동 방향은 동일하지만 회전축에서 멀어질수록 속도가 증가합니다. 연구원들은 로봇 공학의 물리적 법칙(나사 이론)을 사용하여 가장 긴 3D 관절 흐름이 물체의 가속도를 최대화할 수 있음을 증명했습니다. 뉴턴의 제2법칙에 따르면 이 전략이 최적의 솔루션입니다.
이론적으로 실제 동작에서 로봇이 해야 할 일은 FlowBot 3D의 비전 모듈을 통해 각 지점의 이동 궤적을 예측하는 것입니다. 궤적, 가장 긴 3D 관절형 흐름 방향에 해당하는 점을 제어점으로 찾고, 폐루프에서 이 제어점의 모션 궤적을 예측합니다. 선택한 조작 지점을 성공적으로 잡을 수 없는 경우(예: 표면이 로봇 손의 파지 조건을 충족하지 않는 경우) FlowBot 3D는 파지 조건을 충족하는 두 번째로 긴 길이를 가진 지점을 선택합니다.
또한 PointNet++의 특성으로 인해 FlowBot 3D는 각 점의 동작 궤적을 예측하고 물체 자체의 기하학적 특성에 의존하지 않으며 로봇이 물체를 가리는 경우에도 매우 견고합니다. 또한 이 알고리즘은 폐쇄 루프이기 때문에 로봇은 다음 예측 단계에서 발생할 수 있는 오류를 수정할 수 있습니다.
FlowBot 3D의 현실 세계 성능FlowBot 3D는 현실 세계의 일반화 문제를 극복할 수 있는 능력을 갖추고 있습니다. FlowBot 3D의 설계 개념은 조작된 객체 3D 관절 흐름의 이동 궤적을 정확하게 예측할 수 있는 한 다음 단계는 이 궤적을 따라 작업을 완료하는 것입니다.
또 다른 중요한 점은 FlowBot 3D가 단일 훈련 모델을 사용하여 훈련에서 볼 수 없는 범주를 포함하여 여러 범주의 항목을 조작한다는 것입니다. 그리고 현실 세계에서 로봇은 다양한 실제 물체를 조작하기 위해 순수한 시뮬레이터 훈련을 통해 얻은 모델만 사용하면 됩니다. 따라서 현실 세계에서는 가정용 물체의 운동학적 제약이 시뮬레이터와 압도적으로 동일하기 때문에 FlowBot 3D를 현실 세계에 직접 일반화할 수 있습니다.
실제 실험에서 FlowBot3D가 사용하는 가정용품(쓰레기통, 냉장고, 변기, 상자, 금고 등 포함)
시뮬레이터에서 로봇은 일부 카테고리의 가정용품을 사용합니다. 스테이플러, 쓰레기통, 서랍, 창문, 냉장고 등을 포함한 훈련용. 시뮬레이터 및 실제 테스트에서 테스트 데이터는 훈련 중에 보지 못한 훈련 범주 및 범주의 새로운 개체에서 나옵니다.
FlowBot 3D 시뮬레이터의 조작 작업
이에 비해 학계에서는 모방 학습을 기반으로 한 일반적인 방법이 필요합니다. 새로운 물체를 조작하는 방법을 배우기 위한 수동 지침으로 인해 이러한 로봇을 현실 세계, 특히 가정용 로봇 시나리오에서 구현하는 것은 비현실적입니다. 또한 3D 포인트 클라우드 데이터는 2D RGB 데이터에서 사용되는 것보다 강력합니다. 포인트 클라우드를 사용하면 로봇이 각 관절과 관절 간의 관계를 이해할 수 있으므로 더 높은 수준에서 부품의 이동 궤적을 이해하고 예측할 수 있어 일반화가 크게 향상됩니다
실험 결과에 따르면 FlowBot 3D는 대부분의 물체를 작동할 때(훈련 중에 표시되는 카테고리인지 여부에 관계없이) 10% 미만의 "완전 개방" 거리와 90% 이상의 성공 범위를 달성할 수 있는 것으로 나타났습니다. 이에 비해 모방 학습(DAgger) 또는 강화 학습(SAC)을 기반으로 하는 다른 방법은 훨씬 뒤떨어져 있고 일반화가 부족합니다.
간단히 말하면 FlowBot 3D는 엄청난 잠재력을 지닌 작업입니다. 미세 조정 없이도 현실 세계에서 효율적으로 배포할 수 있습니다. 이 작업은 또한 컴퓨터 비전의 발전이 로봇 공학 분야, 특히 3D 관절형 흐름이라고 불리는 모션 궤적의 시각적 표현을 변화시킬 수 있음을 보여줍니다. 이는 로봇 전략 선택 및 의사 결정 프로세스를 단순화하기 위해 여러 작업에 적용할 수 있습니다. 이러한 일반화 가능한 표현을 통해 시뮬레이터 학습 방법은 실제 세계에 직접 배포될 수 있는 잠재력을 갖게 되며, 이는 미래의 가정용 로봇 훈련 및 학습 비용을 크게 절감할 것입니다.
FlowBot 3D의 다음 계획현재 연구팀은 흐름을 활용해 6자유도로 물체의 궤적을 예측하는 방법 등 관절 물체 이외의 물체에도 흐름 이해 및 예측 방법을 적용하려고 노력하고 있다. . 동시에 저자는 흐름을 일반적인 시각적 표현으로 활용하여 강화학습 등 다른 로봇 학습 작업에도 적용함으로써 학습 효율성, 견고성, 일반화 가능성을 높이려고 노력하고 있습니다.
David Held 부교수 홈페이지: https://davheld.github.io/Ben Eisner 홈페이지: https://beisner.me/Harry Zhang 홈페이지: https://harryzhangog.github.io/
위 내용은 CMU는 일상적인 가구 작동 방법을 정확하게 학습하는 새로운 능숙한 로봇 알고리즘을 발표했습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

대형 언어 모델 (LLM)은 인기가 높아졌으며, 도구 전달 기능은 단순한 텍스트 생성을 넘어 기능을 극적으로 확장했습니다. 이제 LLM은 동적 UI 생성 및 자율적 인 A와 같은 복잡한 자동화 작업을 처리 할 수 있습니다.

비디오 게임이 불안을 완화하거나 집중하거나 ADHD를 가진 어린이를 지원할 수 있습니까? 건강 관리 도전이 전 세계적으로 급증함에 따라, 특히 청소년들 사이에서 혁신가들은 비디오 게임 인 가능성이없는 도구로 전환하고 있습니다. 이제 세계 최대의 엔터테인먼트 인더스 중 하나입니다

UNCTAD의 사무 총장 인 Rebeca Grynspan은“역사는 기술 진보가 경제 성장을 유발하거나 공평한 소득 분배를 보장하거나 포용적인 인간 발전을 촉진하지는 않습니다.

쉽게 생성 AI를 협상 교사 및 스파링 파트너로 사용하십시오. 그것에 대해 이야기합시다. 혁신적인 AI 혁신에 대한이 분석은 AI의 최신 Forbes 열 범위의 일부입니다.

밴쿠버에서 개최 된 TED2025 컨퍼런스는 어제 4 월 11 일 36 번째 판을 마무리했습니다. Sam Altman, Eric Schmidt 및 Palmer Luckey를 포함한 60 개 이상의 국가에서 80 명의 스피커를 선보였습니다. 테드의 주제 인“인류를 다시 상상했다”는 재단사가 만들어졌다

Joseph Stiglitz는 2001 년에 유명한 경제학자이자 노벨 경제학상을 수상했습니다. Stiglitz는 AI가 기존의 불평등과 통합 된 권력을 몇몇 지배적 인 기업의 손에 악화시킬 수 있으며 궁극적으로 경제를 훼손 할 수 있다고 주장합니다.

그래프 데이터베이스 : 관계를 통한 데이터 관리 혁명 데이터가 확장되고 그 특성이 다양한 필드에서 발전함에 따라 그래프 데이터베이스는 상호 연결된 데이터를 관리하기위한 변환 솔루션으로 떠오르고 있습니다. 전통적인 것과는 달리

대형 언어 모델 (LLM) 라우팅 : 지능형 작업 분포를 통한 성능 최적화 LLM의 빠르게 진화하는 환경은 각각 독특한 강점과 약점을 가진 다양한 모델을 제시합니다. 일부는 Creative Content Gen에서 탁월합니다


핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

Dreamweaver Mac版
시각적 웹 개발 도구

안전한 시험 브라우저
안전한 시험 브라우저는 온라인 시험을 안전하게 치르기 위한 보안 브라우저 환경입니다. 이 소프트웨어는 모든 컴퓨터를 안전한 워크스테이션으로 바꿔줍니다. 이는 모든 유틸리티에 대한 액세스를 제어하고 학생들이 승인되지 않은 리소스를 사용하는 것을 방지합니다.

WebStorm Mac 버전
유용한 JavaScript 개발 도구

mPDF
mPDF는 UTF-8로 인코딩된 HTML에서 PDF 파일을 생성할 수 있는 PHP 라이브러리입니다. 원저자인 Ian Back은 자신의 웹 사이트에서 "즉시" PDF 파일을 출력하고 다양한 언어를 처리하기 위해 mPDF를 작성했습니다. HTML2FPDF와 같은 원본 스크립트보다 유니코드 글꼴을 사용할 때 속도가 느리고 더 큰 파일을 생성하지만 CSS 스타일 등을 지원하고 많은 개선 사항이 있습니다. RTL(아랍어, 히브리어), CJK(중국어, 일본어, 한국어)를 포함한 거의 모든 언어를 지원합니다. 중첩된 블록 수준 요소(예: P, DIV)를 지원합니다.

DVWA
DVWA(Damn Vulnerable Web App)는 매우 취약한 PHP/MySQL 웹 애플리케이션입니다. 주요 목표는 보안 전문가가 법적 환경에서 자신의 기술과 도구를 테스트하고, 웹 개발자가 웹 응용 프로그램 보안 프로세스를 더 잘 이해할 수 있도록 돕고, 교사/학생이 교실 환경 웹 응용 프로그램에서 가르치고 배울 수 있도록 돕는 것입니다. 보안. DVWA의 목표는 다양한 난이도의 간단하고 간단한 인터페이스를 통해 가장 일반적인 웹 취약점 중 일부를 연습하는 것입니다. 이 소프트웨어는
