arXiv 논문 "ST-P3: 공간-시간적 특징 학습을 통한 엔드 투 엔드 비전 기반 자율 주행", 7월 22일, Shanghai Jiao Tong University, Shanghai AI Laboratory, University of California San Diego 및 JD의 베이징 연구 저자 .com 병원.
ST-P3라고 하는 인식, 예측 및 계획 작업을 위한 보다 대표적인 기능 세트를 동시에 제공할 수 있는 시공간 기능 학습 방식을 제안합니다. 구체적으로, BEV 변환을 감지하기 전에 3차원 공간에 기하학적 정보를 유지하기 위한 자기 중심 정렬 축적 기술이 제안되었습니다. 저자는 미래 예측을 위해 과거 모션 변화를 고려하는 이중 경로 모델을 설계합니다. 계획된 시각적 요소 인식을 보완하기 위해 개선 단위가 도입되었습니다. 소스 코드, 모델 및 프로토콜 세부 사항 오픈 소스 https://github.com/OpenPercepti onX/ST-P3 .
깊이를 통해 다시점 카메라에서 원근 특징을 추출하는 선구적인 LSS 방법입니다. 3D로 업그레이드되어 BEV 공간에 통합될 것으로 추정됩니다. 잠재 깊이 예측이 중요한 두 뷰 간의 기능 변환.
2차원 평면 정보를 3차원으로 업그레이드하려면 추가적인 차원, 즉 3차원 기하학적 자율 주행 작업에 적합한 깊이가 필요합니다. 특징 표현을 더욱 향상시키려면 대부분의 장면이 비디오 소스를 사용하므로 시간 정보를 프레임워크에 통합하는 것이 당연합니다.
그림에 설명된 대로ST-P3전체 프레임워크: 구체적으로 주변 카메라 비디오 세트가 주어지면 이를 백본에 입력하여 예비 전면 뷰 기능을 생성합니다. 2D 기능을 3D 공간으로 변환하기 위해 보조 깊이 추정을 수행합니다. 자체 중심 정렬 누적 방식은 먼저 과거 피처를 현재 뷰 좌표계에 정렬합니다. 그런 다음 현재 및 과거 기능을 3차원 공간에 집계하여 BEV 표현으로 변환하기 전에 기하학적 정보를 보존합니다. 일반적으로 사용되는 예측시간 영역 모델에 더해 과거 동작 변화를 설명하는 두 번째 경로를 구성하여 성능을 더욱 향상시킵니다. 이 이중 경로 모델링은 향후 의미론적 결과를 추론할 수 있는 강력한 기능 표현을 보장합니다. 궤적 계획이라는 궁극적인 목표를 달성하기 위해 네트워크에 대한 초기 기능 사전 지식이 통합됩니다. HD 맵이 없는 경우 고급 명령을 사용하여 최종 궤적을 생성하도록 개선 모듈이 설계되었습니다.
지각의 자기중심적 정렬 축적 방법이 있습니다. (a) 깊이 추정을 활용하여 현재 타임스탬프의 특징을 3D로 올리고 정렬 후 BEV 특징으로 병합합니다. (b-c) 이전 프레임의 3D 특징을 현재 프레임 뷰와 정렬하고 모든 과거 및 현재 상태와 융합합니다. 기능 표현 향상.
예측을 위한 양방향 모델이 있습니다. (i) 잠재 코드는 특성 맵의 분포입니다. (ii iii) a는 불확실성 분포를 결합하여 미래 다중을 나타냅니다. -양식, 그리고 경로 b는 과거 변화로부터 학습하여 경로 a의 정보를 보완하는 데 도움이 됩니다.
계획에 대한 사전 지식의 통합 및 개선입니다. 전체 비용 다이어그램에는 두 가지 하위 비용이 포함됩니다. 카메라 입력에서 비전 기반 정보를 집계하는 미래 지향적 기능을 사용하여 최소 비용 궤적을 더욱 재정의합니다.
위 내용은 ST-P3: 자율주행을 위한 엔드투엔드 시공간 특징 학습 비전 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

Microsoft Power BI 차트로 데이터 시각화의 힘을 활용 오늘날의 데이터 중심 세계에서는 복잡한 정보를 비 기술적 인 청중에게 효과적으로 전달하는 것이 중요합니다. 데이터 시각화는이 차이를 연결하여 원시 데이터를 변환합니다. i

전문가 시스템 : AI의 의사 결정 능력에 대한 깊은 다이빙 의료 진단에서 재무 계획에 이르기까지 모든 것에 대한 전문가의 조언에 접근 할 수 있다고 상상해보십시오. 그것이 인공 지능 분야의 전문가 시스템의 힘입니다. 이 시스템은 프로를 모방합니다

우선, 이것이 빠르게 일어나고 있음이 분명합니다. 다양한 회사들이 현재 AI가 작성한 코드의 비율에 대해 이야기하고 있으며 빠른 클립에서 증가하고 있습니다. 이미 주변에 많은 작업 변위가 있습니다

디지털 마케팅에서 소셜 미디어에 이르기까지 모든 창의적 부문과 함께 영화 산업은 기술 교차로에 있습니다. 인공 지능이 시각적 스토리 텔링의 모든 측면을 재구성하고 엔터테인먼트의 풍경을 바꾸기 시작함에 따라

ISRO의 무료 AI/ML 온라인 코스 : 지리 공간 기술 혁신의 관문 IIRS (Indian Institute of Remote Sensing)를 통해 Indian Space Research Organization (ISRO)은 학생과 전문가에게 환상적인 기회를 제공하고 있습니다.

로컬 검색 알고리즘 : 포괄적 인 가이드 대규모 이벤트를 계획하려면 효율적인 작업량 배포가 필요합니다. 전통적인 접근 방식이 실패하면 로컬 검색 알고리즘은 강력한 솔루션을 제공합니다. 이 기사는 언덕 등반과 Simul을 탐구합니다

릴리스에는 GPT-4.1, GPT-4.1 MINI 및 GPT-4.1 NANO의 세 가지 모델이 포함되어 있으며, 대형 언어 모델 환경 내에서 작업 별 최적화로 이동합니다. 이 모델은 사용자를 향한 인터페이스를 즉시 대체하지 않습니다

Chip Giant Nvidia는 월요일에 AI SuperComputers를 제조하기 시작할 것이라고 말했다. 이 발표는 트럼프 SI 대통령 이후에 나온다


핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

VSCode Windows 64비트 다운로드
Microsoft에서 출시한 강력한 무료 IDE 편집기

DVWA
DVWA(Damn Vulnerable Web App)는 매우 취약한 PHP/MySQL 웹 애플리케이션입니다. 주요 목표는 보안 전문가가 법적 환경에서 자신의 기술과 도구를 테스트하고, 웹 개발자가 웹 응용 프로그램 보안 프로세스를 더 잘 이해할 수 있도록 돕고, 교사/학생이 교실 환경 웹 응용 프로그램에서 가르치고 배울 수 있도록 돕는 것입니다. 보안. DVWA의 목표는 다양한 난이도의 간단하고 간단한 인터페이스를 통해 가장 일반적인 웹 취약점 중 일부를 연습하는 것입니다. 이 소프트웨어는

SublimeText3 Linux 새 버전
SublimeText3 Linux 최신 버전

드림위버 CS6
시각적 웹 개발 도구

맨티스BT
Mantis는 제품 결함 추적을 돕기 위해 설계된 배포하기 쉬운 웹 기반 결함 추적 도구입니다. PHP, MySQL 및 웹 서버가 필요합니다. 데모 및 호스팅 서비스를 확인해 보세요.
