ST-P3: 자율주행을 위한 엔드투엔드 시공간 특징 학습 비전 방법-일체 포함-php.cn

집

기술 주변기기

일체 포함

ST-P3: 자율주행을 위한 엔드투엔드 시공간 특징 학습 비전 방법

王林

Apr 09, 2023 pm 06:11 PM

기술자율주행

arXiv 논문 "ST-P3: 공간-시간적 특징 학습을 통한 엔드 투 엔드 비전 기반 자율 주행", 7월 22일, Shanghai Jiao Tong University, Shanghai AI Laboratory, University of California San Diego 및 JD의 베이징 연구 저자 .com 병원.

ST-P3: 자율주행을 위한 엔드투엔드 시공간 특징 학습 비전 방법

ST-P3라고 하는 인식, 예측 및 계획 작업을 위한 보다 대표적인 기능 세트를 동시에 제공할 수 있는 시공간 기능 학습 방식을 제안합니다. 구체적으로, BEV 변환을 감지하기 전에 3차원 공간에 기하학적 정보를 유지하기 위한 자기 중심 정렬 축적 기술이 제안되었습니다. 저자는 미래 예측을 위해 과거 모션 변화를 고려하는 이중 경로 모델을 설계합니다. 계획된 시각적 요소 인식을 보완하기 위해 개선 단위가 도입되었습니다. 소스 코드, 모델 및 프로토콜 세부 사항 오픈 소스 https://github.com/OpenPercepti onX/ST-P3 .

깊이를 통해 다시점 카메라에서 원근 특징을 추출하는 선구적인 LSS 방법입니다. 3D로 업그레이드되어 BEV 공간에 통합될 것으로 추정됩니다. 잠재 깊이 예측이 중요한 두 뷰 간의 기능 변환.

2차원 평면 정보를 3차원으로 업그레이드하려면 추가적인 차원, 즉 3차원 기하학적 자율 주행 작업에 적합한 깊이가 필요합니다. 특징 표현을 더욱 향상시키려면 대부분의 장면이 비디오 소스를 사용하므로 시간 정보를 프레임워크에 통합하는 것이 당연합니다.

그림에 설명된 대로ST-P3전체 프레임워크: 구체적으로 주변 카메라 비디오 세트가 주어지면 이를 백본에 입력하여 예비 전면 뷰 기능을 생성합니다. 2D 기능을 3D 공간으로 변환하기 위해 보조 깊이 추정을 수행합니다. 자체 중심 정렬 누적 방식은 먼저 과거 피처를 현재 뷰 좌표계에 정렬합니다. 그런 다음 현재 및 과거 기능을 3차원 공간에 집계하여 BEV 표현으로 변환하기 전에 기하학적 정보를 보존합니다. 일반적으로 사용되는 예측시간 영역 모델에 더해 과거 동작 변화를 설명하는 두 번째 경로를 구성하여 성능을 더욱 향상시킵니다. 이 이중 경로 모델링은 향후 의미론적 결과를 추론할 수 있는 강력한 기능 표현을 보장합니다. 궤적 계획이라는 궁극적인 목표를 달성하기 위해 네트워크에 대한 초기 기능 사전 지식이 통합됩니다. HD 맵이 없는 경우 고급 명령을 사용하여 최종 궤적을 생성하도록 개선 모듈이 설계되었습니다.

ST-P3: 자율주행을 위한 엔드투엔드 시공간 특징 학습 비전 방법

그림에 보이는 것과 같이

지각의 자기중심적 정렬 축적 방법이 있습니다. (a) 깊이 추정을 활용하여 현재 타임스탬프의 특징을 3D로 올리고 정렬 후 BEV 특징으로 병합합니다. (b-c) 이전 프레임의 3D 특징을 현재 프레임 뷰와 정렬하고 모든 과거 및 현재 상태와 융합합니다. 기능 표현 향상.

ST-P3: 자율주행을 위한 엔드투엔드 시공간 특징 학습 비전 방법

그림에 표시된 대로

예측을 위한 양방향 모델이 있습니다. (i) 잠재 코드는 특성 맵의 분포입니다. (ii iii) a는 불확실성 분포를 결합하여 미래 다중을 나타냅니다. -양식, 그리고 경로 b는 과거 변화로부터 학습하여 경로 a의 정보를 보완하는 데 도움이 됩니다.

ST-P3: 자율주행을 위한 엔드투엔드 시공간 특징 학습 비전 방법

최종 목표로는 목표 지점에 도달하기 위해 안전하고 편안한 궤적을 계획해야 합니다. 이 모션 플래너는 다양한 궤적 세트를 샘플링하고 학습된 비용 함수를 최소화하는 궤적을 선택합니다. 그러나 시간 영역 모델을 통해 대상 지점과 신호등의 정보를 통합하면 추가적인 최적화 단계가 추가됩니다.

그림에 표시된 것처럼

계획에 대한 사전 지식의 통합 및 개선입니다. 전체 비용 다이어그램에는 두 가지 하위 비용이 포함됩니다. 카메라 입력에서 비전 기반 정보를 집계하는 미래 지향적 기능을 사용하여 최소 비용 궤적을 더욱 재정의합니다.

ST-P3: 자율주행을 위한 엔드투엔드 시공간 특징 학습 비전 방법

큰 측면 가속도, 저크 또는 곡률로 궤적에 페널티를 적용합니다. 바라건대, 이 궤도가 목적지에 효율적으로 도달하여 앞으로의 진전이 보상을 받을 것입니다. 다만, 위의 비용 항목에는 일반적으로 노선도에서 제공하는 대상 정보가 포함되어 있지 않습니다. 전진, 좌회전, 우회전 등의 고급 명령을 사용하고 해당 명령에 따라서만 궤적을 평가합니다.

또한 신호등은 SDV가 GRU 네트워크를 통해 궤적을 최적화하는 데 매우 중요합니다. 은닉 상태는 인코더 모듈의 전면 카메라 기능으로 초기화되며 비용 항의 각 샘플 포인트가 입력으로 사용됩니다.

실험 결과는 다음과 같습니다.

ST-P3: 자율주행을 위한 엔드투엔드 시공간 특징 학습 비전 방법

위 내용은 ST-P3: 자율주행을 위한 엔드투엔드 시공간 특징 학습 비전 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

이 기사는 51CTO.COM에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제

관련 기사

가장 많이 사용되는 10 개의 Power BI 차트 -Axaltics VidhyaApr 16, 2025 pm 12:05 PM

Microsoft Power BI 차트로 데이터 시각화의 힘을 활용 오늘날의 데이터 중심 세계에서는 복잡한 정보를 비 기술적 인 청중에게 효과적으로 전달하는 것이 중요합니다. 데이터 시각화는이 차이를 연결하여 원시 데이터를 변환합니다. i

AI의 전문가 시스템Apr 16, 2025 pm 12:00 PM

전문가 시스템 : AI의 의사 결정 능력에 대한 깊은 다이빙 의료 진단에서 재무 계획에 이르기까지 모든 것에 대한 전문가의 조언에 접근 할 수 있다고 상상해보십시오. 그것이 인공 지능 분야의 전문가 시스템의 힘입니다. 이 시스템은 프로를 모방합니다

최고의 바이브 코더 3 명이 코드 에서이 AI 혁명을 분해합니다.Apr 16, 2025 am 11:58 AM

우선, 이것이 빠르게 일어나고 있음이 분명합니다. 다양한 회사들이 현재 AI가 작성한 코드의 비율에 대해 이야기하고 있으며 빠른 클립에서 증가하고 있습니다. 이미 주변에 많은 작업 변위가 있습니다

활주로 AI의 GEN-4 : AI Montage는 어떻게 부조리를 넘어갈 수 있습니까?Apr 16, 2025 am 11:45 AM

디지털 마케팅에서 소셜 미디어에 이르기까지 모든 창의적 부문과 함께 영화 산업은 기술 교차로에 있습니다. 인공 지능이 시각적 스토리 텔링의 모든 측면을 재구성하고 엔터테인먼트의 풍경을 바꾸기 시작함에 따라

ISRO AI 무료 코스 5 일 동안 등록하는 방법은 무엇입니까? - 분석 VidhyaApr 16, 2025 am 11:43 AM

ISRO의 무료 AI/ML 온라인 코스 : 지리 공간 기술 혁신의 관문 IIRS (Indian Institute of Remote Sensing)를 통해 Indian Space Research Organization (ISRO)은 학생과 전문가에게 환상적인 기회를 제공하고 있습니다.

AI의 로컬 검색 알고리즘Apr 16, 2025 am 11:40 AM

로컬 검색 알고리즘 : 포괄적 인 가이드 대규모 이벤트를 계획하려면 효율적인 작업량 배포가 필요합니다. 전통적인 접근 방식이 실패하면 로컬 검색 알고리즘은 강력한 솔루션을 제공합니다. 이 기사는 언덕 등반과 Simul을 탐구합니다

Openai는 GPT-4.1로 초점을 이동하고 코딩 및 비용 효율성을 우선시합니다.Apr 16, 2025 am 11:37 AM

릴리스에는 GPT-4.1, GPT-4.1 MINI 및 GPT-4.1 NANO의 세 가지 모델이 포함되어 있으며, 대형 언어 모델 환경 내에서 작업 별 최적화로 이동합니다. 이 모델은 사용자를 향한 인터페이스를 즉시 대체하지 않습니다

프롬프트 : Chatgpt는 가짜 여권을 생성합니다Apr 16, 2025 am 11:35 AM

Chip Giant Nvidia는 월요일에 AI SuperComputers를 제조하기 시작할 것이라고 말했다. 이 발표는 트럼프 SI 대통령 이후에 나온다

See all articles

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

VSCode Windows 64비트 다운로드

Microsoft에서 출시한 강력한 무료 IDE 편집기

DVWA

DVWA(Damn Vulnerable Web App)는 매우 취약한 PHP/MySQL 웹 애플리케이션입니다. 주요 목표는 보안 전문가가 법적 환경에서 자신의 기술과 도구를 테스트하고, 웹 개발자가 웹 응용 프로그램 보안 프로세스를 더 잘 이해할 수 있도록 돕고, 교사/학생이 교실 환경 웹 응용 프로그램에서 가르치고 배울 수 있도록 돕는 것입니다. 보안. DVWA의 목표는 다양한 난이도의 간단하고 간단한 인터페이스를 통해 가장 일반적인 웹 취약점 중 일부를 연습하는 것입니다. 이 소프트웨어는