Berkeley는 주차 시나리오에서 최초의 고화질 데이터 세트 및 예측 모델을 오픈 소스화하여 목표 인식 및 궤적 예측을 지원합니다.-일체 포함-php.cn

집

기술 주변기기

일체 포함

Berkeley는 주차 시나리오에서 최초의 고화질 데이터 세트 및 예측 모델을 오픈 소스화하여 목표 인식 및 궤적 예측을 지원합니다.

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 12, 2023 pm 11:40 PM

데이터오픈 소스

자율주행 기술이 계속해서 반복되면서 차량의 거동과 궤도 예측은 효율적이고 안전한 운전을 위해 매우 중요한 의미를 갖습니다. 동적 모델 추론, 접근성 분석과 같은 전통적인 궤적 예측 방법은 명확한 형태와 강력한 해석 가능성의 장점을 가지고 있지만, 환경과 객체 간의 상호 작용에 대한 모델링 능력은 복잡한 교통 환경에서 상대적으로 제한됩니다. 따라서 최근에는 다양한 딥러닝 기법(LSTM, CNN, Transformer, GNN 등)과 BDD100K, nuScenes, Stanford Drone, ETH 등 다양한 데이터셋을 기반으로 한 많은 연구와 응용이 이루어지고 있다. /UCY, INTERACTION, ApolloScape 등도 등장하여 심층 신경망 모델을 훈련하고 평가하는 데 강력한 지원을 제공합니다. GroupNet, Trajectron++, MultiPath 등과 같은 많은 SOTA 모델이 좋은 성능을 보여주었습니다.

위의 모델과 데이터 세트는 일반적인 도로 주행 시나리오에 집중되어 있으며, 교통 규제, 이동 패턴의 한계로 인해 차선 및 신호등과 같은 인프라와 기능을 최대한 활용합니다. 대부분의 차량도 더 명확합니다. 그러나 자율 주행의 "라스트 마일"인 자율 주차 시나리오에서 우리는 많은 새로운 어려움에 직면하게 될 것입니다.

주차장의 교통 규칙 및 차선 요구 사항이 엄격하지 않으며 차량이 마음대로 자주 운전합니다. 그리고 "지름길 잡기"
주차 작업을 완료하려면 차량이 잦은 후진, 주차, 조향 등을 포함하여 더욱 복잡한 주차 작업을 완료해야 합니다. 초보 운전자의 경우 주차 시간이 길어질 수 있습니다
주차장에는 장애물과 혼잡함이 많고, 차량 간 거리가 가까워 조금만 부주의하면 충돌 및 긁힘이 발생할 수 있습니다
주차 보행자는 마음대로 행사장을 통과하는 경우가 많으며 차량에는 더 많은 회피 조치가 필요합니다
이러한 시나리오에서는 단순히 기존 궤적 예측 모델을 적용하여 원하는 효과를 얻기 어렵고 재훈련 모델은 해당 데이터의 지원이 부족합니다. . CNRPark+EXT 및 CARPK와 같은 현재 주차 장면 기반 데이터 세트는 무료 주차 공간 감지용으로만 설계되었습니다. 사진은 감시 카메라의 1인칭 시점에서 나온 것이며 샘플링 속도가 낮고 폐색이 많아 주차 공간 감지가 불가능합니다. 궤적 예측에 사용됩니다.

2022년 10월에 막 종료된 제25회 지능형 교통 시스템에 관한 IEEE 국제 회의(IEEE ITSC 2022)에서 캘리포니아 대학교 버클리 연구진이 주차 장면과 관련된 최초의 고화질 영상을 공개했습니다. 궤적 데이터 세트를 기반으로 CNN과 Transformer 아키텍처를 사용하여 "ParkPredict+"라는 궤적 예측 모델을 제안했습니다.

Berkeley는 주차 시나리오에서 최초의 고화질 데이터 세트 및 예측 모델을 오픈 소스화하여 목표 인식 및 궤적 예측을 지원합니다.

문서 링크: https://arxiv.org/abs/2204.10777
데이터 세트 홈 페이지, 평가판 및 다운로드 애플리케이션: https://sites.google.com /berkeley.edu/dlp-dataset (액세스할 수 없는 경우 대체 페이지 https://www.php.cn/link/966eaa9527eb956f0dc8788132986707을 시도할 수 있습니다.)
Dataset Python API: https://github. com/MPC-Berkeley/dlp-dataset

데이터 세트 정보

데이터 세트는 드론으로 수집되었으며 총 지속 시간은 3.5시간, 비디오 해상도는 4K, 샘플링 속도는 25Hz입니다. 전망은 약 140m x 80m의 주차장 면적과 총 약 400개의 주차 공간을 포함합니다. 데이터 세트에는 정확하게 주석이 추가되었으며 총 1216대의 자동차, 3904대의 자전거, 3904개의 보행자 궤적이 수집되었습니다.

재처리 후 궤도 데이터를 JSON 형식으로 읽을 수 있으며 연결 그래프(Graph)의 데이터 구조에 로드할 수 있습니다.

개별(Agent): 각 에이전트(Agent)는 현재 장면(Scene)에서 움직이는 객체로, 기하학적 형태, 유형 등의 속성을 가지며, 그 이동 궤적은 인스턴스(Instance)로 저장됩니다. (연결된 목록)
인스턴스: 각 인스턴스는 위치, 회전 각도, 속도 및 가속도를 포함하여 프레임(Frame) 내 개인(에이전트)의 상태입니다. 각 인스턴스에는 이전 프레임과 다음 프레임에 있는 개인의 인스턴스에 대한 포인터가 포함되어 있습니다.
프레임(프레임): 각 프레임(프레임)은 현재 시간(인스턴스)에 표시되는 모든 인스턴스를 포함하는 샘플링 지점입니다. 그리고 이전 프레임과 다음 프레임을 가리키는 포인터
Obstacle(장애물): 장애물은 각 개체의 위치, 모서리 및 기하학적 크기를 포함하여 이 기록에서 전혀 움직이지 않은 개체입니다.
Scene: 각 장면(Scene)은 녹화의 첫 번째 프레임과 마지막 프레임, 모든 개인(에이전트) 및 모든 장애물(장애물)을 가리키는 포인터를 포함하는 녹화된 비디오 파일에 해당합니다.

Berkeley는 주차 시나리오에서 최초의 고화질 데이터 세트 및 예측 모델을 오픈 소스화하여 목표 인식 및 궤적 예측을 지원합니다.

데이터 세트를 사용할 수 있습니다. 두 가지 다운로드 형식:

JSON 전용(권장) : JSON 파일에는 모든 개인의 유형, 형태, 궤적 및 기타 정보가 포함되어 있으며 오픈 소스 Python을 통해 다운로드할 수 있습니다. API가 직접 읽습니다. , 미리보기 및 의미론적 이미지(Semantic Images)를 생성합니다. 연구 목표가 단지 궤적과 행동 예측이라면 JSON 형식은 모든 요구를 충족할 수 있습니다.

Berkeley는 주차 시나리오에서 최초의 고화질 데이터 세트 및 예측 모델을 오픈 소스화하여 목표 인식 및 궤적 예측을 지원합니다.

원본 영상 및 주석: 연구가 카메라의 원시 이미지(Raw Image)를 기반으로 표적 탐지, 분리, 추적 등 머신 비전 분야 주제를 기반으로 하는 경우, 그런 다음 원본 비디오와 라벨을 다운로드해야 할 수도 있습니다. 이것이 필요한 경우 데이터세트 애플리케이션에 연구 내용을 명확하게 설명해야 합니다. 또한 주석 파일은 자체적으로 구문 분석되어야 합니다.

행동 및 궤적 예측 모델: ParkPredict+

적용 사례로 연구팀은 IEEE ITSC 2022에서 "ParkPredict+: Multimodal Intent and Motion Prediction for Vehicles in Parking Lots with CNN and Transformer" 논문에서 이 데이터를 활용했습니다. CNN과 Transformer 아키텍처를 기반으로 주차장 장면에서 차량의 의도(Intent)와 궤적(Trajectory) 예측을 구현합니다.

Berkeley는 주차 시나리오에서 최초의 고화질 데이터 세트 및 예측 모델을 오픈 소스화하여 목표 인식 및 궤적 예측을 지원합니다.

팀은 CNN 모델을 활용해 의미론적 이미지 구축을 통해 차량 의도(Intent)의 분포 확률을 예측했습니다. 이 모델은 차량의 로컬 환경 정보만 구성하면 되며, 현재 환경에 따라 사용 가능한 의도의 수를 지속적으로 변경할 수 있습니다.

Berkeley는 주차 시나리오에서 최초의 고화질 데이터 세트 및 예측 모델을 오픈 소스화하여 목표 인식 및 궤적 예측을 지원합니다.

팀은 Transformer 모델을 개선하고 다중 모드 의도 및 행동 예측을 달성하기 위한 입력으로 의도 예측 결과, 차량의 이동 이력 및 주변 환경의 의미 지도를 제공했습니다.

Berkeley는 주차 시나리오에서 최초의 고화질 데이터 세트 및 예측 모델을 오픈 소스화하여 목표 인식 및 궤적 예측을 지원합니다.

요약

주차 시나리오를 위한 최초의 고정밀 데이터 세트인 DLP(Dragon Lake Parking) 데이터 세트는 이 분야에서 대규모 대상 인식 및 추적, 무료 주차 공간 감지, 차량 및 보행자 행동 및 궤적을 지원할 수 있습니다. 시나리오 예측, 모방 학습 및 기타 연구를 위한 데이터 및 API 지원이 제공됩니다.
CNN 및 Transformer 아키텍처를 사용하여 ParkPredict+ 모델은 주차 시나리오에서 행동 및 궤적 예측에 우수한 기능을 보여줍니다.
드래곤 레이크 주차장(DLP) 데이터세트는 시험 및 적용을 위해 열려 있습니다. 데이터세트 홈페이지 https://sites.google.com/berkeley.edu/dlp-dataset를 방문하여 자세히 알아볼 수 있습니다(액세스할 수 없는 경우 대체 페이지를 사용해 볼 수 있습니다 https://www.php.cn/link/966eaa9527eb956f0dc8788132986707)

위 내용은 Berkeley는 주차 시나리오에서 최초의 고화질 데이터 세트 및 예측 모델을 오픈 소스화하여 목표 인식 및 궤적 예측을 지원합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

이 기사는 51CTO.COM에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제

관련 기사

신속한 엔지니어링에서 생각의 그래프는 무엇입니까?Apr 13, 2025 am 11:53 AM

소개 신속한 엔지니어링에서 "Thought of Thought"는 그래프 이론을 사용하여 AI의 추론 과정을 구성하고 안내하는 새로운 접근법을 나타냅니다. 종종 선형 S와 관련된 전통적인 방법과 달리

Genai 에이전트와 함께 조직의 이메일 마케팅을 최적화하십시오Apr 13, 2025 am 11:44 AM

소개 축하해요! 당신은 성공적인 사업을 운영합니다. 웹 페이지, 소셜 미디어 캠페인, 웹 세미나, 컨퍼런스, 무료 리소스 및 기타 소스를 통해 매일 5000 개의 이메일 ID를 수집합니다. 다음 명백한 단계는입니다

Apache Pinot을 사용한 실시간 앱 성능 모니터링Apr 13, 2025 am 11:40 AM

소개 오늘날의 빠르게 진행되는 소프트웨어 개발 환경에서 최적의 애플리케이션 성능이 중요합니다. 응답 시간, 오류율 및 자원 활용과 같은 실시간 메트릭 모니터링 메인이 도움이 될 수 있습니다.

Chatgpt가 10 억 명의 사용자를 쳤습니까? Openai CEO는'몇 주 만에 두 배가되었습니다Apr 13, 2025 am 11:23 AM

"얼마나 많은 사용자가 있습니까?" 그는 자극했다. Altman은“마지막으로 우리가 마지막으로 말한 것은 매주 5 억 명의 행위자이며 매우 빠르게 성장하고 있다고 생각합니다. 앤더슨은 계속해서“당신은 나에게 몇 주 만에 두 배가되었다고 말했습니다. “저는 그 개인이라고 말했습니다

Pixtral -12B : Mistral AI의 첫 번째 멀티 모드 모델 -Anuctics VidhyaApr 13, 2025 am 11:20 AM

소개 Mistral은 최초의 멀티 모드 모델, 즉 Pixtral-12B-2409를 발표했습니다. 이 모델은 Mistral의 120 억 개의 매개 변수 인 NEMO 12B를 기반으로합니다. 이 모델을 차별화하는 것은 무엇입니까? 이제 이미지와 Tex를 모두 가져갈 수 있습니다