>  기사  >  기술 주변기기  >  자율주행 의사결정 기술에 대한 자세한 설명

자율주행 의사결정 기술에 대한 자세한 설명

WBOY
WBOY앞으로
2023-04-04 14:35:031601검색

심층 강화 학습 기술의 급속한 발전으로 인해 점점 더 많은 연구팀이 이를 자율 주행 의사 결정 계획에 적용하고 행동 의사 결정 및 동작 계획 모듈을 통합하여 운전 궤적을 직접 학습하기 시작했습니다.

자율주행의 의사결정 계획 모듈은 자율주행 능력을 측정하고 평가하는 핵심 지표 중 하나이며, 센서로부터 다양한 감각 정보를 받아 현재 환경을 분석하고, 그 기반이 되는 제어 모듈을 제어하는 ​​것이 주요 업무입니다. 지침. 일반적인 의사 결정 계획 모듈은 전역 경로 계획, 행동 의사 결정 및 동작 계획의 세 가지 수준으로 나눌 수 있습니다.

01 소개

완전한 자율주행 시스템에서 인지 모듈을 인간의 눈과 귀에 비유한다면 의사결정 계획은 자율주행의 두뇌입니다. 뇌는 센서로부터 다양한 감각 정보를 받은 후 현재 환경을 분석한 후 기본 제어 모듈에 명령을 내립니다. 이 프로세스는 의사 결정 및 계획 모듈의 주요 작업입니다. 동시에 의사결정 계획 모듈이 얼마나 복잡한 시나리오를 처리할 수 있는지도 자율주행 능력을 측정하고 평가하는 핵심 지표 중 하나입니다[1].

자율주행 의사결정 기술에 대한 자세한 설명

그림 1. [2]에서 인용한 자율주행 시스템의 의사결정 계획 모듈의 계층적 구조

그림 1과 같이 일반적인 의사결정 계획 모듈은 세 가지 수준으로 나눌 수 있습니다. .

그 중, 글로벌 경로 계획(Route Planning)은 특정 주행 목적지를 수신한 후 지도 정보를 결합하여 후속 특정 경로 계획을 위한 참조로 글로벌 경로를 생성합니다.

Behavioral Layer) 글로벌 경로를 수신한 후 결합합니다. 특정 행동 결정(예: 추월하거나 추월하기 위해 차선 변경 선택)을 내리기 위해 인식 모듈(다른 차량 및 보행자, 장애물 및 도로의 교통 규칙 정보 포함)에서 얻은 환경 정보; 레이어는 특정 행동 결정을 기반으로 특정 제약 조건(예: 차량 자체의 동적 제약 조건, 충돌 회피, 승객 편의성 등)을 충족하는 궤적을 생성할 계획입니다. 이 궤적은 제어 모듈의 입력으로 차량의 최종 이동 경로를 결정합니다.

이 글에서는 각 계층의 주요 기능과 공통 알고리즘을 각각 소개하고, 다양한 알고리즘과 적용 가능한 시나리오의 장단점을 비교해 보겠습니다.

02 전역 경로 계획(Route Planning)

전역 경로 계획은 차량의 현재 위치와 최종 목표를 고려하여 검색을 통해 최적의 경로를 선택하는 것을 말합니다. 여기서 "최적"에는 최단 경로 또는 도착 시간이 포함됩니다. 가장 빠르고 다른 조건. 이 과정은 우리가 생활에서 자주 사용하는 '내비게이션' 기능과 유사하지만, 자율주행에 사용되는 고정밀 지도는 우리가 흔히 사용하는 지도와는 다르다. 정보. 일반적인 전역 경로 계획 알고리즘에는 Dijkstra 및 A 알고리즘뿐만 아니라 이 두 알고리즘을 기반으로 한 다양한 개선 사항이 포함됩니다. Dijkstra 알고리즘[3]과 A* 알고리즘[4]도 많은 계획 문제에서 가장 널리 사용되는 두 가지 검색 알고리즘입니다.

자율주행 의사결정 기술에 대한 자세한 설명그림 2. 전역 경로 계획의 도식

1. Dijkstra 알고리즘

Dijkstra 알고리즘은 1956년 컴퓨터 과학자 Edsger W. Dijkstra가 그래프에서 노드 사이의 최단 경로를 찾기 위해 제안했습니다. Dijkstra 알고리즘에서는 시작점부터 각 노드의 총 이동 비용을 계산해야 합니다. 동시에 우선순위 큐 구조도 필요합니다. 통과할 모든 노드는 우선 순위 대기열에 배치될 때 비용에 따라 정렬됩니다. 알고리즘을 실행하는 동안 비용이 가장 작은 노드는 매번 우선 순위 대기열에서 다음 통과 노드로 선택됩니다. 끝에 도달할 때까지.

Dijkstra 알고리즘의 장점은 주어진 경로가 최적이라는 것입니다. 단점은 명확한 방향 없이 주변을 탐색하기 때문에 계산 시간 복잡도가 상대적으로 높다는 것입니다(O(N2)).

2. A* 알고리즘

다익스트라 알고리즘의 검색 효율성 문제를 해결하기 위해 1968년 스탠포드 연구소의 Peter Hart, Nils Nilsson 및 Bertram Raphael이 알고리즘 A를 발표했습니다. 검색 프로세스를 안내하는 경험적 기능입니다. 특히 알고리즘 A는 다음 함수를 통해 각 노드의 우선순위를 계산합니다.

f(n)=g(n)+h(n)

여기서:

  • f(n)은 노드 n의 포괄적 우선순위입니다. 통과할 다음 노드를 선택할 때 항상 전체 우선순위(최소값)가 가장 높은 노드를 선택합니다.
  • g(n)은 시작점에서 노드 n의 비용입니다.
  • h(n)은 A* 알고리즘의 휴리스틱 함수인 끝점에서 노드 n의 예상 비용입니다.

03 행동 계층

전체 경로를 결정한 후 자율주행차는 특정 도로 상황, 교통 규칙, 기타 차량 및 보행자를 기반으로 적절한 행동 결정을 내려야 합니다.

이 과정은 세 가지 주요 문제에 직면합니다.

첫째, 실제 운전 장면은 끊임없이 변화하는데, 이를 어떻게 처리할 것인가?

둘째, 실제 운전 장면은 다중 에이전트 의사 결정 환경입니다. 주 차량을 포함한 각 참가자의 행동은 환경 내 다른 참가자에게 영향을 미치게 됩니다.

결국 자율주행차가 환경 정보를 100% 인식하는 것은 불가능합니다. 예를 들어 장애물에 의해 막히는 등 위험한 상황이 많이 발생할 수 있습니다.

위 내용을 바탕으로 자율주행 행동 의사결정 레이어에서 우리가 해결해야 할 것은 다중 에이전트 의사결정의 복잡한 환경에서 인지적 불확실성에 대한 계획 문제입니다. 이 문제는 L4, L5 수준의 자율주행 기술을 실제로 구현하는 데 있어 핵심적인 병목 현상 중 하나라고 할 수 있습니다. 최근에는 심층 강화 학습 및 기타 분야의 급속한 발전으로 이를 해결하기 위한 새로운 아이디어와 새벽이 생겨났습니다. 문제.

행동 의사결정 계층의 모델은 4가지 범주로 나누어지며 아래에 소개됩니다[5]:

1. 유한 상태 기계 모델

자율 차량의 초기 의사 결정 모델은 유한 상태 기계입니다. 모델[6]은 주차, 차선 변경, 추월, 회피, 저속 운전 등과 같은 현재 환경에서 적절한 운전 행동을 선택합니다. 상태 머신 모델은 다양한 운전 상태와 상태 간의 전달 관계를 설명합니다. 제한된 방향성 연결 그래프를 구성하여 운전 상태의 전환에 따라 반응적으로 운전 동작을 생성합니다.

유한 상태 기계 모델은 단순성과 구현 용이성으로 인해 현재 자율 주행 분야에서 가장 널리 사용되는 행동 의사 결정 모델입니다. 그러나 이러한 유형의 모델은 환경의 역동성과 불확실성을 무시합니다. 운전 장면에 기능이 많은 경우 상태 분할 및 관리가 상대적으로 번거롭고 대부분 간단한 시나리오에 적합하며 구조적 기능이 풍부한 도시 도로 환경에서는 행동 의사 결정 작업을 수행하기 어렵습니다.

2. 의사결정 트리 모델

의사결정/행동 트리 모델[7]은 현재 운전 상태의 속성 값을 통해 반응적으로 다양한 운전 동작을 선택합니다. 차이점은 이러한 유형의 모델이 주행 상태와 제어 로직이 트리 구조로 굳어지고 주행 전략 검색이 하향식 "폴링" 메커니즘을 통해 수행된다는 것입니다. 이러한 유형의 의사 결정 모델에는 시각적 제어 논리가 있으며 제어 노드를 재사용할 수 있지만 각 운전 시나리오에 대해 의사 결정 네트워크를 오프라인으로 정의해야 합니다. 더 복잡해지세요. 또한 이러한 모델은 교통환경에 존재하는 불확실성 요인도 고려하지 못한다.

3. 지식 기반 추론 및 의사 결정 모델

지식 기반 추론 및 의사 결정 모델은 "장면 특성-운전 행동"의 매핑 관계를 통해 인간 운전자의 행동 의사 결정 과정을 모방합니다. 이러한 유형의 모델은 지식에 운전 지식을 저장합니다. 라이브러리나 신경망에서 여기의 운전 지식은 주로 운전 행동에 대한 규칙, 사례 또는 장면 특징 간의 매핑 관계로 표현됩니다. 그런 다음 "쿼리" 메커니즘을 통해 지식 기반이나 훈련된 네트워크 구조로부터 추진 작업이 추론됩니다.

이 유형의 모델에는 주로 규칙 기반 추론 시스템[8], 사례 기반 추론 시스템[9] 및 신경망 기반 매핑 모델[10]이 포함됩니다.

이러한 유형의 모델은 사전 운전 지식 및 훈련 데이터에 크게 의존하며 운전 지식의 세심한 구성, 관리 및 업데이트가 필요합니다. 신경망 기반 매핑 모델은 데이터 주석 및 지식 통합 프로세스를 저장할 수 있지만, 여전히 다음과 같은 단점이 있습니다.

  • "데이터" 기반 메커니즘으로 인해 훈련 ​​데이터에 대한 의존도가 높아지고 훈련 데이터가 충분해야 합니다. [11]
  • 매핑 관계가 네트워크 구조로 굳어지고 해석 가능성이 높아집니다. 열악 ;
  • '블랙박스' 문제가 있고, 투명성이 낮고, 실제 시스템에서 발생하는 문제에 대한 추적성이 좋지 않아 문제의 근본 원인을 찾기가 어렵습니다.

4. 가치 기반 의사 결정 모델

최대 효용 이론에 따르면 효용/가치 기반 의사 결정 모델의 기본 아이디어는 여러 가지 중에서 최적의 운전 전략/행동을 선택하는 것입니다. 선택 기준에 따른 대안[ 12].

각 운전 행동의 품질을 평가하기 위해 이 유형의 모델은 효용(utility) 또는 가치(value) 함수를 정의하여 특정 기준 속성을 기반으로 운전 전략이 운전 작업 목표를 충족하는 정도를 정량적으로 평가합니다. 자율주행 과제 구체적으로 이러한 기준 속성은 안전성, 편안함, 운전 효율성 등이 될 수 있으며, 효용과 가치는 단일 속성 또는 다중 속성에 의해 결정될 수 있습니다.

호주 그리피스 대학의 Furda와 Vlacic은 후보 행동 세트에서 최적의 운전 행동을 선택하기 위한 다중 기준 의사 결정 방법을 제안했습니다[13], 싱가포르 국립 대학의 Bandyopadhyay 등은 행동 의사 결정을 제안했습니다. 인지된 불확실성이 있는 상황을 해결하기 위해 POMDP 기반 모델[14] Carnegie Mellon University의 Wei J 등은 PCB(Prediction and-Cost-Function Based) 기반의 행동 의사 결정 모델을 제안했습니다. 적절한 비용 함수를 구축하는 방법은 여러 에이전트가 관련된 복잡한 환경에서 의사 결정 문제를 해결하기 위해 환경 예측을 안내하는 데 사용되며, 연구자들은 게임 이론을 기반으로 하는 많은 모델을 사용하여 다음을 추론합니다. 차량 간 상호작용 행동 [16], [17] 또한, 특징 추출의 장점으로 인해 심층 강화 학습 기술도 최적의 운전 행동을 생성하는 데 널리 사용되기 시작했습니다 [18].

04 Motion Planning

특정 운전 행동을 결정한 후 해야 할 일은 "행동"을 보다 구체적인 운전 "궤적"으로 변환하여 최종적으로 차량 신호에 대한 일련의 특정 제어를 생성할 수 있도록 하는 것입니다. 계획된 목표에 따른 차량 주행을 실현합니다. 이 과정을 모션 플래닝(Motion Planning)이라고 합니다. 모션 플래닝의 개념은 로봇공학 분야에서 오랜 연구의 역사를 가지고 있습니다. 수학적 관점에서 보면 다음과 같은 최적화 문제로 볼 수 있습니다.

경로 계획(Path Planning)

자율주행 의사결정 기술에 대한 자세한 설명

그림 3. 경로 계획의 정의

로봇으로 대표되는 많은 시나리오에서 주변 환경이 결정론적이라고 간주할 수 있습니다. 이 경우 소위 경로 계획은 주어진 상태 공간 Χ에서 특정 제약 조건을 충족하는 매핑 σ:[0,1]➞Χ을 찾는 것을 의미합니다. 이러한 제약 조건에는 다음이 포함됩니다.

  • 결정된 시작점 초기 상태와 대상 지점이 위치한 영역
  • 충돌 방지
  • 경로에 대한 미분 제약 조건(예: 실제 문제에서 경로 곡률은 2차 도함수 제약 조건에 따라 너무 작을 수 없음)

목적 함수 최적화 문제는 J(σ)로 정의되며, 구체적인 의미는 경로 길이, 제어 복잡도 등의 측정 기준으로 표현될 수 있다.

그러나 자동 운전 문제에서는 차량 주변 환경이 끊임없이 동적으로 변화하므로 단순한 경로 계획은 운전 과정에서 항상 유효한 솔루션을 제공할 수 없으므로 차원-시간 T, 해당 계획을 추가해야 합니다. 문제는 종종 궤도 계획이라고 불립니다.

궤도 계획

자율주행 의사결정 기술에 대한 자세한 설명

그림 4. 궤도 계획의 정의

시간 차원의 증가로 인해 계획 문제에 큰 어려움이 생겼습니다. 예를 들어, 단일 점으로 추상화된 2D 환경에서 이동하는 로봇의 경우 환경 내 장애물은 다각형으로 근사화됩니다. 경로 계획 문제는 다항식 시간에 풀 수 있는 반면, 시간 차원을 추가하는 경로 계획 문제는 NP-hard 문제임이 입증되었습니다.

실제 자율주행 시나리오에서 차량 자체이든 주변 환경이든 더 정확한 모델을 구축한다는 것은 최적화 문제에 대한 제약이 더 복잡하다는 것을 의미하며, 해결이 더 어렵다는 의미이기도 합니다. 따라서 실제로 사용되는 알고리즘은 실제 장면에 대한 근사를 전제로 하며, 모델 정확도와 솔루션 효율성 간의 최적의 균형을 추구합니다.

다음은 현재 자율주행 분야에서 일반적으로 사용되는 몇 가지 유형의 모션 계획 알고리즘을 소개합니다. 실제로는 여러 유형의 아이디어를 조합하여 궁극적으로 더 나은 계획 결과를 달성하고 더 다양한 시나리오를 만족시킬 수 있는 경우가 많습니다.

1. 검색 기반 계획 알고리즘

검색을 통해 동작 계획 문제를 해결하는 것은 가장 간단한 아이디어 중 하나입니다. 기본 아이디어는 상태 공간을 특정 방식으로 그래프로 분리한 다음 다양한 휴리스틱 검색 알고리즘을 사용하는 것입니다. 실현 가능한 솔루션 또는 최적의 솔루션을 검색합니다.​​

상태 공간을 이산화하는 과정에서는 최종 그리드가 가장 큰 커버리지 영역을 가지며 반복되지 않도록 주의해야 합니다. 그림 5에 표시된 대로 왼쪽의 그리드는 직진, 좌회전 90°, 우회전 90°의 세 가지 동작으로 생성됩니다. 세 가지 동작을 선택하는 경우 직진, 좌회전 89°, 우회전 89; °, 전체 영역을 포괄하는 그리드 구조를 생성할 수 없습니다.

자율주행 의사결정 기술에 대한 자세한 설명

그림 5. 래스터 그래프 구성, [2]에서 인용

상태 공간을 래스터화한 후 위에서 이미 소개한 Dijkstra 및 A* 검색 알고리즘을 사용하여 최종 계획을 완료할 수 있습니다. 그러나 실제 복잡한 환경에서는 그리드가 많고 시간이 지남에 따라 환경이 동적으로 변경되므로 검색 노드가 너무 많아집니다. 따라서 다양한 특정 시나리오를 처리하기 위해 다양하고 향상된 알고리즘이 개발되었습니다.

1) 하이브리드 A* 알고리즘은 A* 알고리즘을 기반으로 차량의 최대 조향 문제를 고려합니다. 예를 들어 계산된 경로에서 차량의 최대 조향 방향을 5° 이하로 제한합니다. 이 알고리즘의 현재 적용 시나리오에는 자동차 유턴(Uturn을 수행하기 위해 이 알고리즘을 사용하는 DARPA 챌린지에 참가하기 위해 스탠포드에서 사용하는 주니어 자동차), 주차 및 높은 스티어링 휠 제어가 필요한 기타 시나리오가 포함됩니다.

2) D* 및 D*Lite 알고리즘은 끝점에서 시작점까지 미리 검색하며, Dijkstra 알고리즘을 사용하여 목표 지점에서 도로망의 각 지점까지의 최단 경로 길이 k와 실제 길이를 저장합니다. 노드에서 대상 지점 h까지의 값, 초기 경우 k==h, 링크를 따라갈 수 있도록 각 노드의 이전 노드가 저장됩니다.

계산이 완료되면 당시의 최적 경로가 얻어집니다. 자동차가 특정 노드로 이동하면 센서를 통해 해당 노드를 통과할 수 없음(장애물이 있음)이 발견되면 저장된 도로망 정보 중 일부 해당 지점의 h 값이 수정(증가)되고, 이웃 지점이 여전히 문제를 만족하는 h==k가 선택됩니다. 즉, 최적 경로의 지점이 여전히 다음 지점입니다.

그럼 끝까지 걸어가세요. 이러한 유형의 알고리즘은 알려지지 않은 환경에서의 탐색 및 경로 계획에 적합하며 "Opportunity" 및 "Spirit" 화성 탐사선과 같은 현재 다양한 이동 로봇 및 자율주행 차량에 널리 사용됩니다.

2. 샘플링 기반 계획 알고리즘

연속 상태 공간을 샘플링하여 원래 문제를 이산 시퀀스 최적화 문제로 근사화합니다. 이 아이디어는 컴퓨터 과학에서 가장 널리 사용되는 알고리즘이기도 합니다. 동작 계획 문제에서 기본 샘플링 기반 알고리즘에는 PRM(Probabilistic Roadmap) 및 RRT(Rapid Search Random Tree) 알고리즘이 포함됩니다.

자율주행 의사결정 기술에 대한 자세한 설명

그림 6. RRT 알고리즘을 사용한 U자형 곡선 궤적 계획, [19]에서 인용

1) 기본 알고리즘: PRM(Probabilistic Roadmap)

  • 전처리 단계: 상태 공간 n 점이 균일합니다. 네트워크 내의 안전 영역에서 무작위로 샘플링되고, 각 샘플링 지점은 일정 거리 내에서 인접한 샘플링 지점과 연결되며, 장애물과 충돌하는 궤적은 폐기되고 최종적으로 연결된 그래프가 획득됩니다.
  • 쿼리 단계: 주어진 초기 및 목표 상태 쌍에 대해 이미 구성된 그래프에 연결한 다음 검색 알고리즘을 사용하여 요구 사항을 충족하는 궤적을 찾습니다.

PRM이 구축되면 다양한 초기 및 목표 상태의 모션 계획 문제를 해결하는 데 사용할 수 있음을 쉽게 알 수 있지만 자율 주행 모션 계획에는 이 기능이 필요하지 않습니다. 또한 PRM에는 상태 간의 정확한 연결이 필요하며 이는 복잡한 미분 제약 조건이 있는 동작 계획 문제의 경우 매우 어렵습니다.

2) 기본 알고리즘: RRT(Rapid Search Random Tree)

  • 트리 초기화: 트리의 노드 세트와 에지 세트를 초기화합니다. 노드 세트에는 초기 상태만 포함되며 에지 세트는 비어 있습니다. .
  • 트리 성장: 상태 공간을 무작위로 샘플링합니다. 샘플링 지점이 상태 공간의 안전 영역에 떨어지면 현재 트리에서 샘플링 지점에 가장 가까운 노드를 선택하고 샘플링 지점으로 확장(또는 연결)합니다. . 생성된 궤적이 장애물과 충돌하지 않으면 트리의 에지 세트에 궤적을 추가하고 트리의 노드 세트에 궤적의 끝점을 추가한다.

RRT는 해상도 매개변수 설정이 필요 없는 증분 샘플링 검색 방법입니다. 극단적인 경우 검색 트리는 전체 공간을 촘촘하게 덮게 됩니다. 이때 검색 트리는 전체 공간을 채우는 목적을 달성하기 위해 더 짧은 곡선이나 경로로 구성됩니다.

3) 다양하게 개선된 알고리즘

위의 기본 알고리즘에 대한 설명을 통해 상태공간을 샘플링하면 시작점과 끝점을 연결하는 실현 가능한 해를 보장할 수 있다는 것을 알 수 있지만, 샘플링 과정은 전체 공간 균일한 샘플링으로 효율성이 매우 낮으며 복잡한 시나리오에서는 실시간 솔루션을 달성할 수 없습니다. 또한 최종 계획 결과는 얻은 실현 가능한 솔루션이 최적의 솔루션임을 보장할 수 없습니다. 이러한 단점에 대응하여 다양한 개선된 알고리즘이 제안되어 자율주행 문제에 적용되었습니다.

  • 효율성 향상--불균등 샘플링

- RRT-Connect: 초기 상태와 목표에서 시작하여 두 개의 트리를 동시에 구성합니다. 상태, 두 나무가 함께 자라면 실행 가능한 솔루션을 찾습니다.

- 휴리스틱(hRRT): 휴리스틱 기능을 사용하여 확장 비용이 낮은 노드가 샘플링될 확률을 높입니다.

- 운전자 모델과 결합: 편향된 샘플링을 위한 운전자의 시각적 주의 모델과 결합되어 시각적 특징 정보를 사용하여 동작 계획을 안내하므로 계획된 궤적이 인간의 운전 행동과 더욱 일치합니다.

- 새로운 메트릭 RG-RRT(도달성 안내 RT) 구성: 기존의 유클리드 거리 메트릭은 구성 또는 상태 간의 거리를 실제로 반영할 수 없습니다. 노드까지의 거리가 샘플링 지점에서 노드까지 도달 가능한 거리보다 길면 확장을 위해 노드가 선택될 수 있습니다.

- 장애물 페널티 추가(RC-RRT, EG-RRT, ADD-RRT 등): 장애물에 가까운 노드가 확장될 확률을 줄입니다.

  • 실시간 개선

-언제든지 RRT는 먼저 RRT를 신속하게 구축하고 실행 가능한 솔루션을 얻은 후 비용을 기록합니다. 이후 알고리즘은 샘플링을 계속하지만 비용 절감에 유리한 노드만 트리에 삽입합니다. 실행 가능한 솔루션을 선택하여 점차적으로 더 나은 실행 가능한 솔루션을 얻습니다.

- 재계획은 전체 계획 작업을 여러 개의 동일한 시간 하위 작업 시퀀스로 분해하고 현재 작업을 실행하는 동안 다음 작업을 계획합니다.

  • 최적성 개선

- PRM*, RRG, RRT*: 랜덤 기하 그래프 이론에 따라(상태 공간에서 m개의 점을 무작위로 샘플링하고 r(n)보다 작은 거리의 점을 연결하면 Random을 형성합니다. 기하 그래프)를 표준 PRM 및 RRT에서 개선하고 점근적 최적 특성을 갖는 PRM*, RRG 및 RRT* 알고리즘을 얻었습니다

3. 직접 최적화 방법

대부분의 경우 고도 변화를 고려하지 않습니다. , 자율주행의 궤적 계획 문제는 3차원 제약이 있는 최적화 문제(2D 공간 + 시간 T)이므로 디커플링 전략을 사용하여 원래 문제를 여러 개의 저차원 문제로 분해함으로써 문제를 크게 줄일 수 있습니다. 문제 해결.

1) 프레넷 좌표계

자율주행 의사결정 기술에 대한 자세한 설명

그림 7. 프레넷 좌표계

실제 도로는 곡선으로 되어 있기 때문에 최적화 문제를 해결하는 매개변수 표현을 단순화하기 위해 프레넷을 주로 사용합니다. 자율주행 좌표계.

Frenet 좌표계에서는 도로의 중심선을 기준선으로 하고 기준선의 접선 벡터 t와 법선 벡터 n을 사용하여 오른쪽 그림과 같이 좌표계를 구축합니다. 차량 자체를 원점으로 하고 서로 직교하는 좌표축을 기준으로 s 방향(즉, 기준선을 따르는 방향, 보통 세로, 세로라고 함)과 d 방향(또는 L 방향, 즉, 기준선의 현재 법선 방향(수평, 측면)과 비교하면 직교 좌표계(왼쪽 그림)와 비교하여 Frenet 좌표계는 문제를 상당히 단순화합니다.

도로를 운전할 때 우리는 항상 도로의 기준선(즉, 도로의 중심선)을 쉽게 찾을 수 있기 때문에 기준선을 기준으로 한 위치는 세로 거리 S(즉, , 도로 방향에 따른 거리) 및 측면 거리 L(즉, 기준선으로부터 떨어진 거리)입니다.

2) 경로-속도 디커플링 방법

Frenet 좌표계에서 경로-속도 디커플링 방법은 주로 정적 장애물을 고려하고 동적 계획을 통해 정적 참조 경로를 생성합니다. SL 차원), 생성된 경로를 기반으로 속도 계획(ST 차원)을 고려합니다. 이 프로세스는 지속적으로 반복될 수 있으므로 궤도에 대한 실시간 업데이트가 가능합니다. 바이두의 오픈소스 자율주행 플랫폼 아폴로(Apollo)에 사용되는 EM 플래너도 유사한 솔루션을 기반으로 한다. 이 솔루션은 강력한 유연성을 갖추고 있으며 다양한 시나리오에 보편적으로 적용될 수 있습니다.

또한 세로 궤적(ST 차원)과 가로 궤적(LT 차원)을 별도로 계획하는 등 다양한 디커플링 방법을 선택할 수도 있습니다. 그러나 디커플링 방법을 통해 얻은 솔루션은 최적이 아닐 수 있으며 이 알고리즘은 완전하지 않으며 일부 복잡한 환경에서는 실행 가능한 솔루션을 찾지 못할 수도 있다는 점에 유의해야 합니다.

4. 파라메트릭 곡선 구성 방법

자율주행 의사결정 기술에 대한 자세한 설명

그림 8. [19]에서 인용한 일반적인 파라메트릭 곡선 구성 방법

파라메트릭 곡선 구성 방법의 시작점은 운동학을 포함한 차량 자체의 제약입니다. 역학에는 제약이 있으므로 일반적으로 계획된 경로는 곡률에서 연속적이어야 합니다. 이 유형의 방법은 시작점과 목표점을 기준으로 장애물을 고려하고 차량 제약 조건에 맞는 곡선군을 구성하여 원활한 경로를 제공합니다.

그림 8에 표시된 것처럼 일반적인 곡선에는 Dubins 곡선(2차원 공간에서 간단한 차량 모델 Dubin 모델의 가장 짧은 곡선군인 직선과 호로 구성됨), 클로소이드 곡선, 다항식 곡선, 베지어 곡선 등이 있습니다. , 스플라인 등 실제 복잡한 시나리오를 충족하기 위해 파라메트릭 곡선 구성 방법을 단순히 적용하는 것은 어렵습니다. 따라서 이제 점점 더 많은 자율 주행 시스템이 이를 다른 방법과 결합하여 차량 운동학 및 역학을 충족시키기 위해 계획되고 생성된 궤적을 매끄럽게 만듭니다.

5. 인공전위장법

인공 전위장 방법은 물리학의 전자기장에서 영감을 얻었습니다. 장애물과 목표 위치가 각각 반발력과 중력을 생성한다고 가정하여 전위장의 가장 빠른 경사 하강을 따라 경로를 계획할 수 있습니다. 이러한 유형의 방법에서 중요한 문제는 적절한 잠재적 필드 함수를 선택하는 방법입니다. 예를 들어 Stephen Waydo는 원활한 경로 계획을 위해 흐름 함수를 사용하고 Robert Daily는 고속 차량에 대한 조화 잠재적 필드 경로 계획 방법을 제안합니다. [21]. 간단한 시나리오에서는 인공전위장법이 높은 해법 효율을 가지지만, 이 경우 획득한 경로가 최적이 아니며 심지어 경로를 찾지 못할 수도 있다는 것이 가장 큰 문제이다.

05 알고리즘 복잡도(Complexity)

문제를 계획할 때 시간과 공간의 복잡도를 고려하는 것 외에도 알고리즘의 평가는 완전성과 최적성을 갖는지 여부도 고려해야 합니다. 다음으로 확률성을 갖는지 고려합니다. 완전성과 점근적 최적성. 이러한 속성에 대한 이해를 바탕으로 다양한 실제 시나리오에 대해 다양한 알고리즘을 설계하고 적용하여 모델 복잡성과 최적의 효율성 간의 최상의 균형을 달성할 수 있습니다.

1) 완전성: 시작점과 목표점 사이에 경로 솔루션이 있는 경우 솔루션을 얻을 수 없으면 솔루션이 없음을 의미해야 합니다.

2) 확률적으로 완전성 (확률적으로) 완전성): 시작점과 목표점 사이에 경로 솔루션이 있는 경우 계획 또는 검색 시간이 충분히 길면 반드시 경로 솔루션을 찾을 것입니다.

3) 최적성: 계획된 경로는 이내 특정 평가 지표에서 최적입니다(평가 지표는 일반적으로 경로의 길이입니다)

4) 점근적 최적성: 제한된 수의 계획 반복 후에 얻은 경로는 다음과 가까운 차선 경로입니다. 각 반복 후에 최적 경로에 더 가까워지며 이는 점진적인 수렴 과정

자율주행 의사결정 기술에 대한 자세한 설명

표 1 일반적인 알고리즘 비교

06 향후 개발 동향

자율주행 의사결정 기술에 대한 자세한 설명

그림 9. 자율주행 개발 타임라인 및 프로세스 [19]에서 인용한 중요한 동작 계획 알고리즘

자율 주행에 대한 인간의 관심은 1925년으로 거슬러 올라갑니다. 최근 몇 년간 미국 국방 고등 연구 계획국(DARPA)이 자율 주행에 대한 연구 붐을 일으키기 시작했습니다. 그림 9와 같이 2004년부터 2007년까지 세 가지 자율 주행 과제가 있었습니다[22]. 이후 위에서 언급한 다양한 의사결정 계획 방법의 유효성을 실제로 검증하였다. 동시에 동작 계획 방법과 제어 이론, 상태 매개변수 추정, 기계 학습 및 기타 다중 필드 방법을 결합하는 솔루션이 계속해서 등장하여 미래 개발 추세가 되고 있습니다.

1) 차량 역학과 결합: 동적 매개변수 평가 결합 최적의 계획을 갖춘 지표, 최적 제어 관점의 계획은 최근 몇 년 동안 더 많이 사용되는 방법입니다. 이 과정에서 차량 동역학 요소를 충분히 고려할 수 있으며 계획된 궤도가 더 합리적입니다. 예를 들어 모델 예측 제어 이론(Model Predictive Control)을 사용합니다. 단점은 차량에 제약이 많을수록 궤적을 최적화하기가 더 어렵고 온라인 실시간 계산이 더 어렵다는 것입니다.

2) 상태 매개변수 추정과 결합: 상태 매개변수 추정은 차량 매개변수를 보다 정확하게 얻을 수 있으므로 상태 추정기를 계획 모듈에 추가하여 온라인으로 차량 상태를 추정하고 이를 계획자에게 피드백함으로써 궤적 품질을 향상시킬 수 있습니다. 예를 들어, 다양한 지면 유형은 차량 미끄러짐 특성의 변화를 유발하여 차량 상태에 영향을 미칩니다. 추정된 매개변수를 결합하면 궤도를 실시간으로 다시 계획할 수 있고 폐쇄 루프 계획을 통해 궤도 안전성을 향상할 수 있습니다.

3) 머신러닝과의 결합: 신경망으로 대표되는 인공지능의 급속한 발전으로 인해 기존의 많은 계획 문제도 새로운 솔루션을 가져왔습니다. 자율주행 분야의 개발 동향은 다음과 같습니다.

  • 엔드 투 엔드 모델: 심층 신경망을 사용하여 차량 상태 및 외부 환경 정보를 기반으로 차량의 제어 신호를 직접 도출합니다. 현재의 엔드투엔드 모델은 '블랙박스'처럼 해석이 불가능하지만, 인간이 심층신경망에 대한 이해가 계속 깊어짐에 따라 이 방법은 단순성과 효율성이라는 탁월한 장점으로 인해 발전 가능성이 크다고 여겨진다.
  • 의사결정 및 모션 계획 모듈의 통합
  • 자율주행차는 복잡한 환경에서 최적의 결정을 내립니다. 이 문제는 강화학습의 정의와 매우 일치합니다. 따라서 위에서 언급한 것처럼 심층 강화학습 기술의 급속한 발전으로 인해 점점 더 많은 연구팀이 이를 자율 주행 의사 결정 계획에 적용하고 행동 의사 결정 및 동작 계획 모듈을 통합하여 운전 궤적을 직접 학습하기 시작했습니다. 환경 보상 함수를 얻기가 쉽지 않다는 문제를 해결하기 위해 먼저 역 강화 학습(IRL)을 사용하여 인간 전문가의 시연을 기반으로 학습한 후 강화 학습을 사용하여 최적의 정책을 학습하는 방법도 제안되었습니다.

위 내용은 자율주행 의사결정 기술에 대한 자세한 설명의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 51cto.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제