2월 17일, Haomo Zhixing은 자사의 대형 자율주행 인지 모델이 공식적으로 DriveGPT로 업그레이드되었다고 발표했으며, 2023년 4월 HAOMOAI DAY에서 최신 중요한 진전을 발표할 예정입니다.
ChatGPT가 인터넷을 통해 대중화되면서 Transformer 대형 모델과 이것이 사용하는 "RLHF(Human Feedback Reinforcement Learning)" 기술이 다시 한번 업계의 주목을 받았습니다. 자율주행 분야에서 Feimo는 중국 최초로 Transformer 대형 모델을 데이터 인텔리전스 시스템 MANA에 도입했습니다. 2023년 1월 HAOMO AI DAY에서 Haomo Zhixing의 CEO Gu Weihao는 Haomo가 출시한 인간 운전을 위한 대규모 자기 감독 인지 모델이 ChatGPT의 구현 아이디어를 바탕으로 RLHF(Human Feedback Reinforcement Learning) 기술을 채택했다고 소개했습니다. .실제 인간 운전자 인수 데이터를 도입하여 자율주행 인지 의사결정 모델을 지속적으로 최적화합니다.
하이모의 인지적 의사결정 알고리즘은 세 단계의 진화를 거쳤습니다. 첫 번째 단계는 인간의 운전 행동에 직접적으로 맞도록 개별 시나리오의 엔드투엔드 모방 학습을 도입하는 것입니다. 두 번째 단계는 대규모 인지 모델을 사용하여 대량의 정상적인 인간 운전 데이터를 도입하고 프롬프트를 통해 제어 가능하고 설명 가능한 인지적 의사 결정을 내리는 것입니다. 현재 단계인 세 번째 단계에서는 실제 인수 데이터를 도입하고, 인간이 운전하는 인수 데이터로부터 학습하기 위해 대규모 모델에서 RLHF 알고리즘을 사용하기 시작합니다. 이를 위해 하오모는 '기존 전략, 인수 전략, 수동 라벨 전략'을 포함하는 쌍별 순위 모델을 구축했다. 이 순위 모델을 바탕으로 하이모는 다양한 계획 시나리오에서 최적의 결정을 내릴 수 있도록 자율주행 결정에 대한 보상 모델을 구축했습니다. 이 대형 모델을 통해 유턴, 로터리 등 어려운 장면이 인식되는 상황에서 장면 통과율이 30% 이상 높아진다.
2월 17일, Haomo Zhixing은 자율 주행 감독을 위한 대형 인지 모델을 공식적으로 "DriveGPT"로 업그레이드했습니다. 이는 세계 최초의 자율 주행을 위한 대형 인지 모델이기도 합니다. 현재 Haimo DriveGPT는 모델 구축과 1단계 데이터 실행을 완료했으며 매개변수 규모는 GPT-2 수준을 벤치마킹할 수 있습니다. 다음으로 DriveGPT는 지속적으로 대규모 실제 인수 데이터를 도입하고, 인간의 주행 데이터 피드백에 대한 강화 학습을 통해 평가 효과를 지속적으로 향상시킬 예정입니다. DriveGPT는 소형 자동차 측 모델의 주행 효과를 평가하기 위한 클라우드 평가 모델로도 사용될 예정입니다. Haomo DriveGPT의 최신 중요한 진행 상황은 2023년 4월 제8회 HAOMO AI DAY에서 발표될 예정입니다.
위 내용은 HaoMo Zhixing: 대형 자율주행 인지 모델이 공식적으로 DriveGPT로 업그레이드되었습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!