>  기사  >  기술 주변기기  >  대규모 언어 모델 환각을 줄이는 방법

대규모 언어 모델 환각을 줄이는 방법

DDD
DDD원래의
2023-11-03 10:47:331563검색

LLM 환각은 대규모 언어 모델(LLM)이 실제 패턴이나 객체에 부합하지 않는 무의미하거나 부정확한 출력을 생성하는 현상입니다. 이러한 잘못된 AI 출력은 다음을 포함한 다양한 요인에서 비롯됩니다.

  1. 과적합: LLM은 훈련 데이터의 노이즈와 편향을 패턴으로 학습하여 모델이 테스트 데이터에 잘못된 출력을 생성하도록 합니다.

  2. 높은 모델 복잡성: LLM은 모델 복잡성이 높기 때문에 존재하지 않는 상관 관계를 인식하여 환상을 만들어냅니다.

생성 AI 시스템을 개발하는 주요 회사들은 AI 환각 문제를 해결하기 위한 조치를 취하고 있지만 일부 전문가들은 잘못된 출력을 완전히 제거하는 것이 불가능할 수 있다고 생각합니다.

Google은 모델을 인터넷에 연결하여 데이터 및 네트워크 정보로부터 지상 응답을 훈련함으로써 과적합을 줄입니다.

OpenAI는 인간의 피드백과 강화 학습을 사용하여 ChatGPT의 결과를 개선합니다. 그들은 최종 답뿐만 아니라 올바른 추론 단계에 대해 모델에 보상하는 "프로세스 감독"을 제안합니다. 이는 설명 가능성을 향상시킬 수 있지만 일부에서는 조작에 대한 효율성에 의문을 제기합니다.

AI 환각의 위험에도 불구하고 기업과 사용자는 잠재적인 피해를 상쇄하고 제한하기 위한 조치를 취할 수 있습니다. 이를 해결하는 몇 가지 방법은 다음과 같습니다.

고품질 훈련 데이터 사용

고품질 훈련 데이터를 사용하는 것은 AI 환각을 줄이는 열쇠입니다. 고품질 훈련 데이터는 다양하고, 균형 잡혀 있고, 잘 구조화되어 있어야 하며, 실제 상황을 반영해야 합니다.

사용 목적을 명확하게

AI 시스템의 구체적인 목적과 허용된 용도를 명확하게 정의하면 환각적인 내용을 피하는 데 도움이 될 수 있습니다. 개발자와 사용자는 인공지능 모델의 기능과 용도를 명확히 이해하고, 이를 엄격히 준수하여 사용해야 합니다.

데이터 템플릿을 사용하여 인공지능 출력 안내

구조화된 데이터 템플릿을 사용하면 인공지능 모델이 예상 패턴에 맞는 출력을 생성하는 데 도움이 될 수 있습니다. 이러한 템플릿은 모델에 입력되는 데이터에 대해 일관된 형식을 제공하고 모델 추론 범위를 제한합니다.

Limit Reaction

잠재적인 모델 출력에 대한 제약 조건과 제한을 설정하면 통제되지 않은 추측을 줄일 수 있습니다. 예를 들어 명확한 확률 임계값을 정의하고 필터링 도구를 사용하여 기대치를 충족하지 않는 응답을 필터링할 수 있습니다.

지속적인 시스템 테스트 및 개선

종합적인 테스트와 지속적인 모니터링을 통해 인공지능 시스템의 성능은 지속적으로 향상될 수 있습니다. 출력을 평가하면 조정이 필요한 영역을 식별할 수 있으며, 새로운 데이터를 사용하여 모델을 재교육하고 지식을 업데이트할 수 있습니다.

사람의 감독에 의존

사람의 감독을 포함하면 중요한 보호 기능을 제공할 수 있습니다. 인간 전문가는 출력을 검토할 때 상황에 따른 판단을 통해 환상의 내용을 포착하고 수정할 수 있습니다.

Thought Prompt Chain

Thought Prompt Chain은 논리적 사고 체인을 제공하여 인공지능 모델이 다단계 추론을 수행할 수 있도록 돕는 기술입니다. 이 접근 방식은 수학과 같은 작업에서 인공 지능 모델의 성능을 향상시킬 수 있습니다.

작업 분해 및 에이전트

작업 분해 및 에이전트는 복잡한 작업을 여러 하위 작업으로 분할하여 인공 지능 모델의 성능을 향상시키는 방법입니다. 이 방법은 다양한 인공지능 모델의 장점을 활용하고 인공지능 모델의 추론 능력을 향상시킬 수 있습니다.

인공지능 환각은 인공지능 개발에 있어 난제이지만 효과적인 조치를 취하면 위험을 효과적으로 줄일 수 있습니다.

위 내용은 대규모 언어 모델 환각을 줄이는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.