문서 링크: https://arxiv.org/abs/2309.01029 -
Github 링크: https://github.com/hy-zhao23/Explainability-for-Large-Language-Models
모델 복잡성이 높습니다. LLM 시대 이전의 딥 러닝 모델이나 전통적인 통계적 기계 학습 모델과 달리 LLM 모델은 규모가 거대하고 수십억 개의 매개변수를 포함하고 있으며 내부 표현 및 추론 프로세스가 매우 복잡하며 특정 결과를 설명하기가 어렵습니다. 강력한 데이터 의존성. LLM은 훈련 과정에서 대규모 텍스트 코퍼스에 의존합니다. 이러한 훈련 데이터의 편향, 오류 등은 모델에 영향을 미칠 수 있지만 훈련 데이터의 품질이 모델에 미치는 영향을 완전히 판단하기는 어렵습니다. 블랙박스 자연. 우리는 일반적으로 Llama-2와 같은 오픈 소스 모델의 경우에도 LLM을 블랙박스 모델로 생각합니다. 내부 추론 체인과 의사결정 과정을 명시적으로 판단하기는 어렵습니다. 입력과 출력을 기준으로만 분석할 수 있기 때문에 해석이 어렵습니다. 출력 불확실성. LLM의 출력은 종종 불확실하며 동일한 입력에 대해 다른 출력이 생성될 수 있으며 이로 인해 해석이 어려워집니다. 평가 지표가 부족합니다. 현재 대화 시스템의 자동 평가 지표로는 모델의 해석성을 충분히 반영하기에는 부족하며, 인간의 이해를 고려한 평가 지표가 더 많이 필요합니다.
1. 특성 기여의 목적은 각 입력 특성(예: 단어, 구문, 텍스트 범위)과 모델 예측 간의 상관관계를 측정하는 것입니다. 특징 귀인 방법은 다음과 같이 나눌 수 있습니다.
섭동 해석을 기반으로 특정 입력 특징을 수정하여 출력 결과에 미치는 영향을 관찰합니다.
그라디언트 해석을 기반으로 입력에 대한 출력의 편미분을 다음과 같이 사용합니다. 해당 입력 중요도 지수
대체 모델은 인간이 이해할 수 있는 간단한 모델을 사용하여 복잡한 모델의 단일 출력을 피팅하여 각 입력의 중요도를 얻습니다.
특성 상관 관계를 목표로 하는 분해 기술 기반 선형 성별 점수 분해.
- 주의 효과 출력과 같은 함수 기반 해석; 그러나 연구 관점으로 주목을 사용하는 것은 학계에서 여전히 논란의 여지가 있습니다.
- 반사실 샘플은 일반적으로 모델의 인과 추론 능력을 테스트하는 부정 등의 텍스트를 변형하여 얻습니다.
전역 설명
전역 설명은 뉴런, 숨겨진 레이어 및 대형 블록 설명을 포함한 모델 수준에서 대형 모델의 작동 메커니즘에 대한 고차원적인 이해를 제공하는 것을 목표로 합니다. 주로 다양한 네트워크 구성 요소에서 학습된 의미론적 지식을 탐구합니다.
- 뉴런 활성화 기존의 뉴런 활성화 분석은 중요한 뉴런의 일부만 고려한 후 뉴런과 의미적 특징 간의 관계를 학습합니다. 최근에는 뉴런을 설명하기 위해 GPT-4를 사용하기도 합니다. 설명을 위해 일부 뉴런을 선택하는 대신 GPT-4를 사용하여 모든 뉴런을 설명할 수도 있습니다.
- 개념 기반 해석은 입력을 개념 집합에 매핑한 다음 예측에 대한 개념의 중요성을 측정하여 모델을 설명합니다.
프롬핑 패러다임을 기반으로 한 모델 설명
프롬핑 패러다임을 기반으로 한 모델 설명은 두 모델의 역량을 구별하고 모델 학습을 탐색하기 위해 기본 모델과 보조 모델에 대한 별도의 설명이 필요합니다. 경로. 탐구된 주요 문제는 다음과 같습니다: 퓨샷 학습을 위한 모델에 대한 설명 제공의 이점, 퓨샷 학습 및 사고 체인 기능의 기원 이해.
기본 모델 설명
- 상황별 학습 대형 모델의 상황별 학습 메커니즘을 살펴보고 대형 모델과 중형 모델의 상황별 학습 간의 차이를 구별합니다.
- 사고 연쇄 프롬프트가 모델 성능을 향상시키는 이유를 살펴보세요.
보조 모델 설명
- 환상과 불확실성 대규모 모델 예측의 정확성과 신뢰성은 현재 연구에서 여전히 중요한 주제입니다. 대형 모델의 강력한 추론 기능에도 불구하고 그 결과는 종종 잘못된 정보와 환각으로 인해 어려움을 겪습니다. 이러한 예측의 불확실성은 광범위한 적용에 큰 어려움을 가져옵니다.
모델 설명 평가
모델 설명의 평가 지표에는 타당성, 충실도, 안정성, 견고성이 포함됩니다. 이 논문에서는 주로 1) 인간에 대한 합리성 2) 모델의 내부 논리에 대한 충실도라는 두 가지 측면에 대해 이야기합니다.
위 내용은 대형 모델의 해석 가능성 분석: 검토를 통해 진실을 밝히고 의심에 대한 답변을 제공합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

AI의 미래는 간단한 단어 예측과 대화 시뮬레이션을 넘어서고 있습니다. AI 에이전트는 새로운 행동 및 작업 완료가 가능합니다. 이러한 변화는 이미 Anthropic의 Claude와 같은 도구에서 분명합니다. AI 요원 : 연구 a

빠른 기술 발전은 미래의 업무에 대한 미래 지향적 인 관점을 필요로합니다. AI가 단순한 생산성 향상을 초월하고 사회적 구조를 형성하기 시작하면 어떻게됩니까? Topher McDougal의 다가오는 책인 Gaia Wakes :

조화 시스템 (HS)과 같은 시스템의 "HS 8471.30"과 같은 복잡한 코드를 포함하는 제품 분류는 국제 무역 및 국내 판매에 중요합니다. 이 코드는 올바른 세금 신청을 보장하여 모든 inv에 영향을 미칩니다

데이터 센터 및 기후 기술 투자의 에너지 소비의 미래 이 기사는 AI가 주도하는 데이터 센터의 에너지 소비 급증과 기후 변화에 미치는 영향을 탐구 하고이 과제를 해결하기 위해 혁신적인 솔루션 및 정책 권장 사항을 분석합니다. 에너지 수요의 과제 : 대규모 및 초대형 스케일 데이터 센터는 수십만 명의 일반 북미 가족의 합과 비슷한 대규모 전력을 소비하며, AI 초반 규모 센터는 이보다 수십 배 더 많은 힘을 소비합니다. 2024 년 첫 8 개월 동안 Microsoft, Meta, Google 및 Amazon은 AI 데이터 센터의 건설 및 운영에 약 1,250 억 달러를 투자했습니다 (JP Morgan, 2024) (표 1). 에너지 수요 증가는 도전이자 기회입니다. 카나리아 미디어에 따르면 다가오는 전기

생성 AI는 영화 및 텔레비전 제작을 혁신하고 있습니다. Luma의 Ray 2 모델과 활주로의 Gen-4, Openai의 Sora, Google의 VEO 및 기타 새로운 모델은 전례없는 속도로 생성 된 비디오의 품질을 향상시키고 있습니다. 이 모델은 복잡한 특수 효과와 현실적인 장면을 쉽게 만들 수 있으며 짧은 비디오 클립과 카메라로 인식 된 모션 효과조차도 달성되었습니다. 이러한 도구의 조작과 일관성은 여전히 개선되어야하지만 진행 속도는 놀랍습니다. 생성 비디오는 독립적 인 매체가되고 있습니다. 일부 모델은 애니메이션 제작에 능숙하고 다른 모델은 라이브 액션 이미지에 능숙합니다. Adobe 's Firefly와 Moonvalley's MA가

ChatGpt 사용자 경험 감소 : 모델 저하 또는 사용자 기대치입니까? 최근에, 많은 ChatGpt 유료 사용자가 성능 저하에 대해 불평하여 광범위한 관심을 끌었습니다. 사용자는 모델에 대한 느린 반응, 짧은 답변, 도움 부족 및 더 많은 환각을보고했습니다. 일부 사용자는 소셜 미디어에 대한 불만을 표명했으며 Chatgpt가“너무 아첨”이되었으며 중요한 피드백을 제공하기보다는 사용자보기를 확인하는 경향이 있습니다. 이는 사용자 경험에 영향을 줄뿐만 아니라 생산성 감소 및 컴퓨팅 리소스 낭비와 같은 회사 고객에게 실제 손실을 가져옵니다. 성능 저하의 증거 많은 사용자들이 ChatGpt 성능, 특히 GPT-4와 같은 이전 모델 (이번 달 말에 서비스에서 곧 중단 될 예정)에서 상당한 악화를보고했습니다. 이것

알파 세대와 AI 혁명 Alpha Generation (2010-2024 년 출생)은 독특하게 위치하고 있습니다. 그들은 일상 생활에 깊이 짜여진 기술인 생성 AI와 함께 자랍니다. 그러나이 광범위한 접근은 주로 i가 즐겼습니다

Apollo Research의 새로운 보고서에 따르면 고급 AI 시스템의 점검되지 않은 내부 배치는 상당한 위험을 초래합니다. 주요 AI 기업들 사이에서 널리 퍼져있는 이러한 감독 부족은 uncont에서 범위에 이르는 잠재적 인 치명적인 결과를 허용합니다.


핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

Video Face Swap
완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

인기 기사

뜨거운 도구

Dreamweaver Mac版
시각적 웹 개발 도구

mPDF
mPDF는 UTF-8로 인코딩된 HTML에서 PDF 파일을 생성할 수 있는 PHP 라이브러리입니다. 원저자인 Ian Back은 자신의 웹 사이트에서 "즉시" PDF 파일을 출력하고 다양한 언어를 처리하기 위해 mPDF를 작성했습니다. HTML2FPDF와 같은 원본 스크립트보다 유니코드 글꼴을 사용할 때 속도가 느리고 더 큰 파일을 생성하지만 CSS 스타일 등을 지원하고 많은 개선 사항이 있습니다. RTL(아랍어, 히브리어), CJK(중국어, 일본어, 한국어)를 포함한 거의 모든 언어를 지원합니다. 중첩된 블록 수준 요소(예: P, DIV)를 지원합니다.

SublimeText3 Linux 새 버전
SublimeText3 Linux 최신 버전

Atom Editor Mac 버전 다운로드
가장 인기 있는 오픈 소스 편집기

PhpStorm 맥 버전
최신(2018.2.1) 전문 PHP 통합 개발 도구
