>  기사  >  변환기의 위치 임베딩 이해: 절대에서 회전까지

변환기의 위치 임베딩 이해: 절대에서 회전까지

WBOY
WBOY원래의
2024-07-20 21:49:31403검색

코드 예제를 통해 절대, 상대 및 회전 위치 임베딩에 대한 심층 분석

Understanding Positional Embeddings in Transformers: From Absolute to Rotary

변압기의 위치 임베딩 이해: 절대에서 회전까지

코드 예제를 통해 절대, 상대 및 회전 위치 임베딩에 대한 심층 분석

Mina Ghashami

Follow

Towards Data Science

--

Share

Transformer의 핵심 구성 요소 중 하나는 위치 임베딩입니다. 당신은 질문할 수 있습니다: 왜? 변환기의 self-attention 메커니즘은 순열 불변이기 때문입니다. 즉, 입력의 각 토큰이 시퀀스의 다른 토큰으로부터 받는 '주의'의 양을 계산하지만 토큰의 순서는 고려하지 않습니다. 실제로 어텐션 메커니즘은 시퀀스를 토큰 가방으로 취급합니다. 이러한 이유로 토큰의 순서를 설명하고 토큰 임베딩에 영향을 미치는 위치 임베딩이라는 또 다른 구성 요소가 필요합니다. 하지만 위치 임베딩에는 어떤 유형이 있으며 어떻게 구현되나요?

이 게시물에서는 위치 임베딩의 세 가지 주요 유형을 살펴보고 구현에 대해 자세히 알아봅니다.

이 게시물의 목차는 다음과 같습니다. :

1. 맥락과 배경

2. 절대 위치 임베딩

위 내용은 변환기의 위치 임베딩 이해: 절대에서 회전까지의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.