이 코드는 torchvision의 RandomAffine
변환을 보여줍니다. 다양한 매개변수 조합을 탐색하고 이미지 회전, 변환, 크기 조정 및 전단 기능을 보여줍니다. 결과는 matplotlib를 사용하여 시각화됩니다.
RandomAffine
변환을 사용하면 2차원 및 3차원 이미지 변환이 가능합니다. 주요 매개변수는 다음과 같습니다:
degrees
: 회전 각도를 지정합니다. 단일 부동 소수점 값은 대칭 범위 [-도, 도]를 나타냅니다. 두 개의 부동 소수점으로 구성된 튜플/리스트는 비대칭 범위 [최소, 최대]를 정의합니다.
translate
: 번역을 제어합니다. 두 개의 부동 소수점 [a, b]으로 구성된 튜플/리스트는 각각 이미지 너비와 높이의 분수로 수평 및 수직 이동을 나타냅니다.
scale
: 배율 범위[최소, 최대]를 정의합니다.
shear
: 시어링을 소개합니다. 단일 float 값은 x에 대한 대칭 전단 범위 [-shear, shear]를 의미하며 y 전단은 0으로 설정됩니다. 두 개의 float의 튜플/목록은 x 전단 범위를 지정합니다. 4개 요소로 구성된 튜플/목록은 x 및 y 전단 범위를 모두 정의합니다.
interpolation
: 보간 방법을 지정합니다(예: InterpolationMode.NEAREST
).
fill
: 변환된 이미지 외부 영역의 채우기 색상을 결정합니다. 단일 값이거나 RGB 값을 나타내는 튜플/목록일 수 있습니다.
center
: 회전 중심을 설정합니다.
이 코드는 다양한 조건에서 변환 동작을 보여주기 위해 극단값을 포함한 다양한 매개변수 설정을 체계적으로 테스트합니다. 시각화는 입력 이미지에 대한 각 매개변수의 효과를 명확하게 보여줍니다. 두 show_images
함수는 동일한 기능을 제공합니다. 하나는 플로팅 루프 내에서 직접 변환을 적용하고 다른 하나는 변환을 사전 계산합니다.
아래 표시된 이미지는 OxfordIIITPet 데이터세트의 이미지에 적용된 다양한 RandomAffine
변환의 출력을 시각적으로 나타냅니다.
위 내용은 PyTorch의 RandomAffine의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!