찾다
기술 주변기기일체 포함이미지 처리 작업에서 Wasserstein 거리가 어떻게 사용되나요?

이미지 처리 작업에서 Wasserstein 거리가 어떻게 사용되나요?

EMD(Earth Mover's Distance)라고도 알려진 Wasserstein 거리는 두 확률 분포 간의 차이를 측정하는 데 사용되는 측정 방법입니다. 전통적인 KL 분기 또는 JS 분기와 비교하여 Wasserstein 거리는 분포 간의 구조적 정보를 고려하므로 많은 이미지 처리 작업에서 더 나은 성능을 나타냅니다. 두 배포판 간의 최소 운송 비용을 계산함으로써 Wasserstein 거리는 한 배포판을 다른 배포판으로 변환하는 데 필요한 최소 작업량을 측정할 수 있습니다. 이 측정항목은 분포 간의 기하학적 차이를 포착할 수 있으므로 이미지 생성 및 스타일 전송과 같은 작업에서 중요한 역할을 합니다. 따라서 Wasserstein 거리는 확률 분포 비교 및 ​​이미지 처리 분야에서 널리 사용되는 도구 중 하나가 되었습니다.

Wasserstein 거리는 이미지 처리에서 두 이미지 간의 차이를 측정하는 데 사용됩니다. 유클리드 거리 및 코사인 유사성과 같은 전통적인 방법과 비교하여 이미지의 구조적 정보를 더 잘 고려할 수 있습니다. 이미지 검색에서는 일반적으로 쿼리 이미지와 가장 유사한 이미지를 찾으려고 합니다. 기존 방법은 특징 벡터를 사용하여 이미지를 표현하고 유클리드 거리 또는 코사인 유사성과 같은 측정값을 사용하여 이미지를 비교합니다. 그러나 이러한 측정 방법은 이미지 간의 공간적 관계를 무시하므로 이미지 변형이나 노이즈와 같은 상황에서는 적합하지 않을 수 있습니다. 대조적으로, Wasserstein 거리는 픽셀 간의 공간적 관계를 고려할 수 있으므로 이미지 간의 유사성을 더 잘 포착할 수 있습니다.

아래는 Wasserstein 거리를 이용한 이미지 검색의 예입니다.

1000개의 이미지로 구성된 데이터베이스가 있고 쿼리 이미지와 가장 유사한 이미지를 찾고 싶다고 가정해 보겠습니다. 각 이미지 쌍 간의 차이를 측정하기 위해 Wasserstein 거리를 사용하고 거리가 가장 작은 이미지를 쿼리 결과로 선택할 수 있습니다.

먼저, 히스토그램을 사용하여 각 픽셀의 회색도 분포를 나타내고, 회색도 값을 여러 개의 개별 간격으로 나누고, 각 간격의 픽셀 수를 계산할 수 있습니다. 이런 식으로 이미지를 나타내는 확률 분포를 얻을 수 있습니다.

각 픽셀의 회색조 분포를 표현하기 위해 10개의 회색조 간격을 사용한다고 가정하면 Python과 NumPy 라이브러리를 사용하여 각 이미지의 히스토그램 표현을 계산할 수 있습니다.

import numpy as np
import cv2

# Load query image
query_image = cv2.imread('query_image.png', cv2.IMREAD_GRAYSCALE)

# Compute histogram
hist, _ = np.histogram(query_image, bins=10, range=(0, 255), density=True)

그런 다음 각 쌍을 계산할 수 있습니다. 이미지 사이의 Wasserstein 거리를 지정하고 거리가 가장 작은 이미지를 쿼리 결과로 선택합니다.

# Load image database
database = []
for i in range(1000):
    img = cv2.imread(f'image_{i}.png', cv2.IMREAD_GRAYSCALE)
    database.append(img)

# Compute Wasserstein distance between query image and each database image
distances = []
for img in database:
    hist2, _ = np.histogram(img, bins=10, range=(0, 255), density=True)
    distance = cv2.EMD(hist, hist2, cv2.DIST_L2)
    distances.append(distance)

# Find index of image with minimum distance
min_index = np.argmin(distances)

이 예에서는 OpenCV 라이브러리의 cv2.EMD 함수를 사용하여 Wasserstein 거리를 계산합니다. 이 함수는 두 개의 확률 분포를 입력으로 사용하고 둘 사이의 거리를 반환합니다. cv2.DIST_L2 매개변수를 사용하여 유클리드 거리를 거리 측정법으로 사용하도록 지정합니다.

이미지 검색에 Wasserstein 거리를 사용하면 픽셀 간의 공간적 관계를 고려할 수 있어 이미지 간의 유사성을 더 잘 포착할 수 있다는 장점이 있습니다. 단점은 계산 복잡도가 높아 대규모 이미지 데이터베이스를 다룰 때 실용적이지 않을 수 있다는 것입니다.

요약하자면, Wasserstein 거리는 이미지 검색, 이미지 분류, 이미지 생성 등 이미지 처리의 다양한 작업에 사용할 수 있는 유용한 측정항목입니다.

위 내용은 이미지 처리 작업에서 Wasserstein 거리가 어떻게 사용되나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명
이 기사는 网易伏羲에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제
Chrome은 AI와 함께 여기에 있습니다 : 매일 새로운 것을 경험하고 있습니다 !!Chrome은 AI와 함께 여기에 있습니다 : 매일 새로운 것을 경험하고 있습니다 !!Apr 17, 2025 am 11:29 AM

Chrome 's AI Revolution : 개인화되고 효율적인 탐색 경험 인공 지능 (AI)은 우리의 일상 생활을 빠르게 변화시키고 있으며 Chrome은 웹 브라우징 경기장에서 요금을 주도하고 있습니다. 이 기사는 흥분을 탐구합니다

AI '의 인간 측면 : 웰빙과 4 배의 결론AI '의 인간 측면 : 웰빙과 4 배의 결론Apr 17, 2025 am 11:28 AM

재구성 영향 : 4 배의 결론 너무 오랫동안 대화는 AI의 영향에 대한 좁은 견해로 인해 주로 이익의 결론에 중점을 두었습니다. 그러나보다 전체적인 접근 방식은 BU의 상호 연결성을 인식합니다.

5 게임 변화 양자 컴퓨팅 사용 사례에 대해 알아야합니다.5 게임 변화 양자 컴퓨팅 사용 사례에 대해 알아야합니다.Apr 17, 2025 am 11:24 AM

상황이 그 시점을 꾸준히 움직이고 있습니다. 양자 서비스 제공 업체와 신생 기업에 쏟아지는 투자는 업계의 중요성을 이해하고 있음을 보여줍니다. 그리고 점점 더 많은 실제 사용 사례가 그 가치를 보여주기 위해 떠오르고 있습니다.

직장에서 경쟁 우위를위한 AI 프롬프트를 미세 조정하는 방법직장에서 경쟁 우위를위한 AI 프롬프트를 미세 조정하는 방법Apr 17, 2025 am 11:23 AM

마감일을 맞이하고 Chatgpt를 사용하여 마케팅 이메일을 만들기로 결정합니다. AI 프롬프트에 "전문 100 단어 마케팅 이메일을 작성하십시오." 결과는 톤이나 struc가없는 일반적인 전문 용어로 가득 찬 문서입니다.

SQL에서 기능 순위SQL에서 기능 순위Apr 17, 2025 am 11:20 AM

소개 수천 건의 거래 및 수많은 기여 요인에서 회사의 최고 영업 담당자를 식별해야한다고 상상해보십시오. 전통적인 방법은 번거 롭습니다. SQL의 순위 기능은 소집을위한 효율적인 솔루션을 제공합니다

잠재적 인 Medicaid는 모성 건강 관리를 위협합니다잠재적 인 Medicaid는 모성 건강 관리를 위협합니다Apr 17, 2025 am 11:18 AM

하원과 상원은 주말 동안 예산 프레임 워크에 동의했습니다. 이 프레임 워크는 부자에게 불균형 적으로 이동하는 세금 감면 비용을 지불하기 위해 지출 삭감을 요구합니다.

눈송이 CEO는 AI ROI가 데이터를 올바르게 얻는 것으로 시작한다고 말합니다.눈송이 CEO는 AI ROI가 데이터를 올바르게 얻는 것으로 시작한다고 말합니다.Apr 17, 2025 am 11:13 AM

눈송이 CEO는 "AI는 빅뱅이되어서는 안됩니다." "그것은 모든 단계의 가치를 보여주는 일련의 작은 프로젝트 여야합니다." 그러나 Ramaswamy가 지적했듯이, 그것은주의처럼 들릴지 모르지만 실제로는 전략입니다. 인터에서

매일 20,000 개의 AI 생성 된 노래가 Deezer에 업로드되었습니다매일 20,000 개의 AI 생성 된 노래가 Deezer에 업로드되었습니다Apr 17, 2025 am 11:11 AM

Deezer의 최고 혁신 책임자 인 Aurelien Herault는 성명서에서“AI 생성 콘텐츠는 Deezer와 같은 스트리밍 플랫폼을 계속 홍수로 만들고 있습니다. 홍수의 조짐은 없지만 Deezer는

See all articles

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

인기 기사

R.E.P.O. 에너지 결정과 그들이하는 일 (노란색 크리스탈)
1 몇 달 전By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 최고의 그래픽 설정
1 몇 달 전By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 아무도들을 수없는 경우 오디오를 수정하는 방법
1 몇 달 전By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. 채팅 명령 및 사용 방법
1 몇 달 전By尊渡假赌尊渡假赌尊渡假赌

뜨거운 도구

SecList

SecList

SecLists는 최고의 보안 테스터의 동반자입니다. 보안 평가 시 자주 사용되는 다양한 유형의 목록을 한 곳에 모아 놓은 것입니다. SecLists는 보안 테스터에게 필요할 수 있는 모든 목록을 편리하게 제공하여 보안 테스트를 더욱 효율적이고 생산적으로 만드는 데 도움이 됩니다. 목록 유형에는 사용자 이름, 비밀번호, URL, 퍼징 페이로드, 민감한 데이터 패턴, 웹 셸 등이 포함됩니다. 테스터는 이 저장소를 새로운 테스트 시스템으로 간단히 가져올 수 있으며 필요한 모든 유형의 목록에 액세스할 수 있습니다.

WebStorm Mac 버전

WebStorm Mac 버전

유용한 JavaScript 개발 도구

mPDF

mPDF

mPDF는 UTF-8로 인코딩된 HTML에서 PDF 파일을 생성할 수 있는 PHP 라이브러리입니다. 원저자인 Ian Back은 자신의 웹 사이트에서 "즉시" PDF 파일을 출력하고 다양한 언어를 처리하기 위해 mPDF를 작성했습니다. HTML2FPDF와 같은 원본 스크립트보다 유니코드 글꼴을 사용할 때 속도가 느리고 더 큰 파일을 생성하지만 CSS 스타일 등을 지원하고 많은 개선 사항이 있습니다. RTL(아랍어, 히브리어), CJK(중국어, 일본어, 한국어)를 포함한 거의 모든 언어를 지원합니다. 중첩된 블록 수준 요소(예: P, DIV)를 지원합니다.

VSCode Windows 64비트 다운로드

VSCode Windows 64비트 다운로드

Microsoft에서 출시한 강력한 무료 IDE 편집기

DVWA

DVWA

DVWA(Damn Vulnerable Web App)는 매우 취약한 PHP/MySQL 웹 애플리케이션입니다. 주요 목표는 보안 전문가가 법적 환경에서 자신의 기술과 도구를 테스트하고, 웹 개발자가 웹 응용 프로그램 보안 프로세스를 더 잘 이해할 수 있도록 돕고, 교사/학생이 교실 환경 웹 응용 프로그램에서 가르치고 배울 수 있도록 돕는 것입니다. 보안. DVWA의 목표는 다양한 난이도의 간단하고 간단한 인터페이스를 통해 가장 일반적인 웹 취약점 중 일부를 연습하는 것입니다. 이 소프트웨어는