Heim >Technologie-Peripheriegeräte >KI >Wasserstein-Distanz
Die Wasserstein-Distanz, auch bekannt als Earth Mover's Distance, ist eine mathematische Methode zur Messung der Distanz zwischen zwei Wahrscheinlichkeitsverteilungen. Im Vergleich zu herkömmlichen Entfernungsmessmethoden wie der euklidischen Distanz berücksichtigt die Wasserstein-Distanz die Ähnlichkeit zwischen Verteilungen und die Beziehung zwischen geometrischen Abständen umfassender und eignet sich daher besser zur Beschreibung der Ähnlichkeit hochdimensionaler Datensätze. Die Wasserstein-Distanz wird anhand der minimalen Gesamtkosten berechnet, die erforderlich sind, um eine Verteilung in eine andere umzuwandeln. Diese Kosten können als der Aufwand interpretiert werden, der erforderlich ist, um Masse in einer Verteilung von einem Ort zum anderen zu bewegen. Daher kann die Wasserstein-Distanz als die Kosten des Stofftransfers zwischen zwei Verteilungen angesehen werden. Dies macht die Wasserstein-Distanz in vielen Bereichen weit verbreitet, einschließlich Bildverarbeitung, Verarbeitung natürlicher Sprache, Wirtschaft usw. Durch Berücksichtigung der Ähnlichkeit und des geometrischen Abstands zwischen Verteilungen
Die Definition des Wasserstein-Abstands basiert auf der Minimierung der Kosten, die für die Umwandlung einer Verteilung in eine andere erforderlich sind. Diese Kosten können beliebig sein, beziehen sich jedoch normalerweise auf die Kosten für die Bewegung von Masse von einem Ort zu einem anderen in einer Verteilung, die als Produkt des Abstands zwischen den beiden Orten und der Masse ausgedrückt werden können. Der Wert der Wasserstein-Distanz entspricht dem Mindestwert der Kosten aller möglichen Transformationslösungen.
Mathematisch kann die Wasserstein-Distanz wie folgt definiert werden:
W_p(mu,nu)=left(inf_{gammainGamma(mu,nu)}int_{mathbb{R}^d mal mathbb{R}^ d} |x-y|^p dgamma(x,y)right)^{1/p}
Unter diesen sind mu und nu zwei Wahrscheinlichkeitsverteilungen, und Gamma(mu,nu) sind alle Faktoren, die mu umwandeln zu nu Eine Reihe von Wahrscheinlichkeitsverteilungen. Gamma (x, y) stellt die Konvertierungswahrscheinlichkeit dar, die (x, y) entspricht. In der Wasserstein-Distanz ist p geq 1 eine Konstante, normalerweise p=1 oder p=2. Wenn p=1, wird die Wasserstein-Distanz auch als Erdbewegungsdistanz bezeichnet, da sie als Maß für die Mindestanzahl an Operationen angesehen werden kann, die erforderlich sind, um eine Verteilung in eine andere zu verschieben.
Um das Konzept der Wasserstein-Distanz besser zu verstehen, können wir ein einfaches Beispiel betrachten: Angenommen, wir haben zwei eindimensionale Wahrscheinlichkeitsverteilungen P und Q, die in den Intervallen [0,1] bzw. [0,5,1,5] liegen. gleichmäßig auf der Oberseite verteilen. Wir können Python- und Scipy-Bibliotheken verwenden, um den Wasserstein-Abstand zwischen ihnen zu berechnen.
import numpy as np from scipy.stats import wasserstein_distance # 定义两个概率分布 P 和 Q P = np.ones(100) / 100 Q = np.ones(100) / 100 Q[50:] = 0 # 计算它们之间的Wasserstein-Distanz w_dist = wasserstein_distance(P, Q) print("Wasserstein distance:", w_dist)
In diesem Beispiel haben wir die Numpy-Bibliothek verwendet, um zwei Wahrscheinlichkeitsverteilungen mit 100 Elementen zu generieren, die beide gleichmäßig verteilt sind. Dann setzen wir die letzten 50 Elemente der zweiten Verteilung Q auf 0, um ihre Verteilung im Intervall [0,5,1] zu simulieren. Schließlich berechnen wir den Wasserstein-Abstand zwischen ihnen mithilfe der Funktion wasserstein_distance in der Scipy-Bibliothek. Nachdem wir den Code ausgeführt haben, können wir die Ausgabe erhalten:
Wasserstein distance: 0.5
Das bedeutet, dass die minimalen Kosten, die erforderlich sind, um die Verteilung P in die Verteilung Q umzuwandeln, 0,5 betragen. In diesem Beispiel können wir es als den Mindestabstand interpretieren, der erforderlich ist, um einen Hügel der Länge 0,5 in eine Grube der Länge 0,5 zu bewegen.
Kurz gesagt ist die Wasserstein-Distanz eine Methode zur Messung des Abstands zwischen zwei Wahrscheinlichkeitsverteilungen, die die Beziehung zwischen der Ähnlichkeit und dem geometrischen Abstand zwischen Verteilungen berücksichtigt. Es gibt viele Anwendungen, beispielsweise Verlustfunktionen in generativen kontradiktorischen Netzwerken (GAN) und Ähnlichkeitsmaße beim Bildabruf.
Das obige ist der detaillierte Inhalt vonWasserstein-Distanz. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!