suchen
HeimTechnologie-PeripheriegeräteKIVerzichten Sie auf die Encoder-Decoder-Architektur und verwenden Sie das Diffusionsmodell zur Kantenerkennung, das effektiver ist. Die National University of Defense Technology hat DiffusionEdge vorgeschlagen

Aktuelle Deep-Edge-Erkennungsnetzwerke verwenden normalerweise eine Encoder-Decoder-Architektur, die Up- und Down-Sampling-Module enthält, um mehrstufige Funktionen besser zu extrahieren. Diese Struktur schränkt jedoch die Ausgabe genauer und detaillierter Kantenerkennungsergebnisse des Netzwerks ein.

Als Antwort auf dieses Problem bietet ein Vortrag auf der AAAI 2024 eine neue Lösung.

Verzichten Sie auf die Encoder-Decoder-Architektur und verwenden Sie das Diffusionsmodell zur Kantenerkennung, das effektiver ist. Die National University of Defense Technology hat DiffusionEdge vorgeschlagen


  • Papiertitel: DiffusionEdge: Diffusion Probabilistic Model for Crisp Edge Detection
  • Autoren: Ye Yunfan (National University of Defense Technology), Xu Kai (National University of Defense Technology), Huang Yuxing (Nationale Universität für Verteidigungstechnologie), Yi Renjiao (Nationale Universität für Verteidigungstechnologie), Cai Zhiping (Nationale Universität für Verteidigungstechnologie)
  • Link zum Papier: https://arxiv.org/abs/2401.02032
  • Open-Source-Code: https://github.com/ GuHuangAI/DiffusionEdge

Das iGRAPE Lab der National University of Defense Technology hat eine neue Methode für 2D-Kantenerkennungsaufgaben vorgeschlagen. Diese Methode nutzt ein Diffusionswahrscheinlichkeitsmodell, um Kantenergebniskarten während eines lernenden iterativen Entrauschungsprozesses zu generieren. Um den Verbrauch von Rechenressourcen zu reduzieren, nutzt diese Methode latenten Raum zum Trainieren des Netzwerks und führt ein Modul zur Unsicherheitsdestillation ein, um die Leistung zu optimieren. Gleichzeitig verwendet diese Methode auch eine entkoppelte Architektur, um den Entrauschungsprozess zu beschleunigen, und führt einen adaptiven Fourier-Filter zur Anpassung der Merkmale ein. Mit diesen Designs ist die Methode in der Lage, mit begrenzten Ressourcen stabil zu trainieren und mit weniger Erweiterungsstrategien klare und genaue Kantenkarten vorherzusagen. Experimentelle Ergebnisse zeigen, dass diese Methode andere Methoden in Bezug auf Genauigkeit und Präzision bei vier öffentlichen Benchmark-Datensätzen deutlich übertrifft.

Verzichten Sie auf die Encoder-Decoder-Architektur und verwenden Sie das Diffusionsmodell zur Kantenerkennung, das effektiver ist. Die National University of Defense Technology hat DiffusionEdge vorgeschlagen

Abbildung 1 Beispiel eines Kantenerkennungsprozesses und Vorteile basierend auf dem Diffusionswahrscheinlichkeitsmodell

Zu den Innovationspunkten dieses Artikels gehören:

Vorgeschlagenes Diffusionsmodell DiffusionEdge für Kantenerkennungsaufgaben, was nicht der Fall ist erfordern eine Nachbearbeitung. Dadurch können Sie dünnere und genauere Kantenkarten vorhersagen.

Um die Schwierigkeiten bei der Anwendung des Diffusionsmodells zu lösen, haben wir verschiedene Techniken entwickelt, um sicherzustellen, dass die Methode im latenten Raum stabil lernt. Gleichzeitig behalten wir auch das Vorwissen zur Unsicherheit auf Pixelebene bei und filtern latente Merkmale im Fourier-Raum adaptiv.

3. Umfangreiche Vergleichsexperimente, die an vier öffentlichen Benchmark-Datensätzen zur Kantenerkennung durchgeführt wurden, zeigen, dass DiffusionEdge hervorragende Leistungsvorteile in Bezug auf Genauigkeit und Feinheit aufweist.

Verwandte Arbeiten

Auf Deep Learning basierende Methoden verwenden normalerweise eine Kodierungs- und Dekodierungsstruktur einschließlich Up- und Down-Sampling, um mehrschichtige Merkmale zu integrieren [1-2], oder integrieren Unsicherheitsinformationen aus mehreren Annotationen, um die Kantenerkennung zu verbessern . Genauigkeit[3]. Aufgrund einer solchen Struktur ist die generierte Kantenergebniskarte jedoch zu umfangreich für nachgelagerte Aufgaben und hängt stark von der Nachbearbeitung ab. Das Problem muss noch gelöst werden. Obwohl viele Arbeiten zu Verlustfunktionen [4-5] und Etikettenkorrekturstrategien [6] untersucht wurden, um dem Netzwerk die Ausgabe feinerer Kanten zu ermöglichen, ist dieser Artikel der Ansicht, dass dieses Feld immer noch eine Methode benötigt, die ohne zusätzliche Module verwendet werden kann Detektoren, die ohne Nachbearbeitungsschritte direkt Genauigkeit und Feinheit erreichen.

Das Diffusionsmodell ist eine Art generatives Modell, das auf der Markov-Kette basiert und Zieldatenproben durch den lernenden Rauschunterdrückungsprozess schrittweise wiederherstellt. Diffusionsmodelle haben in Bereichen wie Computer Vision, Verarbeitung natürlicher Sprache und Audioerzeugung hervorragende Leistungen gezeigt. Durch die Verwendung von Bildern oder anderen modalen Eingaben als zusätzliche Bedingungen zeigt es nicht nur ein großes Potenzial für Wahrnehmungsaufgaben wie Bildsegmentierung [7], Zielerkennung [8] und Lageschätzung [9] usw. .

Methodenbeschreibung

Der Gesamtrahmen der in diesem Artikel vorgeschlagenen DiffusionEdge-Methode ist in Abbildung 2 dargestellt. Inspiriert durch frühere Arbeiten trainiert diese Methode ein Diffusionsmodell mit entkoppelter Struktur im latenten Raum und gibt Bilder als zusätzliche bedingte Hinweise ein. Diese Methode führt einen adaptiven Fourier-Filter für die Frequenzanalyse ein. Um Unsicherheitsinformationen auf Pixelebene von mehreren Annotatoren beizubehalten und den Bedarf an Rechenressourcen zu reduzieren, wird auch direkt die Kreuzentropieverlustoptimierung in destillierter Weise verwendet.

Verzichten Sie auf die Encoder-Decoder-Architektur und verwenden Sie das Diffusionsmodell zur Kantenerkennung, das effektiver ist. Die National University of Defense Technology hat DiffusionEdge vorgeschlagen

Abbildung 2 Schematische Darstellung der Gesamtstruktur von DiffusionEdge

Da das aktuelle Diffusionsmodell mit Problemen wie zu vielen Abtastschritten und zu langen Inferenzzeiten behaftet ist, ist diese Methode von DDM [10] inspiriert und verwendet auch entkoppelte Methoden Diffusion. Modellarchitektur zur Beschleunigung des Sampling-Inferenzprozesses. Unter diesen wird der entkoppelte Vorwärtsdiffusionsprozess durch eine Kombination aus expliziter Übergangswahrscheinlichkeit und Standard-Wiener-Prozess gesteuert:

Verzichten Sie auf die Encoder-Decoder-Architektur und verwenden Sie das Diffusionsmodell zur Kantenerkennung, das effektiver ist. Die National University of Defense Technology hat DiffusionEdge vorgeschlagen

wobei Verzichten Sie auf die Encoder-Decoder-Architektur und verwenden Sie das Diffusionsmodell zur Kantenerkennung, das effektiver ist. Die National University of Defense Technology hat DiffusionEdge vorgeschlagen und Verzichten Sie auf die Encoder-Decoder-Architektur und verwenden Sie das Diffusionsmodell zur Kantenerkennung, das effektiver ist. Die National University of Defense Technology hat DiffusionEdge vorgeschlagen die Anfangskante bzw. Rauschkante darstellen, Verzichten Sie auf die Encoder-Decoder-Architektur und verwenden Sie das Diffusionsmodell zur Kantenerkennung, das effektiver ist. Die National University of Defense Technology hat DiffusionEdge vorgeschlagen sich auf die Rückwärtskante bezieht Ein expliziter Übertragungsfunktion für Gradienten. Ähnlich wie DDM verwendet diese Methode standardmäßig die konstante Funktion Verzichten Sie auf die Encoder-Decoder-Architektur und verwenden Sie das Diffusionsmodell zur Kantenerkennung, das effektiver ist. Die National University of Defense Technology hat DiffusionEdge vorgeschlagen, und der entsprechende umgekehrte Prozess kann ausgedrückt werden als:

Verzichten Sie auf die Encoder-Decoder-Architektur und verwenden Sie das Diffusionsmodell zur Kantenerkennung, das effektiver ist. Die National University of Defense Technology hat DiffusionEdge vorgeschlagen

wobei Verzichten Sie auf die Encoder-Decoder-Architektur und verwenden Sie das Diffusionsmodell zur Kantenerkennung, das effektiver ist. Die National University of Defense Technology hat DiffusionEdge vorgeschlagen. Um das entkoppelte Diffusionsmodell zu trainieren, erfordert die Methode eine gleichzeitige Überwachung der Daten- und Rauschkomponenten. Daher kann das Trainingsziel wie folgt parametrisiert werden:

Verzichten Sie auf die Encoder-Decoder-Architektur und verwenden Sie das Diffusionsmodell zur Kantenerkennung, das effektiver ist. Die National University of Defense Technology hat DiffusionEdge vorgeschlagen

wobei Verzichten Sie auf die Encoder-Decoder-Architektur und verwenden Sie das Diffusionsmodell zur Kantenerkennung, das effektiver ist. Die National University of Defense Technology hat DiffusionEdge vorgeschlagen der Parameter im Entrauschungsnetzwerk ist. Da das Diffusionsmodell zu viel Rechenaufwand erfordert, wenn es im ursprünglichen Bildraum trainiert wird, überträgt die in diesem Artikel vorgeschlagene Methode unter Bezugnahme auf die Idee von [11] den Trainingsprozess auf einen latenten Raum mit dem Vierfachen Größe des Downsampling-Raums.

Wie in Abbildung 2 gezeigt, trainiert diese Methode zunächst ein Paar Autoencoder- und Decoder-Netzwerke. Der Encoder komprimiert die Kantenanmerkung in eine latente Variable und der Decoder wird verwendet, um die ursprüngliche Kantenanmerkung wiederherzustellen . Auf diese Weise legt diese Methode während der Trainingsphase des Entrauschungsnetzwerks basierend auf der U-Net-Struktur das Gewicht des Paares von Autoencoder- und Decoder-Netzwerken fest und trainiert den Entrauschungsprozess im latenten Raum, was den Rechenaufwand erheblich reduzieren kann Kosten des Netzwerkressourcenverbrauchs bei gleichzeitiger Aufrechterhaltung einer guten Leistung.

Um die endgültige Leistung des Netzwerks zu verbessern, führt die in diesem Artikel vorgeschlagene Methode ein Modul ein, das verschiedene Frequenzmerkmale im Entkopplungsvorgang adaptiv herausfiltern kann. Wie in der unteren linken Ecke von Abbildung 2 dargestellt, integriert diese Methode den adaptiven Fast-Fourier-Transformationsfilter (Adaptive FFT-Filter) vor der Entkopplungsoperation in das Entrauschungsnetzwerk, um die Out-Edge-Map und das Rauschen adaptiv zu filtern und zu trennen Komponenten. Insbesondere führt die Methode angesichts des Encodermerkmals Verzichten Sie auf die Encoder-Decoder-Architektur und verwenden Sie das Diffusionsmodell zur Kantenerkennung, das effektiver ist. Die National University of Defense Technology hat DiffusionEdge vorgeschlagen zunächst eine zweidimensionale Fourier-Transformation (FFT) entlang der räumlichen Dimension durch und stellt das transformierte Merkmal als Verzichten Sie auf die Encoder-Decoder-Architektur und verwenden Sie das Diffusionsmodell zur Kantenerkennung, das effektiver ist. Die National University of Defense Technology hat DiffusionEdge vorgeschlagen dar. Als nächstes wird zum Trainieren dieses adaptiven Spektrumfiltermoduls eine lernbare Gewichtskarte Verzichten Sie auf die Encoder-Decoder-Architektur und verwenden Sie das Diffusionsmodell zur Kantenerkennung, das effektiver ist. Die National University of Defense Technology hat DiffusionEdge vorgeschlagen erstellt und ihr W mit Fc multipliziert. Spektralfilter können bestimmte Frequenzen global anpassen und die erlernten Gewichte können an unterschiedliche Häufigkeitsfälle von Zielverteilungen in verschiedenen Datensätzen angepasst werden. Durch das adaptive Herausfiltern unerwünschter Komponenten ordnet diese Methode mithilfe einer inversen schnellen Fourier-Transformationsoperation (IFFT) Merkmale aus dem Frequenzbereich zurück in den räumlichen Bereich. Schließlich vermeiden wir durch die zusätzliche Einführung der Restverbindung aus, dass alle nützlichen Informationen vollständig herausgefiltert werden. Der obige Prozess kann durch die folgende Formel beschrieben werden:

Verzichten Sie auf die Encoder-Decoder-Architektur und verwenden Sie das Diffusionsmodell zur Kantenerkennung, das effektiver ist. Die National University of Defense Technology hat DiffusionEdge vorgeschlagen

wobei Verzichten Sie auf die Encoder-Decoder-Architektur und verwenden Sie das Diffusionsmodell zur Kantenerkennung, das effektiver ist. Die National University of Defense Technology hat DiffusionEdge vorgeschlagen das Ausgabemerkmal ist und o das Hadamard-Produkt darstellt.

Aufgrund des hohen Ungleichgewichts in der Anzahl der Kanten- und Nichtkantenpixel (die meisten Pixel sind Nichtkantenhintergrund) führen wir unter Bezugnahme auf frühere Arbeiten auch eine unsichere Verlustfunktion für das Training ein. Da der Wert der wahren Wertkantenwahrscheinlichkeit des i-ten Pixels für das i-te Pixel in der j-ten Kantenkarte Verzichten Sie auf die Encoder-Decoder-Architektur und verwenden Sie das Diffusionsmodell zur Kantenerkennung, das effektiver ist. Die National University of Defense Technology hat DiffusionEdge vorgeschlagen ist, wird der unsichere WCE-Verlust wie folgt berechnet:


Verzichten Sie auf die Encoder-Decoder-Architektur und verwenden Sie das Diffusionsmodell zur Kantenerkennung, das effektiver ist. Die National University of Defense Technology hat DiffusionEdge vorgeschlagen


wobei Verzichten Sie auf die Encoder-Decoder-Architektur und verwenden Sie das Diffusionsmodell zur Kantenerkennung, das effektiver ist. Die National University of Defense Technology hat DiffusionEdge vorgeschlagen, wobei Verzichten Sie auf die Encoder-Decoder-Architektur und verwenden Sie das Diffusionsmodell zur Kantenerkennung, das effektiver ist. Die National University of Defense Technology hat DiffusionEdge vorgeschlagen der Schwellenwert ist, der die unsicheren Kantenpixel in der wahren Wertanmerkung bestimmt. Wenn der Pixelwert größer als 0 und kleiner als dieser Schwellenwert ist, werden solche unscharfen Pixelproben mit unzureichender Zuverlässigkeit in der nachfolgenden Optimierung verwendet Prozess wird ignoriert (die Verlustfunktion ist 0). Verzichten Sie auf die Encoder-Decoder-Architektur und verwenden Sie das Diffusionsmodell zur Kantenerkennung, das effektiver ist. Die National University of Defense Technology hat DiffusionEdge vorgeschlagen und Verzichten Sie auf die Encoder-Decoder-Architektur und verwenden Sie das Diffusionsmodell zur Kantenerkennung, das effektiver ist. Die National University of Defense Technology hat DiffusionEdge vorgeschlagen stellen jeweils die Anzahl der Kanten- und Nichtkantenpixel in der mit der Grundwahrheit kommentierten Kantenkarte dar. ist das Gewicht, das zum Ausbalancieren von Verzichten Sie auf die Encoder-Decoder-Architektur und verwenden Sie das Diffusionsmodell zur Kantenerkennung, das effektiver ist. Die National University of Defense Technology hat DiffusionEdge vorgeschlagen und Verzichten Sie auf die Encoder-Decoder-Architektur und verwenden Sie das Diffusionsmodell zur Kantenerkennung, das effektiver ist. Die National University of Defense Technology hat DiffusionEdge vorgeschlagen verwendet wird (auf 1,1 eingestellt). Daher wird die endgültige Verlustfunktion für jede Kantenkarte als Verzichten Sie auf die Encoder-Decoder-Architektur und verwenden Sie das Diffusionsmodell zur Kantenerkennung, das effektiver ist. Die National University of Defense Technology hat DiffusionEdge vorgeschlagen berechnet.

Das Ignorieren verschwommener Pixel mit geringer Konfidenz während des Optimierungsprozesses kann Netzwerkverwirrungen vermeiden, die Konvergenz des Trainingsprozesses stabiler machen und die Leistung des Modells verbessern. Es ist jedoch nahezu unmöglich, den binären Kreuzentropieverlust direkt auf einen latenten Raum anzuwenden, der sowohl numerisch als auch räumlich falsch ausgerichtet ist. Insbesondere verwendet der unsicherheitsbewusste Kreuzentropieverlust einen Schwellenwert Verzichten Sie auf die Encoder-Decoder-Architektur und verwenden Sie das Diffusionsmodell zur Kantenerkennung, das effektiver ist. Die National University of Defense Technology hat DiffusionEdge vorgeschlagen (im Allgemeinen von 0 bis 1), um zu bestimmen, ob ein Pixel eine Kante ist, die aus dem Bildraum definiert ist, während die latenten Variablen einer Normalverteilung folgen und vollständig sind unterschiedlicher Umfang und praktischer Bedeutung. Darüber hinaus lässt sich die Unsicherheit auf Pixelebene nur schwer mit unterschiedlichen Größen codierter und heruntergetasteter latenter Merkmale in Einklang bringen, und beide sind nicht direkt kompatibel. Daher führt die direkte Anwendung des Kreuzentropieverlusts zur Optimierung latenter Variablen zwangsläufig zu einer falschen Wahrnehmung der Unsicherheit.

Andererseits kann man sich dafür entscheiden, die latenten Variablen zurück auf die Bildebene zu dekodieren und so die vorhergesagte Kantenergebniskarte mithilfe eines unsicherheitsbewussten Kreuzentropieverlusts direkt zu überwachen. Leider ermöglicht diese Implementierung, dass die rückwärts propagierten Parametergradienten das redundante Autoencoder-Netzwerk durchlaufen, was eine effektive Übertragung der Gradienten erschwert. Darüber hinaus führen zusätzliche Gradientenberechnungen im Autoencoder-Netzwerk zu enormen Kosten für den GPU-Speicherverbrauch, was der ursprünglichen Absicht dieser Methode, einen praktischen Kantendetektor zu entwerfen, zuwiderläuft und sich nur schwer auf praktische Anwendungen übertragen lässt. Daher schlägt diese Methode einen Unsicherheitsdestillationsverlust vor, der den Gradienten im latenten Raum direkt optimieren kann. Die rekonstruierte latente Variable sei Verzichten Sie auf die Encoder-Decoder-Architektur und verwenden Sie das Diffusionsmodell zur Kantenerkennung, das effektiver ist. Die National University of Defense Technology hat DiffusionEdge vorgeschlagen, der Decoder des Autoencoder-Netzwerks sei D und das decodierte Kantenergebnis sei eD Erwägt die direkte Berechnung des Gradienten des unsicherheitsbewussten binären Kreuzentropieverlusts Verzichten Sie auf die Encoder-Decoder-Architektur und verwenden Sie das Diffusionsmodell zur Kantenerkennung, das effektiver ist. Die National University of Defense Technology hat DiffusionEdge vorgeschlagen basierend auf der Kettenregel. Die spezifische Berechnungsmethode lautet:

Verzichten Sie auf die Encoder-Decoder-Architektur und verwenden Sie das Diffusionsmodell zur Kantenerkennung, das effektiver ist. Die National University of Defense Technology hat DiffusionEdge vorgeschlagen

Um die negativen Auswirkungen des Autoencoder-Netzwerks zu beseitigen, wird diese Methode verwendet Der Autoencoder Verzichten Sie auf die Encoder-Decoder-Architektur und verwenden Sie das Diffusionsmodell zur Kantenerkennung, das effektiver ist. Die National University of Defense Technology hat DiffusionEdge vorgeschlagen wird direkt übersprungen, um den Gradienten zu übergeben, und die Berechnungsmethode des Gradienten Verzichten Sie auf die Encoder-Decoder-Architektur und verwenden Sie das Diffusionsmodell zur Kantenerkennung, das effektiver ist. Die National University of Defense Technology hat DiffusionEdge vorgeschlagen wird geändert und angepasst an:

Verzichten Sie auf die Encoder-Decoder-Architektur und verwenden Sie das Diffusionsmodell zur Kantenerkennung, das effektiver ist. Die National University of Defense Technology hat DiffusionEdge vorgeschlagen

Eine solche Implementierung reduziert den Rechenaufwand erheblich und ermöglicht die direkte Optimierung latenter Variablen mithilfe unsicherheitsbewusster Verlustfunktionen. Auf diese Weise kann das endgültige Trainingsoptimierungsziel dieser Methode in Kombination mit einem zeitlich variierenden Verlustgewicht Verzichten Sie auf die Encoder-Decoder-Architektur und verwenden Sie das Diffusionsmodell zur Kantenerkennung, das effektiver ist. Die National University of Defense Technology hat DiffusionEdge vorgeschlagen, das sich adaptiv mit der Anzahl der Schritte t ändert, wie folgt ausgedrückt werden:

Verzichten Sie auf die Encoder-Decoder-Architektur und verwenden Sie das Diffusionsmodell zur Kantenerkennung, das effektiver ist. Die National University of Defense Technology hat DiffusionEdge vorgeschlagen

Experimentelle Ergebnisse

Dies Die Methode umfasst vier Experimente, die mit öffentlichen Standarddatensätzen zur Kantenerkennung durchgeführt wurden, die in diesem Bereich weit verbreitet sind: BSDS, NYUDv2, Multicue und BIPED. Da es schwierig ist, Kantenerkennungsdaten zu kennzeichnen und die Menge der gekennzeichneten Daten relativ gering ist, verwenden frühere Methoden normalerweise verschiedene Strategien, um den Datensatz zu verbessern. Beispielsweise werden Bilder in BSDS durch horizontales Spiegeln (2×), Skalieren (3×) und Drehen (16×) verbessert, was zu einem Trainingssatz führt, der 96-mal größer ist als die Originalversion. Gängige Verbesserungsstrategien, die von früheren Methoden für andere Datensätze verwendet wurden, sind in Tabelle 1 zusammengefasst, wobei F für horizontales Umdrehen, S für Skalierung, R für Rotation, C für Zuschneiden und G für Gammakorrektur steht. Der Unterschied besteht darin, dass diese Methode nur zufällig zugeschnittene Bildfelder von 320320 verwenden muss, um alle Daten zu trainieren. Im BSDS-Datensatz verwendet diese Methode nur zufälliges Umdrehen und Skalieren. Die Ergebnisse des quantitativen Vergleichs sind in Tabelle 2 aufgeführt. In den NYUDv2-, Multicue- und BIPED-Datensätzen muss die Methode nur mit zufälligen Flips trainiert werden. Mit weniger Verbesserungsstrategien schneidet diese Methode bei verschiedenen Datensätzen und verschiedenen Indikatoren besser ab als frühere Methoden. Anhand der Vorhersageergebnisse in Abbildung 3-5 können wir erkennen, dass DiffusionEdge Kantenerkennungsergebnisse erlernen und vorhersagen kann, die nahezu mit denen der GT-Verteilung übereinstimmen. Der Vorteil genauer und klarer Vorhersageergebnisse ist für nachgelagerte Aufgaben, die einer Verfeinerung bedürfen, sehr wichtig . und zeigte auch sein großes Potenzial, direkt auf nachfolgende Aufgaben angewendet zu werden.

Verzichten Sie auf die Encoder-Decoder-Architektur und verwenden Sie das Diffusionsmodell zur Kantenerkennung, das effektiver ist. Die National University of Defense Technology hat DiffusionEdge vorgeschlagen

Tabelle 1: Verbesserungsstrategien, die von früheren Methoden für vier Kantenerkennungsdatensätze verwendet wurden.

Verzichten Sie auf die Encoder-Decoder-Architektur und verwenden Sie das Diffusionsmodell zur Kantenerkennung, das effektiver ist. Die National University of Defense Technology hat DiffusionEdge vorgeschlagen

Tabelle 2: Quantitativer Vergleich verschiedener Methoden für den BSDS-Datensatz Abb. 3 Qualitativer Vergleich verschiedener Methoden am BSDS-Datensatz

Verzichten Sie auf die Encoder-Decoder-Architektur und verwenden Sie das Diffusionsmodell zur Kantenerkennung, das effektiver ist. Die National University of Defense Technology hat DiffusionEdge vorgeschlagen

Abbildung 4 Qualitativer Vergleich verschiedener Methoden am NYUDv2-Datensatz

Verzichten Sie auf die Encoder-Decoder-Architektur und verwenden Sie das Diffusionsmodell zur Kantenerkennung, das effektiver ist. Die National University of Defense Technology hat DiffusionEdge vorgeschlagen

Abbildung 5 Qualitativer Vergleich verschiedener Methoden am BIPED-Datensatz

Verzichten Sie auf die Encoder-Decoder-Architektur und verwenden Sie das Diffusionsmodell zur Kantenerkennung, das effektiver ist. Die National University of Defense Technology hat DiffusionEdge vorgeschlagen

Das obige ist der detaillierte Inhalt vonVerzichten Sie auf die Encoder-Decoder-Architektur und verwenden Sie das Diffusionsmodell zur Kantenerkennung, das effektiver ist. Die National University of Defense Technology hat DiffusionEdge vorgeschlagen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme
Dieser Artikel ist reproduziert unter:51CTO.COM. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen
GROK 2 Bildgenerator: Wutes Elon Musk Holding AR15 gezeigtGROK 2 Bildgenerator: Wutes Elon Musk Holding AR15 gezeigtApr 15, 2025 am 09:45 AM

GROK-2: Unbekundete KI-Image-Generierung spricht die ethische Debatte an Elon Musks XAI hat GROK-2, ein leistungsstarkes KI-Modell mit überdurchschnittlichem Chat-, Codierungs- und Argumentationsfunktion, zusammen mit einem kontroversen, versorteren Bildgenerator auf den Markt gebracht. Diese Veröffentlichung hat

Top 10 Github -Repositories zu Master -Statistiken - Analytics VidhyaTop 10 Github -Repositories zu Master -Statistiken - Analytics VidhyaApr 15, 2025 am 09:44 AM

Statistische Meisterschaft: Top 10 Github -Repositories für Datenwissenschaft Statistiken sind für Datenwissenschaft und maschinelles Lernen von grundlegender Bedeutung. In diesem Artikel werden zehn führende Github -Repositories untersucht, die hervorragende Ressourcen für das Beherrschen statistischer Konzept

Wie wird Robotics Engineer?Wie wird Robotics Engineer?Apr 15, 2025 am 09:41 AM

Robotik: Ein lohnender Karriereweg in einem schnell wachsenden Bereich Das Gebiet der Robotik verzeichnet explosives Wachstum und fördert die Innovation in zahlreichen Sektoren und das tägliche Leben. Von der automatisierten Fertigung bis hin zu medizinischen Robotern und autonomen Fahrzeugen,

Wie entfernt ich Duplikate in Excel? - Analytics VidhyaWie entfernt ich Duplikate in Excel? - Analytics VidhyaApr 15, 2025 am 09:20 AM

Datenintegrität: Entfernen von Duplikaten in Excel zur genauen Analyse Saubere Daten sind für eine effektive Entscheidungsfindung von entscheidender Bedeutung. Doppelte Einträge in Excel -Tabellen können zu Fehlern und unzuverlässigen Analysen führen. Diese Anleitung zeigt Ihnen, wie Sie DUP problemlos entfernen können

Top 10 telefonische Interviewtipps - Analytics VidhyaTop 10 telefonische Interviewtipps - Analytics VidhyaApr 15, 2025 am 09:19 AM

Beherrschen Sie die Kunst des Telefoninterviews: Ihr Leitfaden zum Erfolg Ein erfolgreiches Telefoninterview kann Ihre Chancen auf die nächste Phase des Bewerbungsprozesses erheblich erhöhen. Dieser entscheidende erste Eindruck, oft der einzige Pre-Fac

Wie wird ich Statistiker?Wie wird ich Statistiker?Apr 15, 2025 am 09:15 AM

Einführung Stellen Sie sich vor, Sie hätten die Befugnis, fundierte Entscheidungen für sich und Ihr Unternehmen in Bereichen wie Gesundheitswesen, Finanzen oder Sport zu treffen. Das ist die Rolle eines Statistikers. Mit der zunehmenden Verwendung von Daten in Organisationen die Nachfrage nach Statist

Wie funktioniert KI? - Analytics VidhyaWie funktioniert KI? - Analytics VidhyaApr 15, 2025 am 09:14 AM

Künstliche Intelligenz: Ein umfassender Leitfaden Die Technologie hat es uns ermöglicht, uns eine Welt vorzustellen, in der Maschinen unsere Vorlieben verstehen, unsere Bedürfnisse vorwegnehmen und aus früheren Interaktionen lernen, um bessere Ergebnisse zu erzielen. Dies ist keine Science -Fiction; es ist

Was ist Pictogram -Diagramm? - Analytics VidhyaWas ist Pictogram -Diagramm? - Analytics VidhyaApr 15, 2025 am 09:09 AM

Einführung In der Welt der Datenanalyse ist eine effektive Kommunikation der Schlüssel. Piktogramm -Diagramme bieten eine leistungsstarke Lösung, die Informationen in einem visuell ansprechenden und leicht verdaulichen Format präsentiert. Im Gegensatz zu komplexen Diagrammen und Figuren, Piktogrammen - auch

See all articles

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)
4 Wochen vorBy尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Beste grafische Einstellungen
4 Wochen vorBy尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. So reparieren Sie Audio, wenn Sie niemanden hören können
4 Wochen vorBy尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Wie man alles in Myrise freischaltet
1 Monate vorBy尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

Sicherer Prüfungsbrowser

Sicherer Prüfungsbrowser

Safe Exam Browser ist eine sichere Browserumgebung für die sichere Teilnahme an Online-Prüfungen. Diese Software verwandelt jeden Computer in einen sicheren Arbeitsplatz. Es kontrolliert den Zugriff auf alle Dienstprogramme und verhindert, dass Schüler nicht autorisierte Ressourcen nutzen.

SublimeText3 Linux neue Version

SublimeText3 Linux neue Version

SublimeText3 Linux neueste Version

MantisBT

MantisBT

Mantis ist ein einfach zu implementierendes webbasiertes Tool zur Fehlerverfolgung, das die Fehlerverfolgung von Produkten unterstützen soll. Es erfordert PHP, MySQL und einen Webserver. Schauen Sie sich unsere Demo- und Hosting-Services an.

WebStorm-Mac-Version

WebStorm-Mac-Version

Nützliche JavaScript-Entwicklungstools