Heim >Technologie-Peripheriegeräte >KI >Der gesamte Prozess der Bereitstellung von Yolov auf dem iPhone oder Terminal wird geübt

Der gesamte Prozess der Bereitstellung von Yolov auf dem iPhone oder Terminal wird geübt

WBOY
WBOYOriginal
2024-06-05 16:17:14556Durchsuche

Der lang erwartete Erkennungsklassiker hat eine weitere Angriffswelle – YOLOv5. Unter diesen verfügt YOLOv5 nicht über vollständige Dateien. Das Wichtigste ist nun, YOLOv4 herauszufinden, was im Bereich der Zielerkennung große Vorteile bringt und in bestimmten Szenarien erheblich verbessert werden kann. Heute werden wir YOLOv4 für Sie analysieren. In der nächsten Ausgabe werden wir die Bereitstellung von YOLOv5 auf Apple-Handys üben oder es in Echtzeit über die Kamera am Terminal erkennen!

1. Technology Review

Es gibt eine große Anzahl von Funktionen, die die Genauigkeit von Convolutional Neural Networks (CNN) verbessern sollen. Kombinationen dieser Merkmale müssen an großen Datensätzen praktisch getestet und die Ergebnisse theoretisch validiert werden. Einige Funktionen funktionieren nur bei bestimmten Modellen, bei bestimmten Problemen oder bei kleinen Datensätzen, während andere Funktionen, wie etwa Batch-Normalisierung und Restverknüpfungen, bei den meisten Modellen, Aufgaben und Datensätzen funktionieren. In diesem Artikel wird davon ausgegangen, dass zu diesen gemeinsamen Merkmalen gewichtete Restverbindungen (WRC), stufenübergreifende Verbindungen (CSP), Cross-Minibatch-Normalisierung (CMbN), selbstgegnerisches Training (SAT) und Mish-Aktivierung gehören. Dieses Papier verwendet neue Funktionen: WRC, CSP, CMbN, SAT, Fehleraktivierung, Mosaikdatenerweiterung, CMbN, DropBlock-Regularisierung und CIoU-Verlust und kombiniert einige davon, um den folgenden Effekt zu erzielen: 43,5 % AP (65,7 % AP50), verwendet MS+COCO-Datensatz, Echtzeitgeschwindigkeit von 65 FPS auf dem Tesla V100. 2. Analyse innovativer Punkte Dies ist eine Verbesserung auf der Grundlage von CutMix, das zwei Bilder mischt Bild. Dann trainieren Sie auf diesem Bild. Diese Methode ist die Hauptmethode der Bildstilisierung und ermöglicht es dem Netzwerk, das Bild umgekehrt zu aktualisieren, um das Bild zu stilisieren.

Der gesamte Prozess der Bereitstellung von Yolov auf dem iPhone oder Terminal wird geübtSelf-Adversarial Training (SAT) stellt ebenfalls eine neue Datenerweiterungstechnik dar, die in zwei Vorwärts-Rückwärts-Stufen arbeitet. In der 1. Stufe verändert das neuronale Netzwerk das Originalbild anstelle der Netzwerkgewichte ein gegnerischer Angriff auf sich selbst, der das Originalbild verändert, um die Täuschung zu erzeugen, dass es kein gewünschtes Objekt auf dem Bild gibt. In der 2. Stufe wird das neuronale Netzwerk darauf trainiert, ein Objekt auf diesem modifizierten Bild auf normale Weise zu erkennen.

Cross Mini-Batch Normal

CmBN stellt die modifizierte Version von CBN dar, wie in der Abbildung unten gezeigt, definiert als Cross Mini-Batch Normalization (CMBN). Dadurch werden nur Statistiken zwischen den kleinsten Chargen innerhalb einer einzelnen Charge erfasst. ?? concat.

Der gesamte Prozess der Bereitstellung von Yolov auf dem iPhone oder Terminal wird geübt Experiment

Nehmen wir als Beispiel die Datenverbesserungsmethode: Obwohl sie die Trainingszeit verlängert, kann sie die Leistung und Robustheit der Modellverallgemeinerung verbessern. Zum Beispiel die folgenden gängigen Verbesserungsmethoden:

  • Bildstörung,
  • Helligkeit, Kontrast, Sättigung, Farbton ändern
  • Rauschen hinzufügen
  • Zufällige Skalierung
  • zufälliger Zuschnitt.
  • Flip
  • Rotation
  • zufälliges Löschen
  • Cutout
  • MixUp
  • CutMix

Durch Experimente kann man sehen, dass es viele Tricks verwendet. Das stärkste Zielerkennungs-Kaleidoskop, die folgende Tabelle ist ein Experiment zum Klassifizierungsnetzwerk:

CSPResNeXt-50-Klassifikatorgenauigkeit

Der gesamte Prozess der Bereitstellung von Yolov auf dem iPhone oder Terminal wird geübt

CSPDarknet-53-Klassifikatorgenauigkeit

Der gesamte Prozess der Bereitstellung von Yolov auf dem iPhone oder Terminal wird geübt

Im YOLOv4-Erkennungsnetzwerk vier Verluste (GIoU, CIoU, DIoU, MSE), Etikettenglättung, Kosinus-Lernen Rate, genetische Algorithmus-Hyperparameterauswahl, Mosaikdatenverbesserung und andere Methoden. Die folgende Tabelle enthält die Ergebnisse des Ablationsexperiments im YOLOv4-Erkennungsnetzwerk:

CSPResNeXt50-PANet-SPP, 512x512

Der gesamte Prozess der Bereitstellung von Yolov auf dem iPhone oder Terminal wird geübt


Der gesamte Prozess der Bereitstellung von Yolov auf dem iPhone oder Terminal wird geübt

Verwendung verschiedener Trainingsgewichtsmodelle für das Training:

Der gesamte Prozess der Bereitstellung von Yolov auf dem iPhone oder Terminal wird geübt

Ergebnisse verschiedener Mini-Batch-Größen:

Der gesamte Prozess der Bereitstellung von Yolov auf dem iPhone oder Terminal wird geübt

Abschließend der Vergleich der Ergebnisse des COCO-Datensatzes für drei verschiedene GPU-Serien, Maxwell, Pascal und Volta:

Der gesamte Prozess der Bereitstellung von Yolov auf dem iPhone oder Terminal wird geübt

Die Das Aufregendste ist, dass im COCO-Datensatz ein Vergleich (Geschwindigkeit und Genauigkeit) mit anderen Frameworks möglich ist:

Das obige ist der detaillierte Inhalt vonDer gesamte Prozess der Bereitstellung von Yolov auf dem iPhone oder Terminal wird geübt. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn