Heim > Artikel > Technologie-Peripheriegeräte > Bleiben Sie heute Abend lange wach für Messi und Modric! Mit diesem CV-Modell können Sie gewinnen, indem Sie die Kugel erraten
Vorgestern waren Ronaldos Fans untröstlich.
Bei der Weltmeisterschaft in Katar am 11. Dezember verlor Portugal gegen Marokko und stoppte im Viertelfinale. Ronaldos Weltmeisterschaftsreise endete bedauerlich.
#Cristiano Ronaldo sagte, der Traum sei vorbei # Diese heiße Suche hat unzählige Fans mit gebrochenem Herzen versammelt.
Das Spiel zwischen Portugal und Marokko endete überraschend mit 0:1. Ronaldo weint, Neymar weint, wer wird der Nächste sein?
Bevor ich jedoch die Trauer um Cristiano Ronaldo überwinden kann, gibt es heute Abend ein weiteres Duell zwischen Messi und Modric!
Angst, dass dein Herz es nicht ertragen kann?
Nun, mit einem solchen Modell können Sie möglicherweise bereits in den ersten 5 Minuten des Spiels im Voraus wissen, ob das Spiel eine Überraschung sein wird.
Dieser ausländische Ingenieur für maschinelles Lernen wollte schon immer Computer Vision (CV) mit seinem geliebten Fußball kombinieren.
Vor drei Jahren versuchte er, mit YOLOv3 Sportler auf dem Basketballplatz zu erkennen und zu klassifizieren.
Die aktuelle Fußballweltmeisterschaft brachte ihn dazu, diese Idee wieder aufzugreifen.
Dieses Mal nutzte er eine Kombination aus YOLOv5 und ByteTRACK, um Fußballspieler auf dem Spielfeld zu verfolgen.
Ursprünglich wollte Skalski auf das benutzerdefinierte Modelltraining verzichten.
Er hofft, dass es vom Anfang bis zum Ende nur ein paar Stunden dauert und ein schneller Sieg wird.
Da der beliebte COCO-Datensatz, der zum Trainieren der YOLOv5- und YOLOv7-Modelle verwendet wird, die beiden Klassen enthält, die ihn am meisten interessieren – Person und Sportball –, stimmt ihn das sehr optimistisch, dass das Training vom COCO-Kontrollpunkt aus durchgeführt werden kann.
Er lud schnell Dutzende kurze Fußballspielvideos von Kaggles Bundesliga Data War herunter und nutzte das vorab trainierte Modell zum Testen.
Nachdem er verschiedene Konfigurationen wie iou_threshold, Confidence_threshold, input_resolution usw. ausprobiert hatte, erzielte er enttäuschende Ergebnisse.
Bei diesem Modell wird der Ball nur auf wenigen Videobildern erkannt, da die Anzahl zu gering ist, als dass das Modell ein so kleines und sich schnell bewegendes Objekt zuverlässig verfolgen könnte.
Andererseits erkennt dieses Modell viele redundante Objekte außerhalb des Spielfelds – Trainer, Fans, Wartungspersonal, Kamerateams usw. Für diese redundanten Objekte muss eine zusätzliche Erkennungs- und Filterlogik geschrieben werden, was zu mühsam ist.
Es ist ersichtlich, dass sich die für die Inferenz verwendeten Videos definitiv stark von den für das Training verwendeten Bildern unterscheiden, obwohl der Datensatz die erforderlichen Klassen enthält.
In diesem Fall kann Skalski nur einen eigenen Datensatz erstellen und ein benutzerdefiniertes Modell trainieren.
Das Trainieren eines benutzerdefinierten Modells erfordert viel Aufwand.
Der Hauptgrund ist, dass zum Kommentieren von Bildern viel manuelle Arbeit geleistet werden muss.
Aufgrund des Zeitdrucks muss der Prozess so weit wie möglich vereinfacht werden.
Skalski wählte ein paar Dutzend Videos aus dem oben genannten Kaggle-Datensatz aus und extrahierte mit FFmpeg 10 Frames aus jedem Video – eines alle 3 Sekunden.
Der nächste Schritt besteht darin, eine automatische vorläufige Anmerkung zum Bild vorzunehmen und die erkannten Objekte in einer TXT-Datei zu speichern, um das vorab trainierte YOLOv5-Modell zu verwenden.
Als nächstes besteht die zweite Stufe darin, die Daten zu verbessern.
Obwohl der Computer 90 % der Arbeit erledigt hatte, dauerte die manuelle Korrektur bei Skalski immer noch fast 5 Stunden.
Gleichzeitig führte er auch zwei zusätzliche Objektklassen ein – Schiedsrichter und Torwart. Die Ergebnisse seiner Arbeit sind auf Roboflow Universe zu sehen. Der Datensatz ist Open Source und kann von jedermann kostenlos genutzt werden.
Pre-Training vs. benutzerdefinierter Fußballspieler-Detektor
Die Ergebnisse des benutzerdefinierten Trainings machen Skalski zuversichtlich, die beiden oben genannten Probleme zu lösen.
Aber leider hat das Modell, wahrscheinlich aufgrund der Klassifizierungsunausgewogenheit, immer noch Probleme bei der Erkennung der Torwartklasse.
Als nächstes behandelt Skalski jeden Torwart wie einen gewöhnlichen Fußballspieler.
Skalskis Modell ist auf Roboflow Universe verfügbar, ebenso wie sein Datensatz. Ziehen Sie einfach das Testbild per Drag & Drop.
Skalski verwendet ByteTRACK (einen der SOTA-Multiobjekt-Tracker), um Objekte im Video zu verfolgen.
ByteTRACK verwendet intern kein neuronales Netzwerk. Die Leistungsfähigkeit dieses Modells beruht ausschließlich auf einfacher Mathematik: dem Vergleich der Begrenzungsrahmenpositionen über Frames hinweg.
Das Wichtigste ist, dass ByteTRACK nicht für die Erkennung verantwortlich ist, sondern nur für die Nachverfolgung. Daher ist keine gesonderte Schulung erforderlich, wie bei einigen anderen Trackern.
ByteTRACK ermöglicht es uns also, Detektoren einfach auszutauschen, ohne die gesamte Codearchitektur neu zu gestalten.
Das Folgende ist ein vereinfachter Codeausschnitt. In Ihrem eigenen Projekt müssen Sie den Startcode von ByteTRACK verwenden.
Im ByteTRACK-Projekt hat jedes Objekt im Rahmen eine eindeutige ID.
Dies ist das Ergebnis des Modells:
ByteTRACK Single Frame Results
Wie Sie sehen können, wird jedem Spieler eine eindeutige Nummer zugewiesen und zwischen den Frames wird nachverfolgt.
Natürlich ist das Testen und Nachverfolgen nur der Anfang.
Mit diesen können wir das nächste Level erreichen!
Zum Beispiel ist es jetzt möglich, den Ablauf einer Aktion schnell zu analysieren, zu verstehen, wie sich der Ball zwischen Spielern bewegt, zu berechnen, wie weit sich ein Spieler bewegt hat, oder ihn zu lokalisieren wo sie am häufigsten vorkommen. Veranstaltungsort.
Einige Netizens sagten: Da Sie bei so vielen Informationen die Kontrolle haben, wäre es ein echter Verlust, nicht zu spielen.
Als Antwort sagten einige aufgeregte Internetnutzer: „Das ist zu verträumt! Ich wollte es schon immer so machen.“ Eine Sache wird an Leute verkauft, die auf Fußball wetten Passstatus jedes Offensivspielers, der viel genauer ist als die geschätzten Quoten 🎜🎜# Einige Internetnutzer sagten auch: Dream ist ein Echtzeit-Minispiel! Karte für Fußballspiele.
Einige ernsthafte Internetnutzer fragten: „Ist dieses Skript nur auf einen festen Kamerawinkel anwendbar, z. B. von Can it?“ für andere Kamerawinkel verwendet werden, beispielsweise für die Fokussierung auf 3-4 Spieler?
„Ich denke, wir können Daten aus Anwendungsfällen aus anderen Perspektiven hinzufügen, das Modell neu trainieren und es sollte genauso gut funktionieren.“ "Und der Internetnutzer sagte: „Ich habe das Gefühl, dass Trainingsdaten aus einem anderen Blickwinkel nicht funktionieren werden. Meine Idee ist, das Skript weiter auszuführen, während ich im vollen Kamerawinkel fotografiere.“ , aber notieren Sie sich die Position des Balls und der Spieler um ihn herum und kennzeichnen Sie die Daten in allen anderen Feeds.
Das obige ist der detaillierte Inhalt vonBleiben Sie heute Abend lange wach für Messi und Modric! Mit diesem CV-Modell können Sie gewinnen, indem Sie die Kugel erraten. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!