Heim  >  Artikel  >  Technologie-Peripheriegeräte  >  Deep-Learning-Herztonklassifizierung basierend auf einem logarithmischen Spektrogramm

Deep-Learning-Herztonklassifizierung basierend auf einem logarithmischen Spektrogramm

PHPz
PHPznach vorne
2023-09-29 17:21:081319Durchsuche

Dieser Artikel ist sehr interessant. Er schlägt zwei Modelle zur Herzfrequenzschallklassifizierung vor, die auf dem logarithmischen Spektrogramm des Herzschallsignals basieren. Wir alle wissen, dass Spektrogramme in der Spracherkennung weit verbreitet sind. Dieses Papier verarbeitet das Herztonsignal als Sprachsignal und erzielt gute Ergebnisse. Das Herztonsignal wird in Rahmen konsistenter Länge unterteilt und seine logarithmischen Spektrogrammmerkmale werden extrahiert. Das Papier schlägt ein langes Kurzzeitgedächtnis (LSTM) vor Zwei Deep-Learning-Modelle, Convolutional Neural Network (CNN), klassifizieren Herzschlaggeräusche basierend auf extrahierten Merkmalen.

Herzgeräusch-Datensatz

Die bildgebende Diagnose umfasst kardiale Magnetresonanztomographie (MRT), CT-Scan und Myokardperfusionsbildgebung. Auch die Nachteile dieser Technologien liegen auf der Hand: hohe Anforderungen an moderne Maschinen und Fachkräfte sowie lange Diagnosezeiten.

Der in der Arbeit verwendete Datensatz ist ein öffentlicher Datensatz, der 1000 Signalproben im .wav-Format mit einer Abtastfrequenz von 8 kHz enthält. Der Datensatz ist in 5 Kategorien unterteilt, darunter 1 normale Kategorie (N) und 4 abnormale Kategorien: Aortenstenose (AS), Mitralklappeninsuffizienz (MR), Mitralklappeninsuffizienz (MS) und Mitralklappeninsuffizienz (MVP). )Deep-Learning-Herztonklassifizierung basierend auf einem logarithmischen Spektrogramm

Eine Aortenstenose (AS) liegt vor, wenn die Aortenklappe zu klein, eng oder steif ist. Das typische Geräusch einer Aortenstenose ist ein hohes „rautenförmiges“ Geräusch.

Mitralinsuffizienz (MR) liegt vor, wenn die Mitralklappe des Herzens nicht richtig schließt, was dazu führt, dass Blut zurück in das Herz fließt, anstatt abgepumpt zu werden. Bei der Auskultation des fetalen Herzens kann der S1-Ton sehr leise (manchmal laut) sein, bis die Lautstärke des Herzgeräuschs um S2 zunimmt. Aufgrund des schnellen Mitralflusses nach S3 ist ein kurzes, polterndes mitteldiastolisches Geräusch zu hören

Mitralstenose (MS) bedeutet, dass die Mitralklappe beschädigt ist und sich nicht vollständig öffnen kann. Die Auskultation des Herztons zeigt, dass sich S1 bei einer frühen Mitralstenose verschlechtert und bei einer schweren Mitralstenose weicher wird. Wenn sich eine pulmonale Hypertonie entwickelt, wird der S2-Geräusch betont. Patienten mit reiner MS haben fast kein linksventrikuläres S3.

Mitralklappenprolaps (MVP) bezeichnet den Vorfall der Mitralklappensegel in den linken Vorhof während der Herzkontraktion. MVP ist normalerweise gutartig, kann jedoch Komplikationen wie Mitralinsuffizienz, Endokarditis und Nabelschnurriss verursachen. Zu den Anzeichen zählen mittelsystolische Klickgeräusche und spätsystolische Geräusche (bei vorhandener Regurgitation).

Vorverarbeitung und Merkmalsextraktion

Tonsignale haben unterschiedliche Längen, daher müssen die Samples für jede aufgezeichnete Dateirate festgelegt werden. Um sicherzustellen, dass das Tonsignal mindestens einen vollständigen Herzzyklus enthält, kürzen wir die Länge. Basierend auf der Tatsache, dass das Herz eines Erwachsenen 65–75 Mal pro Minute schlägt und der Herzschlagzyklus etwa 0,8 Sekunden beträgt, schneiden wir die Signalproben in Segmente von 2,0 Sekunden, 1,5 Sekunden und 1,0 Sekunden.

Basierend auf der Diskreten Fourier-Transformation ( DFT) werden die Herztöne aus der ursprünglichen Wellenform des Signals in ein logarithmisches Spektrogramm umgewandelt. Die DFT y(k) des Schallsignals ist Gleichung (1) und das logarithmische Spektrum s ist als Gleichung (2) definiert.

In der Formel ist N die Länge des Vektors x und ε = 10^(- 6) ein kleiner Versatz. Die Wellenformen und logarithmischen Spektrogramme einiger Herztonproben sind wie folgt: Deep-Learning-Herztonklassifizierung basierend auf einem logarithmischen Spektrogramm

Deep-Learning-ModellDeep-Learning-Herztonklassifizierung basierend auf einem logarithmischen Spektrogramm

1, LSTM

Das LSTM-Modell ist mit 2 Schichten direkter Verbindung ausgestattet. und dann 3 Schichten komplett verbinden. Die dritte vollständig verbundene Schicht gibt den Softmax-Klassifikator ein. Deep-Learning-Herztonklassifizierung basierend auf einem logarithmischen Spektrogramm

2. CNN-Modell

Wie in der Abbildung oben gezeigt, folgt auf die ersten beiden Faltungsschichten eine überlappende Maximum-Pooling-Schicht. Die dritte Faltungsschicht ist direkt mit der ersten vollständig verbundenen Schicht verbunden. Die zweite vollständig verbundene Schicht wird einem Softmax-Klassifikator mit fünf Klassenbezeichnungen zugeführt. Verwenden Sie BN und ReLU nach jeder Faltungsschicht. 3. Trainingsdetails Teil Deep-Learning-Herztonklassifizierung basierend auf einem logarithmischen Spektrogramm

Wenn die Segmentierungsdauer des CNN-Modells 2,0 s beträgt, beträgt die höchste Genauigkeit 0,9967; bei einer Segmentierungszeit von 1,0 s beträgt die niedrigste LSTM-Genauigkeit 0,9300.

Die Gesamtgenauigkeit des CNN-Modells beträgt 0,9967, 0,9933 bzw. 0,9900, und die Segmentdauer beträgt 2,0 Sekunden, 1,5 Sekunden bzw. 1,0 Sekunden, während die drei Zahlen des LSTM-Modells jeweils 0,9500, 0,9700 und 0,9300 sind

CNN Die Vorhersagegenauigkeit des Modells in verschiedenen Zeiträumen ist höher als die des LSTM-Modells

Das Folgende ist die Verwirrungsmatrix:

Deep-Learning-Herztonklassifizierung basierend auf einem logarithmischen Spektrogramm

Die N-Klasse (Normal) hat die höchste Vorhersagegenauigkeit. In 5 Fällen erreichte er 60, während die MVP-Klasse von allen Fällen die niedrigste Vorhersagegenauigkeit aufweist.

Die Eingabezeitlänge des LSTM-Modells beträgt 2,0 s und die längste Vorhersagezeit beträgt 9,8631 ms. Das CNN-Modell mit einer Klassifizierungszeit von 1,0 s hat die kürzeste Vorhersagezeit, nämlich 4,2686 ms.

Deep-Learning-Herztonklassifizierung basierend auf einem logarithmischen Spektrogramm

Im Vergleich zu anderen SOTA weisen einige Studien eine sehr hohe Genauigkeit auf, aber diese Studien umfassen nur zwei Kategorien (normal und abnormal), während unsere Studie in fünf Kategorien unterteilt ist

im Vergleich zu anderen Studien mit Mit demselben Datensatz (0,9700) hat sich die Papierstudie erheblich verbessert, mit der höchsten Genauigkeit von 0,9967.

Deep-Learning-Herztonklassifizierung basierend auf einem logarithmischen Spektrogramm


Das obige ist der detaillierte Inhalt vonDeep-Learning-Herztonklassifizierung basierend auf einem logarithmischen Spektrogramm. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Dieser Artikel ist reproduziert unter:51cto.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen