ホームページ >テクノロジー周辺機器 >AI >対数スペクトログラムに基づく深層学習心音分類

対数スペクトログラムに基づく深層学習心音分類

PHPz転載: 2023-09-29 17:21:081603ブラウズ

この論文は非常に興味深いもので、心音信号の対数スペクトログラムに基づいた 2 つの心拍音分類モデルを提案しています。スペクトログラムが音声認識で広く使用されていることは誰もが知っています。この論文では、心音信号を音声信号として処理し、良好な結果を達成しています

心音信号を同じ長さのフレームに分割し、その対数スペクトログラム特徴を抽出します。抽出された特徴に基づいて心拍音を分類するために、長短期記憶 (LSTM) と畳み込みニューラルネットワーク (CNN) という 2 つの深層学習モデルが使用されます。

心音データセット

画像診断には、心臓磁気共鳴画像法 (MRI)、CT スキャン、心筋灌流画像法が含まれます。これらのテクノロジーの欠点も明らかです。最新の機械と専門家に対する高い要件と、長い診断時間です。

対数スペクトログラムに基づく深層学習心音分類

この論文で使用されているデータセットは公開データセットであり、サンプリング周波数 8 kHz の .wav 形式の 1000 個の信号サンプルが含まれています。。データセットは、1 つの正常カテゴリー (N) と、大動脈弁狭窄症 (AS)、僧帽弁逆流 (MR)、僧帽弁狭窄症 (MS)、および僧帽弁閉鎖不全症 (MR) の 4 つの異常カテゴリーを含む 5 つのカテゴリーに分割されています。 )

大動脈弁狭窄症 (AS) は、大動脈弁が小さすぎる、狭い、または硬すぎる場合です。大動脈弁狭窄症の典型的な雑音は、高音の「ダイヤモンド形」の雑音です。

僧帽弁閉鎖不全症 (MR) は、心臓の僧帽弁が適切に閉じることができず、血液が送り出されずに心臓に逆流してしまう状態です。胎児の心臓を聴診する場合、雑音の音量が S2 までに増加するまで、S1 音は非常に低い (場合によっては大きくなる) ことがあります。 S3

僧帽弁狭窄症 (MS) は、僧帽弁が損傷し、完全に開くことができない状態です。心音の聴診により、初期の僧帽弁狭窄症ではS1が悪化し、重度の僧帽弁狭窄症ではS1が柔らかくなることがわかります。肺高血圧症が進行すると、S2音が強調されます。純粋な MS 患者には左心室 S3 がほとんどありません。

僧帽弁逸脱（MVP）は、心臓の収縮中に僧帽弁の小葉が左心房内に脱出することです。 MVP は通常良性ですが、僧帽弁閉鎖不全症、心内膜炎、臍帯破裂などの合併症を引き起こす可能性があります。兆候には、収縮期中期のクリック音と収縮期後期の雑音 (逆流がある場合) が含まれます。

前処理と特徴抽出

音声信号の長さは異なります。したがって、サンプルレートは録音ファイルごとに固定する必要があります。音声信号に少なくとも 1 つの完全な心拍周期が含まれるようにするために、長さをトリミングします。成人の心拍数は 1 分間に 65 ～ 75 回であり、心拍周期は約 0.8 秒であるという事実に基づいて、信号サンプルを 2.0 秒、1.5 秒、1.0 秒のセグメントに分割しました。 #離散フーリエリーフ変換 (DFT) に基づいて、心音信号の元の波形を対数スペクトログラムに変換します。音声信号のDFT y(k)は式(1)であり、対数スペクトルsは式(2)のように定義されます。

#式では、N はベクトル x の長さ、ε = 10^(- 6) は小さなオフセットです。いくつかの心音サンプルの波形と対数スペクトログラムは次のとおりです。

対数スペクトログラムに基づく深層学習心音分類