這篇論文非常有趣,它基於心音訊號的對數譜圖提出了兩種心率音分類模型。我們都知道,在語音辨識中廣泛應用頻譜圖。這篇論文將心音訊號作為語音訊號處理,並且取得了很好的效果
對心音訊號進行一致長度的分幀,提取其對數譜圖特徵,論文提出了長短期記憶(LSTM)和卷積神經網路(CNN)兩種深度學習模型,根據擷取的特徵對心跳聲進行分類。
影像診斷包括心臟核磁共振成像(MRI)、CT掃描、心肌灌注造影。這些技術的缺點也很明顯對現代機械、專業人員的要求高,診斷時間長。
論文使用的資料集是公共資料集,其中包含了1000個.wav格式的訊號樣本,取樣頻率為8 kHz。此資料集分為5個類別,包括1個正常類別(N)和4個異常類別:主動脈瓣狹窄(AS)、二尖瓣逆流(MR)、二尖瓣狹窄(MS)和二尖瓣脫垂(MVP)
主動脈瓣狹窄(AS)是指主動脈瓣太小、狹窄或僵硬。主動脈瓣狹窄的典型雜音是高音的「菱形」雜音。
二尖瓣反流(MR)是指心臟的二尖瓣無法正常關閉,導致血液回流到心臟而不是被泵出。在聽診胎兒心臟時,S1的聲音可能很低(有時很大聲),直到S2時,雜音的音量會增加。由於S3之後的二尖瓣急流,可以聽到短而隆隆的舒張中期雜音
二尖瓣狹窄(MS)是指二尖瓣受損不能完全打開。心音聽診顯示二尖瓣狹窄早期S1加重,嚴重二尖瓣狹窄時S1軟。隨著肺動脈高壓的發展,S2音將被強調。純多發性硬化症患者幾乎沒有左心室S3。
二尖瓣脫垂(MVP)是指心臟收縮時二尖瓣的小葉脫垂至左心房。 MVP通常是良性的,但可能會引發二尖瓣逆流、心內膜炎和脊索斷裂等併發症。徵象包括收縮期中期的喀喀聲和收縮期晚期的雜音(若有逆流)
##聲音訊號有不同的長度,因此需要固定每個記錄檔案的取樣率。為了確保聲音訊號包含至少一個完整的心臟週期,我們將長度進行裁切。根據成年人每分鐘心跳65-75次,心跳週期約0.8秒,我們將訊號樣本裁切為2.0秒、1.5秒和1.0秒的段落
基於離散傅立葉變換(DFT),將心音訊號的原始波形轉換為對數譜圖。聲音訊號的DFT y(k)為Eq.(1),對數譜圖s定義為Eq.(2)。
式中,N為向量x的長度,ε = 10^(- 6)是一個小偏移量。部分心音樣本的波形與對數譜圖如下:
2、CNN模型
3、訓練細節
當CNN模型片段持續時間為2.0 s時,準確率最高為0.9967;分割時間為1.0 s的LSTM準確率最低為0.9300。
CNN模型的整体准确率分别为0.9967、0.9933和0.9900,片段持续时间分别为2.0秒、1.5秒和1.0秒,而LSTM模型的这三个数字分别为0.9500、0.9700和0.9300 CNN模型在各个时间段的预测精度比LSTM模型更高 以下是混淆矩阵: N类(Normal)的预测正确率最高,在5个案例中达到60个,而MVP类在所有案例中预测正确率最低。 LSTM模型输入时间长度为2.0 s,最长预测时间为9.8631 ms。分类时间为1.0 s的CNN模型预测时间最短,为4.2686 ms。 与其他SOTA相比,一些研究的准确率非常高,但这些研究仅仅涉及两个类别(正常和异常),而我们的研究则分为五个类别 与使用相同数据集的其他研究相比(0.9700),论文研究有了显著提高,最高准确率为0.9967。
以上是基於對數譜圖的深度學習心音分類的詳細內容。更多資訊請關注PHP中文網其他相關文章!