首頁 >科技週邊 >人工智慧 >基於對數譜圖的深度學習心音分類

基於對數譜圖的深度學習心音分類

PHPz
PHPz轉載
2023-09-29 17:21:081356瀏覽

這篇論文非常有趣,它基於心音訊號的對數譜圖提出了兩種心率音分類模型。我們都知道,在語音辨識中廣泛應用頻譜圖。這篇論文將心音訊號作為語音訊號處理,並且取得了很好的效果

對心音訊號進行一致長度的分幀,提取其對數譜圖特徵,論文提出了長短期記憶(LSTM)和卷積神經網路(CNN)兩種深度學習模型,根據擷取的特徵對心跳聲進行分類。

心音資料集

影像診斷包括心臟核磁共振成像(MRI)、CT掃描、心肌灌注造影。這些技術的缺點也很明顯對現代機械、專業人員的要求高,診斷時間長。

基於對數譜圖的深度學習心音分類

論文使用的資料集是公共資料集,其中包含了1000個.wav格式的訊號樣本,取樣頻率為8 kHz。此資料集分為5個類別,包括1個正常類別(N)和4個異常類別:主動脈瓣狹窄(AS)、二尖瓣逆流(MR)、二尖瓣狹窄(MS)和二尖瓣脫垂(MVP)

主動脈瓣狹窄(AS)是指主動脈瓣太小、狹窄或僵硬。主動脈瓣狹窄的典型雜音是高音的「菱形」雜音。

二尖瓣反流(MR)是指心臟的二尖瓣無法正常關閉,導致血液回流到心臟而不是被泵出。在聽診胎兒心臟時,S1的聲音可能很低(有時很大聲),直到S2時,雜音的音量會增加。由於S3之後的二尖瓣急流,可以聽到短而隆隆的舒張中期雜音

二尖瓣狹窄(MS)是指二尖瓣受損不能完全打開。心音聽診顯示二尖瓣狹窄早期S1加重,嚴重二尖瓣狹窄時S1軟。隨著肺動脈高壓的發展,S2音將被強調。純多發性硬化症患者幾乎沒有左心室S3。

二尖瓣脫垂(MVP)是指心臟收縮時二尖瓣的小葉脫垂至左心房。 MVP通常是良性的,但可能會引發二尖瓣逆流、心內膜炎和脊索斷裂等併發症。徵象包括收縮期中期的喀喀聲和收縮期晚期的雜音(若有逆流)

預處理與特徵擷取

##聲音訊號有不同的長度,因此需要固定每個記錄檔案的取樣率。為了確保聲音訊號包含至少一個完整的心臟週期,我們將長度進行裁切。根據成年人每分鐘心跳65-75次,心跳週期約0.8秒,我們將訊號樣本裁切為2.0秒、1.5秒和1.0秒的段落

基於離散傅立葉變換(DFT),將心音訊號的原始波形轉換為對數譜圖。聲音訊號的DFT y(k)為Eq.(1),對數譜圖s定義為Eq.(2)。

基於對數譜圖的深度學習心音分類

式中,N為向量x的長度,ε = 10^(- 6)是一個小偏移量。部分心音樣本的波形與對數譜圖如下:

基於對數譜圖的深度學習心音分類

#深度學習模型

##1、 LSTM

基於對數譜圖的深度學習心音分類

LSTM模型設計為2層直接連接,然後是3層完全連接。第三個完全連接的層輸入softmax分類器。

2、CNN模型

基於對數譜圖的深度學習心音分類

#根據上圖所示,前兩個卷積層之後是重疊的最大池化層。第三個卷積層直接連接到第一個全連接層。第二個全連接層提供給一個具有五個類別標籤的softmax分類器。在每個卷積層之後使用BN和ReLU

3、訓練細節

基於對數譜圖的深度學習心音分類

結果

基於對數譜圖的深度學習心音分類

訓練集佔據了整個資料集的70%,而測試集則包含了剩餘部分

當CNN模型片段持續時間為2.0 s時,準確率最高為0.9967;分割時間為1.0 s的LSTM準確率最低為0.9300。

CNN模型的整体准确率分别为0.9967、0.9933和0.9900,片段持续时间分别为2.0秒、1.5秒和1.0秒,而LSTM模型的这三个数字分别为0.9500、0.9700和0.9300

CNN模型在各个时间段的预测精度比LSTM模型更高

以下是混淆矩阵:

基於對數譜圖的深度學習心音分類

N类(Normal)的预测正确率最高,在5个案例中达到60个,而MVP类在所有案例中预测正确率最低。

LSTM模型输入时间长度为2.0 s,最长预测时间为9.8631 ms。分类时间为1.0 s的CNN模型预测时间最短,为4.2686 ms。

基於對數譜圖的深度學習心音分類

与其他SOTA相比,一些研究的准确率非常高,但这些研究仅仅涉及两个类别(正常和异常),而我们的研究则分为五个类别

与使用相同数据集的其他研究相比(0.9700),论文研究有了显著提高,最高准确率为0.9967。

基於對數譜圖的深度學習心音分類


以上是基於對數譜圖的深度學習心音分類的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:51cto.com。如有侵權,請聯絡admin@php.cn刪除