早期发现疾病及其相关的住院时间 (LoS) 对于更好的治疗选择、更有效的随访安排、更长的生存率、改善长期结果和降低医院使用成本至关重要。
早期识别疾病及其相关的住院时间(LoS)对于更好的治疗选择、更有效的随访安排、更长的生存率、改善的长期结果和降低医院使用成本至关重要。
近年来,通过利用电子健康记录(EHR)和先进的深度学习(DL)架构,例如卷积神经网络(CNN,例如 Nguyen 等人(Deepr)1)、循环神经网络(RNN、例如,Choi 等人 (Doctor AI)2)、长短期记忆网络(LSTM,例如 Pham 等人 (DeepCare)3),以及一种更强大的架构,称为 Transformers 双向编码器表示 (BERT)。例如,Li 等人4 介绍了 BEHRT,这是一种应用于 EHR 的受 BERT 启发的模型,能够预测一个人未来就诊时出现 300 多种情况的可能性; Shang等人5提出了G-BERT,一种结合了图神经网络(GNN)和BERT的力量的模型,用于诊断预测和药物推荐; Rasmy 等人6 介绍了 Med-BERT(也是一种 BERT 模型),以提供在大规模结构化 EHR 上运行的预训练上下文化嵌入。然而,很少有研究重点关注利用 EHR 和最先进的 DL 架构来预测医院 LoS7,8 的任务。例如,Song 等人7 开发了 SAnD(简单参与和诊断),这是一种受 DL 启发的模型,使用多类分类方法来预测诊断代码和 LoS 等任务。他们的视距估计基于分析从入场时间起每小时发生的事件。此外,Hansen 等人8 介绍了 M-BERT,这是一种受 BERT 启发的模型,应用于入院前 24 小时内收集的患者事件序列,以进行二元、多类别和连续 LoS 预测。
尽我们所能知识,该文献中的大多数进展 (a) 依赖于代表成年人口的 EHR4,7,9; (b) 需要指定患者年龄分布1,2,5,6,8,10,11,12,13; (c) 估计患者入院后可能住院多长时间,但入院前预测 LoS 对于预防性医疗保健和优化医院资源分配同样重要7,8; (d) 使用侧重于预测一组有限的健康结果的诊断或 LoS 的模型3,10,14; (e) 通过仅考虑临床事件之间的时间不规则性(例如就诊时的年龄)1、2、4、8,重点关注改善健康风险评估绩效; (f) 不报告罕见疾病的预测性能15,或 (g) 不使用子宫内健康信息进行诊断预测。
然而,计算机辅助的疾病早期检测及其相关的 LoS 在以下领域具有特别重要的意义:儿科。正如各种研究所强调的那样,及时诊断和干预对于增强儿童的长期福祉至关重要14,15,16,17,18。因此,我们开发了 Ped-BERT,这是一种受 BERT19 启发的架构。我们的模型依靠预先训练的诊断嵌入,准确预测了 100 多种潜在的初级诊断以及孩子在即将到来的就诊期间可能面临的住院时间。我们针对两个当代分类器(一个逻辑回归和一个随机森林)和两个最先进的深度学习分类器(一个预先训练的 Transformer 解码器和一个具有随机初始化嵌入的神经网络)来评估我们的方法。因此,我们的分析可以作为一个有价值的工具,帮助研究人员利用机器学习进行儿科医疗保健指导,从而帮助儿科医生进行临床决策过程。
Ped-BERT 利用丰富的数据集,包括儿科的出院记录和急诊室信息,包括患者的年龄和就诊时的居住邮政编码或县。此外,它还可以选择整合产前和产后的孕产妇健康数据。据我们所知,我们的预测框架利用纵向匹配母亲和婴儿对的数据,这是同类中的第一个。此外,该数据集使我们能够探索模型在下次就诊时同时预测初步诊断和 LoS 的能力,并评估其整体公平性,包括检查预测误差是否均匀分布在母婴对的不同人口统计数据中。
总而言之,我们对文献的贡献如下:首先,我们使用一个新颖的数据集,将 1991 年至 2017 年加利福尼亚州母婴对的医疗记录联系起来;其次,我们开发了 Ped-BERT,这是一种 DL 架构,用于早期检测预测住院或急诊环境中寻求护理的儿科患者的健康风险,并将其性能与其他当代或最新水平进行比较
以上是Ped-BERT:儿科患者疾病的早期检测和住院时间预测的详细内容。更多信息请关注PHP中文网其他相关文章!