JAMA(IF=10.5): 机器学习预测模型XGBoost方法,更优秀
基于 Shapley 值的个体患者风险随时间变化情况(以一名 16 岁患者在急诊分诊、转入普通病房再转入 ICU 直至发生关键事件的过程中 pCREST 风险百分位的变化为例)。,其区分度(C 统计量)为 0.86,显著高于两种面向普通病房的已有模型(分别为 0.82 和 0.70,均 P < .001);评估模型性能的主要指标是鉴别能力,使用受试者工作特征曲线下面积(AUC)对时间验证和外部测试

传统方法,如逻辑回归,已被广泛用于识别风险因素和预测疾病概率。
很多机器学习构建预测模型的文章中,XGBoost模型优于其他模型。
今天这篇JAMA子刊文章,再次证明XGB构建预测模型 ,确实优秀!
2025年5月1日,JAMA Network Open(医学一区,IF=10.5)发表研究论文,旨在开发一种可跨所有科室早期检测病情恶化的机器学习模型
研究结果显示,XGBoost 模型的表现最佳,甚至优于或等同于各科室专门训练的模型。

研究思路
数据来源:本回顾性队列研究使用了 3 所三级学术医院(UC、Loyola以及UW–Madison)的儿科(年龄 <18 岁)病房和重症监护病区入院患者病例数据,共包含 135 621 名患者。
主要结局:危重事件,定义为观察点 12 小时内发生的侵袭性机械通气、血管活性药物使用或死亡
拆分数据:来自 2 所医院的数据用于模型训练(UC+Loyola,≤2017)和内部验证(时间验证,UC+Loyola,>2017),第三所医院的数据作为外部验证队列。
机器学习建模:构建了基于回归的模型、XGBoost 模型以及两种深度学习模型。
性能评估:最终模型用于计算时间验证和外部测试数据集的预测概率。评估模型性能的主要指标是鉴别能力,使用受试者工作特征曲线下面积(AUC)对时间验证和外部测试队列进行评估。采用非参数DeLong检验方法比较模型AUC(包括95% ci)。
与传统模型对比:我们还比较了外部测试队列中表现最佳的模型和pCART在不同模型阈值下的敏感性和特异性。
变量重要性:使用信息增益估计了表现最好的模型的整体变量重要性。变量重要性也在单个患者实例中使用Shapley值进行评估,Shapley值测量每个变量对单次观察预测的贡献。
模型输入特征包括患者年龄、所在科室、生命体征、实验室结果及既往合并症。
结果显示,XGBoost 模型是最佳机器学习模型,其区分度(C 统计量)为 0.86,显著高于两种面向普通病房的已有模型(分别为 0.82 和 0.70,均 P < .001);

此后,我们将此模型称为儿科重大事件风险评估和评分工具 (pCREST)。使用信息增益评估pCREST 的前 20 个最重要的变量,按重要性降序排列。

基于 Shapley 值的个体患者风险随时间变化情况(以一名 16 岁患者在急诊分诊、转入普通病房再转入 ICU 直至发生关键事件的过程中 pCREST 风险百分位的变化为例)。

参考文献:
Strutz S, Liang H, Carey K, et al. Machine Learning for Predicting Critical Events Among Hospitalized Children. JAMA Netw Open. 2025;8(5):e2513149. doi:10.1001/jamanetworkopen.2025.13149
机器学习构建预测模型写代码还是有点难度的,如果您也想模仿这篇文章的思路,郑老师团队可以帮您实现,不妨联系我们郑老师统计团队。
关于郑老师团队及公众号
全国较大的医学统计服务公众号平台,专注于医学生、医护工作者学术研究统计支持,我们是你们统计助理
郑老师团队可以提供诸多统计支持:
郑老师开发的超便捷免费统计工具了解一下:
www.medsta.cn/software(详情介绍)
详情联系助教小董咨询(微信号aq566665)

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。
更多推荐


所有评论(0)