图片

传统方法,如逻辑回归,已被广泛用于识别风险因素和预测疾病概率。

很多机器学习构建预测模型的文章中,XGBoost模型优于其他模型。

XGBoost是最强机器学习算法吗?

今天这篇JAMA子刊文章,再次证明XGB构建预测模型 ,确实优秀!

2025年5月1日,JAMA Network Open(医学一区,IF=10.5)发表研究论文,旨在开发一种可跨所有科室早期检测病情恶化的机器学习模型

研究结果显示,XGBoost 模型的表现最佳,甚至优于或等同于各科室专门训练的模型。


研究思路

数据来源:本回顾性队列研究使用了 3 所三级学术医院(UC、Loyola以及UW–Madison)的儿科(年龄 <18 岁)病房和重症监护病区入院患者病例数据,共包含 135 621 名患者。

主要结局:危重事件,定义为观察点 12 小时内发生的侵袭性机械通气、血管活性药物使用或死亡

拆分数据:来自 2 所医院的数据用于模型训练(UC+Loyola,≤2017)和内部验证(时间验证,UC+Loyola,>2017),第三所医院的数据作为外部验证队列。

机器学习建模:构建了基于回归的模型、XGBoost 模型以及两种深度学习模型。

性能评估:最终模型用于计算时间验证和外部测试数据集的预测概率。评估模型性能的主要指标是鉴别能力,使用受试者工作特征曲线下面积(AUC)对时间验证和外部测试队列进行评估。采用非参数DeLong检验方法比较模型AUC(包括95% ci)。

与传统模型对比:我们还比较了外部测试队列中表现最佳的模型和pCART在不同模型阈值下的敏感性和特异性。

变量重要性:使用信息增益估计了表现最好的模型的整体变量重要性。变量重要性也在单个患者实例中使用Shapley值进行评估,Shapley值测量每个变量对单次观察预测的贡献。

模型输入特征包括患者年龄、所在科室、生命体征、实验室结果及既往合并症。

结果显示,XGBoost 模型是最佳机器学习模型,其区分度(C 统计量)为 0.86,显著高于两种面向普通病房的已有模型(分别为 0.82 和 0.70,均 P < .001);

此后,我们将此模型称为儿科重大事件风险评估和评分工具 (pCREST)。使用信息增益评估pCREST 的前 20 个最重要的变量,按重要性降序排列。

基于 Shapley 值的个体患者风险随时间变化情况(以一名 16 岁患者在急诊分诊、转入普通病房再转入 ICU 直至发生关键事件的过程中 pCREST 风险百分位的变化为例)。


参考文献:

Strutz S, Liang H, Carey K, et al. Machine Learning for Predicting Critical Events Among Hospitalized Children. JAMA Netw Open. 2025;8(5):e2513149. doi:10.1001/jamanetworkopen.2025.13149

机器学习构建预测模型写代码还是有点难度的,如果您也想模仿这篇文章的思路,郑老师团队可以帮您实现,不妨联系我们郑老师统计团队。

关于郑老师团队及公众号

全国较大的医学统计服务公众号平台,专注于医学生、医护工作者学术研究统计支持,我们是你们统计助理

郑老师团队可以提供诸多统计支持:

各式统计课程临床试验设计

构建预测模型与真实世界研究

1对1 R语言指导医学数据库挖掘

郑老师开发的超便捷免费统计工具了解一下:

www.medsta.cn/software(详情介绍)

详情联系助教小董咨询(微信号aq566665

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐