黑匣子再见!SHAP可解释性来了!

通过SHAP的解释,能帮助用户更好地理解模型的决策过程,提高模型透明度、准确性和可信度。 并且其具有坚实的理论基础,近期多篇一区文章,都用的该方法。

例如解释机器学习模型预测结果中的应用,和布鲁氏菌病时空趋势的应用,两篇均登上nature 。 此外其促进了机器学习、统计学、博弈论等多个学科的交叉研究。

应用广泛,特别是医疗、金融、营销等行业,创新空间大。 想发论文的同学,可以从SHAP如何帮助用户识别关键特征、优化模型性能、结合新技术等方面入手。 

为帮助大家紧跟领域发展,我总结了13篇热点研究成果,创新点已提炼,有代码的也都附上了,供大家研读

论文1

标题:

Data-driven interpretable ensemble learning methods for the prediction of wind turbine power incorporating SHAP analysis

基于SHAP分析的风力发电机功率预测的数据驱动可解释集成学习方法

法:

              • 数据准备:使用2011年至2020年在土耳其Çanakkale地区的气象数据,包括温度、湿度、气压、风速等,计算风力发电机功率。

              • 机器学习模型:使用XGBoost、随机森林、LightGBM、CatBoost、AdaBoost和M5-Prime六种算法构建预测模型。

              • SHAP分析:利用SHAP方法解释模型预测,分析输入特征对模型输出的影响。

              • 模型评估:通过R²、MAE、RMSE等指标评估模型性能,并分析模型计算效率。

              创新点:

                  • XGBoost性能:XGBoost算法在测试集上取得了最高的R²分数(0.9994),显示出卓越的预测精度。

                  • LightGBM效率:LightGBM模型在所有模型中计算速度最快,提升了模型的效率。

                  • SHAP解释:首次在风力发电机功率预测中应用SHAP分析,揭示了风速对模型预测的最大影响,为模型解释提供了新的视角。

                  • 模型集成:综合多种机器学习算法,提升了预测的准确性和稳定性,为风力发电预测提供了更可靠的工具。

                  图片

                  论文2

                  标题:

                  Exploring ICU Mortality Risk Prediction and Interpretability Analysis Using Machine Learning

                  探索ICU死亡风险预测和可解释性分析的机器学习方法

                  法:

                          • 数据来源:使用eICU协作研究数据库(EICU-CRD),包含超过200,000例ICU患者的去识别数据。

                          • 预测模型:使用XGBoost、逻辑回归(LR)、随机森林(RF)和支持向量机(SVM)四种机器学习模型进行预测。

                          • 特征选择:通过LASSO方法选择和过滤变量,处理数据缺失问题。

                          • 模型评估:使用AUC、准确性、敏感性等指标评估模型性能,并进行决策曲线分析(DCA)

                          创新点:

                                  • XGBoost性能:XGBoost模型在测试集上取得了最高的AUC值(0.824),显著优于其他模型。

                                  • 可解释性分析:利用SHAP方法解释XGBoost模型,揭示了平均血尿素氮(BUN)等关键预测变量对死亡风险的影响。

                                  • 临床应用:模型预测结果对临床决策具有重要参考价值,为ICU患者的死亡风险预测提供了新的工具。

                                  • 数据处理:通过LASSO方法有效处理数据缺失问题,提高了模型的鲁棒性和可靠性。

                                  图片

                                  论文3

                                  标题:

                                  Interpretable Dropout Prediction: Towards XAI-Based Personalized Intervention

                                  可解释的辍学预测:迈向基于XAI的个性化干预

                                  方法:
                                                  • 数据来源:使用匈牙利布达佩斯技术与经济大学(BME)的学生数据,包括高中成绩、入学考试成绩等。

                                                  • 预测模型:使用CatBoost分类器进行辍学预测,并与逻辑回归模型进行比较。

                                                  • 可解释性工具:应用SHAP值、LIME、排列重要性(PI)等工具解释模型预测。

                                                  • 用户研究:通过问卷调查评估学生和教育决策者对XAI工具的可解释性和有用性的看法。

                                                  创新点:

                                                                            • CatBoost性能:CatBoost模型在测试集上取得了较高的AUC值(0.774)和平均精度(0.847),显示出良好的预测性能。

                                                                            • 个性化干预:通过SHAP值和LIME提供个体预测解释,为个性化干预提供了依据。

                                                                            • 用户研究:首次通过用户研究评估XAI工具在教育领域的可解释性和实用性,为改进工具提供了实证依据。

                                                                            • 模型解释:利用SHAP值和LIME工具,不仅解释了模型的整体行为,还解释了个体预测,为教育决策提供了更全面的支持。

                                                                            图片

                                                                            论文4

                                                                            标题:

                                                                            Predicting graft and patient outcomes following kidney transplantation using interpretable machine learning models

                                                                            使用可解释机器学习模型预测肾移植后的移植物和患者结果

                                                                            法:

                                                                            • 数据来源:使用英国国家卫生服务血液和移植(NHSBT)移植登记处的数据,包含超过36,000例肾移植案例。

                                                                            • 预测模型:比较Cox比例风险模型、DeepHit和随机生存森林三种生存分析模型。

                                                                            • 可解释性分析:使用SHAP方法解释神经网络模型,提供临床验证。

                                                                            • 模型评估:通过一致性(concordance)和AUROC分数评估模型性能,并进行模型校准。

                                                                            创新点

                                                                            • 神经网络性能:神经网络在预测移植物失败和患者死亡方面表现出与Cox模型相当的性能,一致性分数分别为0.63和0.79。

                                                                            • 可解释性:通过SHAP方法提供神经网络的详细解释,揭示了供体和受体年龄等关键特征对移植结果的影响。

                                                                            • 临床验证:模型解释与临床知识一致,为临床医生提供了更可靠的决策支持工具。

                                                                            • 模型校准:通过校准确保预测分数与实际结果一致,提高了模型的实用性和可信度。

                                                                            图片

                                                                            Logo

                                                                            DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

                                                                            更多推荐