咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于多模型机器学习算法预测体外受精累积活产率的研究 收藏

基于多模型机器学习算法预测体外受精累积活产率的研究

Prediction of cumulative live birth rate in in vitro fertilization using multi-model machine learning algorithms

作     者:邢鹏 梁辉 陈英 刘婷 翟嘉威 袁博 田莹珺 Xing Peng;Liang Hui;Chen Ying;Liu Ting;Zhai Jiawei;Yuan Bo;Tian Yingjun

作者机构:保定市妇幼保健院生殖医学科保定071000 河北大学附属医院儿科保定071000 保定市第二医院检验科保定071000 

出 版 物:《中华生殖与避孕杂志》 (Chinese Journal of Reproduction and Contraception)

年 卷 期:2025年第45卷第4期

页      面:358-364页

核心收录:

学科分类:1002[医学-临床医学] 100211[医学-妇产科学] 10[医学] 

基  金:河北省医学科学研究项目(20232036) 

主  题:体外受精 累积活产率 预测模型 极端梯度提升树 SHAP 

摘      要:目的开发和验证体外受精累积活产率(cumulative live birth rate,CLBR)的机器学习预测模型,并通过SHAP值分析模型的重要特征。方法本研究基于2017年1月至2022年12月在保定市妇幼保健院生殖医学科接受体外受精-胚胎移植治疗患者的回顾性数据,共1792个周期。根据活产结局分为活产组(n=1036)和非活产组(n=756)。数据集被随机分割为训练集和验证集(比例7∶3)。模型开发采用5种算法:逻辑回归、随机森林、极端梯度提升树(extreme gradient boosting,XGBoost)、支持向量机和神经网络。通过受试者工作特征曲线下面积(area under the curve,AUC)、F1分数和校准曲线评估模型性能,并使用临床决策曲线(decision curve analysis,DCA)分析评估模型的临床应用价值。采用SHAP值分析XGBoost模型的特征重要性,以提升模型解释性。结果XGBoost模型在预测CLBR方面表现最佳,测试集数据的准确率为72.44%,AUC达到0.775,F1分数为0.654,准确率和F1分数均优于逻辑回归(准确率为70.02%,F1分数为0.585)、随机森林(准确率为71.69%,F1分数为0.606)、支持向量机(准确率为70.20%,F1分数为0.607)和神经网络(准确率为68.72%,F1分数为0.560)。XGBoost的校准曲线接近对角线,表明它们的预测概率与实际结果非常接近,具有良好的预测校准度。DCA分析结果表明,在大多数临床决策阈值范围内,XGBoost模型均提供了较高的净获益。SHAP值分析显示,体外受精失败次数、窦卵泡计数、抗苗勒管激素水平、精子正常形态率和精子DNA碎片指数是预测CLBR的关键特征。结论XGBoost模型在预测CLBR方面具有良好的预测能力和校准度,并通过SHAP值提供重要特征的解释性,可为临床制定个性化治疗策略提供有力支持。然而,模型的泛化能力尚需通过外部数据验证,以确保其在不同人群中的适用性。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分