版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者机构:保定市妇幼保健院生殖医学科保定071000 河北大学附属医院儿科保定071000 保定市第二医院检验科保定071000
出 版 物:《中华生殖与避孕杂志》 (Chinese Journal of Reproduction and Contraception)
年 卷 期:2025年第45卷第4期
页 面:358-364页
核心收录:
学科分类:1002[医学-临床医学] 100211[医学-妇产科学] 10[医学]
主 题:体外受精 累积活产率 预测模型 极端梯度提升树 SHAP
摘 要:目的开发和验证体外受精累积活产率(cumulative live birth rate,CLBR)的机器学习预测模型,并通过SHAP值分析模型的重要特征。方法本研究基于2017年1月至2022年12月在保定市妇幼保健院生殖医学科接受体外受精-胚胎移植治疗患者的回顾性数据,共1792个周期。根据活产结局分为活产组(n=1036)和非活产组(n=756)。数据集被随机分割为训练集和验证集(比例7∶3)。模型开发采用5种算法:逻辑回归、随机森林、极端梯度提升树(extreme gradient boosting,XGBoost)、支持向量机和神经网络。通过受试者工作特征曲线下面积(area under the curve,AUC)、F1分数和校准曲线评估模型性能,并使用临床决策曲线(decision curve analysis,DCA)分析评估模型的临床应用价值。采用SHAP值分析XGBoost模型的特征重要性,以提升模型解释性。结果XGBoost模型在预测CLBR方面表现最佳,测试集数据的准确率为72.44%,AUC达到0.775,F1分数为0.654,准确率和F1分数均优于逻辑回归(准确率为70.02%,F1分数为0.585)、随机森林(准确率为71.69%,F1分数为0.606)、支持向量机(准确率为70.20%,F1分数为0.607)和神经网络(准确率为68.72%,F1分数为0.560)。XGBoost的校准曲线接近对角线,表明它们的预测概率与实际结果非常接近,具有良好的预测校准度。DCA分析结果表明,在大多数临床决策阈值范围内,XGBoost模型均提供了较高的净获益。SHAP值分析显示,体外受精失败次数、窦卵泡计数、抗苗勒管激素水平、精子正常形态率和精子DNA碎片指数是预测CLBR的关键特征。结论XGBoost模型在预测CLBR方面具有良好的预测能力和校准度,并通过SHAP值提供重要特征的解释性,可为临床制定个性化治疗策略提供有力支持。然而,模型的泛化能力尚需通过外部数据验证,以确保其在不同人群中的适用性。