版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者机构:陆军军医大学(第三军医大学)高原军事医学系寒区医学教研室重庆 陆军军医大学(第三军医大学)高原军事医学系高原作业医学教研室重庆 医大学(第三军医大学)高原军事医学系极端环境医学教育部重点实验室重庆
出 版 物:《陆军军医大学学报》 (Journal of Army Medical University)
年 卷 期:2025年第47卷第1期
页 面:20-29页
核心收录:
学科分类:1004[医学-公共卫生与预防医学(可授医学、理学学位)] 1002[医学-临床医学] 1001[医学-基础医学(可授医学、理学学位)] 100201[医学-内科学(含:心血管病、血液病、呼吸系病、消化系病、内分泌与代谢病、肾病、风湿病、传染病)] 100401[医学-流行病与卫生统计学] 100104[医学-病理学与病理生理学] 10[医学]
摘 要:目的应用不同机器学习算法构建从高原返回平原人群高原脱适应症(high altitude deacclimatization syndrome,HADAS)发病的风险预测模型,并验证其预测效能。方法于2020年11月至2024年2月对结束高原生活返回内地的人群实地或线上发放问卷调查。收集基本资料、慢性高原病(chronic mountain sickness,CMS)情况和脱适应症状等调查资料,经筛选最终纳入1095例作为建模组。阳性事件定义为脱适应症状评分5分。将建模组按7∶3随机分为训练集(n=766)和内部测试集(n=329),采用最小绝对收缩和选择算子(least absolute shrinkage and selection operator,LASSO)回归筛选自变量,基于多因素Logistic回归(multiple factor logistic regression,LR)、决策树(decision tree,DT)、随机森林(random forest,RF)、极端梯度提升(eXtreme gradient boosting,XGB)、支持向量机(support vector machine,SVM)、K最邻近(K-nearest neighbor,KNN)、轻度梯度提升(light gradient boosting,LGB)、朴素贝叶斯(naïve bayes,NB)8种机器学习方法构建预测模型。采用受试者工作特性曲线(receiver operating characteristic,ROC)、校准曲线和混淆矩阵对模型进行比较并进行内部测试;使用列线图或Shapley加性解释(shapley additive explanations,SHAP)图对最终模型进行展示。于2024年8月收集筛选结束高原生活返回平原132例作为外部验证组,对模型进行外部验证。结果1095例调查人群中有脱适应症者549人(50.14%)。CMS评分、年龄、高原居住时间为LASSO回归筛选出的预测因子。8种机器学习算法建立的HADAS预测模型中,以LR模型最优,ROC的曲线下面积(area under curve,AUC)训练集为0.819(95%CI:0.789~0.850),内部测试集为0.841(95%CI:0.799~0.884),F1评分内部测试集为0.801,内部测试集的AUC、F1得分在8个模型中均为最大;LR模型校准曲线的Spiegelhalter Z检验显示训练集P=0.703、内部测试集P=0.281;LR模型外部验证集AUC为0.867(95%CI:0.765~0.969)。结论以CMS评分、年龄和高原居住时间为预测因子建立的LR模型在内部测试集的综合表现最好,在外部验证集中区分度好,构建的列线图便于应用。