随着临床和生物大数据的极大丰富,机器学习技术通过结合多方面的信息以预测个体的健康结局,在科研及学术论文中应用日益广泛,但关键信息报告的不足也逐渐显现,包括数据偏倚、模型对不同群体的公平性、数据质量和适用性问题,以及在真实临床环境中保持预测准确性和可解释性的难度等,增加了将预测模型安全有效地应用于临床实践的复杂性。针对这些问题,多变量预测模型个体预后或诊断的透明报告(transparent reporting of a multivariable prediction model for individual prognosis or diagnosis,TRIPOD)+人工智能(artificial intelligence,AI)声明在TRIPOD的基础上提出了针对机器学习模型的报告规范,以提升模型的透明性、可重复性和健康公平性,从而改善机器学习模型的应用质量。当前,国内基于机器学习技术的预测模型研究日益增多。为帮助国内读者更好地理解和应用TRIPOD+AI,笔者结合实例对其进行了解读,希望为研究人员报告质量提升提供支持。
目的探讨早泄患者相关影响因素并建立基于LASSO logistic回归的早泄预测模型。方法基于西京医院等5家医院门诊招募的男性受试者,通过问卷及量表评分结果,构建基于LASSO logistic回归的早泄患者预测模型,通过交叉验证法选择最优调和系数λ,采用赤池信息准则(Akaike information criterion,AIC)和贝叶斯信息准则(Bayesian information criterion,BIC)与全变量logistic回归和逐步logistic回归进行比较,基于曲线下面积(area under curve,AUC)和校准曲线分别评价模型的区分度和准确度,并绘制列线图。结果本研究共纳入3180例受试者,其中早泄组有2663例(83.7%),非早泄组有517例(16.3%)。LASSO logistic回归模型(λ=0.004),纳入的自变量为:年龄、居住地、职业、IIEF-5评分、PEDT评分和GAD-7评分;AIC=2240.2,BIC=2282.7,均低于全变量logistic回归(2262.9/2292.2)和逐步logistic回归(2257.3/2293.7);ROC曲线分析LASSO logistic回归模型的预测价值,其AUC为0.799,显著高于全变量logistic回归和逐步logistic回归模型,差异均有统计学意义(P<0.05)。校准曲线证实列线图模型具有较高的预测准确度。结论利用年龄、职业、居住地、IIEF-5评分、PEDT评分、GAD-7评分,基于LASSO logistic回归建立无创列线图模型作为临床诊断早泄的量化工具,具有较高的诊断效能,值得推广应用。
暂无评论