版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者机构:河南中医药大学骨伤学院河南省中医院风湿病科河南郑州450008 华北理工大学中医学院河北唐山063210 南阳理工学院河南省张仲景方药与免疫调节重点实验室河南南阳473004
出 版 物:《海南医科大学学报》 (Journal of Hainan Medical University)
年 卷 期:2025年第31卷第2期
页 面:109-117页
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 1002[医学-临床医学] 081104[工学-模式识别与智能系统] 08[工学] 100201[医学-内科学(含:心血管病、血液病、呼吸系病、消化系病、内分泌与代谢病、肾病、风湿病、传染病)] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 10[医学]
基 金:国家自然科学基金项目(82074415) 中原英才计划-中原科技创新领军人才项目(234200510006) 河南省科技计划项目(232102311201) 南阳市基础与前沿技术研究专项计划重点项目(23JCQY1006)
主 题:系统性硬化症 溶酶体 人工神经网络 随机森林 诊断模型
摘 要:目的:建立基于GEO数据库硬皮病溶酶体相关基因的随机森林和人工神经网络(artificial neural network,ANN)联合诊断模型并评价其效果。方法:通过GEO数据库获取4份硬皮病芯片,从AmiGO2数据库中获取875个溶酶体相关基因。其中GSE95065及GSE76807合并作为实验组数据集,使用随机森林算法筛选硬皮病溶酶体相关特征基因,并用特征基因构建人工神经网络模型,用10折交叉验证模型准确性。再用验证数据集GSE32413与GSE59787对模型进一步验证,利用ROC曲线下面积值评估模型准确性。最后用实时荧光定量PCR(real-time quantitative PCR,RT-qPCR)进行实验验证。结果:共获取差异基因46个,其中上调基因16个,下调基因30个。进一步通过随机森林筛选得到最相关的6个特征基因(LYN、TNFAIP3、RNF128、MCOLN3、ANKFY1、PLD3),并构建ANN诊断模型。使用该模型绘制了实验组和验证组诊断的ROC曲线,AUC值为0.999。10折交叉验证AUC平均值大于0.980。验证组AUC为0.740和0.732。RT-qPCR结果表明与对照组相比,硬皮病中LYN(P=0.004)、TNFAIP3(P=0.0001)表达量明显上调,而RNF128(P=0.0002)、MCOLN3(P=0.001)、ANKFY1(P=0.02)、PLD3(P0.0001)表达量在硬皮病组中明显下调。与机器学习算法结果相一致。结论:构建了硬皮病溶酶体相关特征基因的ANN诊断模型,为探索硬皮病发病机制提供了一个新视角。