关键词:
不明原因不孕症
加权基因共表达网络分析
机器学习
免疫相关基因
免疫浸润
摘要:
目的 运用加权基因共表达网络分析(WGCNA)、LASSO和SVM-RFE算法,探讨与不明原因不孕症(UI)免疫相关的潜在生物标志物,为UI诊治提供新思路。方法 从GEO数据库下载2个UI子宫内膜基因表达数据集,GSE165004作为芯片数据集,GSE16532作为独立验证数据集。从ImmPort数据库获得免疫相关基因,用R语言鉴定免疫相关的差异表达基因,通过WGCNA明确与UI相关的共表达模块,对最显著的模块进行功能富集分析。将获得的差异性免疫相关基因(IRGs)和关键模块基因进行重叠后,运用LASSO和SVM-RFE算法选出的核心特征基因,在GSE16532数据集中进行验证。此外,采用CIBERSORT算法进行UI免疫浸润分析。结果 获得差异性IRGs共51个。通过WGCNA获得与UI相关的黑色和黄色模块,富集分析发现这些模块富集在T细胞活化、白细胞粘附和增殖的生物学过程,以细胞因子-细胞因子受体及Th1/Th2细胞分化等通路信号上。将获得的IRGs和关键模块基因进行重叠后获得18个候选基因,通过LASSO及SVM-RFE算法筛选出特征基因并在GSE16532数据集进行检验,结果发现葡萄糖依赖性促胰岛素释放多肽受体(GIPR)、S100钙结合蛋白A5(S100A5)是UI的2个潜在生物标志物。与正常组相比,GIPR(P=0.045)和S100A5(P=0.022)在UI组中信使核糖核酸(m RNA)水平均显著下调,差异有统计学意义。另外,免疫浸润分析发现GIPR和S100A5与免疫细胞相关,其中GIPR与巨噬细胞M2正相关(P=0.003),与调节性T细胞负相关(P=0.001);S100A5与浆细胞正相关(P=0.049),与辅助性T细胞负相关(P=0.045),差异均有统计学意义。结论 GIPR和S100A5基因与UI免疫浸润相关,可能成为诊断与预测潜在生物标志物。