版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者机构:玉林师范学院广西应用数学中心广西玉林537000 玉林师范学院广西高校复杂系统优化与大数据处理重点实验室广西玉林537000 玉林师范学院计算机科学与工程学院广西玉林537000 玉林师范学院数学与统计学院广西玉林537000
出 版 物:《广西科学》 (Guangxi Sciences)
年 卷 期:2024年第31卷第5期
页 面:925-938页
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:单细胞RNA测序 降维 图正则化 伽玛-泊松分布 非负矩阵分解(NMF)
摘 要:单细胞RNA测序(Single-cell RNA sequencing, scRNA-seq)可以获取单细胞水平的基因表达谱。然而,目前许多基于非负矩阵分解(Non-negative Matrix Factorization, NMF)的降维算法在细胞类型识别中往往忽视了数据概率分布和细胞之间的拓扑关系,无法较好地兼顾数据的全局结构和局部结构。为了克服传统NMF降维算法在处理高维含噪稀疏数据时的不足,本文提出一种改进的单细胞非负矩阵分解算法GPNMF。GPNMF结合了伽玛-泊松(Gamma-Poisson)分布假设和图正则化技术,通过迭代更新因子分解矩阵以最小化重构误差,从而有效地保留数据的局部结构与全局结构。通过引入约束优化并稳定化模型,GPNMF在分解单细胞表达数据时能够提供更为稳健和可靠的结果。最后,利用真实scRNA-seq数据进行实验,验证了GPNMF的有效性,并展示了其在单细胞基因表达数据轨迹推断分析中的潜在应用。