咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >PUseqClust:一种RNA-seq数据聚类分析方法 收藏

PUseqClust:一种RNA-seq数据聚类分析方法

PUseqClust: A Clustering Analysis Method for RNA-Seq Data

作     者:石险峰 刘学军 张礼 SHI Xian-Feng;LIU Xue-Jun;ZHANG Li

作者机构:南京航空航天大学计算机科学与技术学院江苏南京211106 南京林业大学信息科学技术学院江苏南京210037 

出 版 物:《软件学报》 (Journal of Software)

年 卷 期:2019年第30卷第9期

页      面:2857-2868页

核心收录:

学科分类:08[工学] 0835[工学-软件工程] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家自然科学基金(61170152) 航空基金(20151452021) 

主  题:RNA-seq 聚类分析 负二项分布 拉普拉斯方法 混合t分布 

摘      要:基因的聚类分析是基因表达数据分析研究的重要技术,它按照表达谱相近原则将基因表达数据归类,探究未知的基因功能.近年来,RNA-seq 技术广泛应用于测量基因表达水平,产生了大量的读段数据,为基因表达聚类分析提供了充分条件.由于读段非均匀分布的特性,对读段计数一般采用负二项分布进行建模.现有的负二项分布算法和传统的聚类算法对于聚类分析都是直接对读段计数进行建模,没有充分考虑实验本身存在的各种噪声,以及基因表达水平测量的不确定性,或者对聚类中心的不确定性考虑不够.基于 PGSeq 模型,模拟读段的随机产生过程,采用拉普拉斯方法考虑多条件多重复基因表达水平之间的相关性,获得了基因表达水平的不确定性,联合混合 t 分布聚类模型,提出 PUseqClust(propagating uncertainty into RNA-seq clustering )框架进行 RNA-seq 读段数据的聚类分析.实验结果表明,该方法相比其他方法获得了更具生物意义的聚类结果.

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分