肺癌是发病率和死亡率最高的恶性肿瘤,对人类的身体健康构成了严重威胁。肺腺癌(Lung Adenocarcinoma,LUAD)的发病率在肺癌所有病理类型中所占比例最大。尽管对于肺腺癌的研究连续不止,但是肺腺癌的产生机制尚不明确。差异表达基因是指一个基因在不同环境下,表达有显著性差异的基因。越来越多的研究表明差异表达基因在疾病发生等过程中发挥重要的作用。因此,从差异表达基因的角度研究肺腺癌的产生以及发展的机制对于肺腺癌的早期诊断和后期治疗具有重要意义。本文基于TCGA(The Cancer Genome Altas,TCGA)数据库592例肺腺癌样本的表达数据,筛选出7079个差异表达基因,并对差异表达基因进行功能富集分析和组蛋白分布水平的分析。其次,我们对所有差异表达基因进行加权基因共表达网络分析,得到了4个与肺腺癌显著相关的风险模块。我们对肺腺癌风险模块进行基因本体论分析,研究了风险模块主要富集的生物过程,并根据模块身份MM和连接度确定了每个风险模块的枢纽基因。FHL1、PTPRB、LINC00968、LINC01996、LINC00987、DOK2、SPI1、BUB1、NCAPG和CDK5RAP3是四个肺腺癌风险模块中最显著的枢纽基因。其中FHL1、PTPRB、DOK2、SPI1、BUB1、NCAPG、CDK5RAP3、LINC00968和LINC01996已经被证实与许多恶性肿瘤及其他复杂疾病高度相关。虽然目前对LINC00987的研究还不够充分,不过我们认为LINC00987可能与其他枢纽基因一样重要,都有可能作为肺腺癌早期诊断或预后的生物分子标志物,帮助我们更深入地研究肺腺癌的病理机制。
目的:本研究通过对公共数据库TCGA(The Cancer Genome Atlas)的高通量数据——结肠癌m-RNA表达谱芯片进行生物信息学分析,探索结肠癌导致的基因表达水平改变,对癌组织与癌旁组织的差异表达基因进行共表达网络分析,并估计结肠癌患者的生...
详细信息
目的:本研究通过对公共数据库TCGA(The Cancer Genome Atlas)的高通量数据——结肠癌m-RNA表达谱芯片进行生物信息学分析,探索结肠癌导致的基因表达水平改变,对癌组织与癌旁组织的差异表达基因进行共表达网络分析,并估计结肠癌患者的生存期,为探索结肠癌的分子机制和预后分析提供基础科学依据。方法:在公开阅览的TCGA网站(http://cancer ***/)下载大肠癌基因表达谱数据集,包括:(1)32例结肠癌(结肠癌组)和32例癌旁组织(癌旁组)的mRNA测序数据3级(原计数和期望最大化(RSEM)归一化RNA-seq读取计数);(2)507例结肠癌患者的m-RNA以及临床信息。经合并、整合后利用R软件质控后对32对结肠癌组和癌旁组的20531个基因进行m-RNA差异表达分析以及差异表达基因的热图制作,对差异表达基因进行共表达网络分析,对507例结肠癌患者进行生存分析。结果:在结肠癌数据集中32对结肠癌组和癌旁组的20531个基因中筛选出结肠癌中2939个基因有显著的表达差异,其中上调基因1533个,下调基因1406个。对2939个差异表达基因进行WGCNA分析,最终得到10个共表达基因模块。对507例结肠癌患者估计中位生存期为7.57年,95%置信区间为(3.93,9.62)年。结论:本研究通过对公开数据库TCGA的初步挖掘,发现结肠癌的差异表达基因以及寻找结肠癌差异表达基因共表达的模块,可以对结肠癌基因组学相关研究提供经验与参考。
暂无评论