咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于随机森林的电离辐射诱导DNA双链断裂分类模型的构建与应用 收藏 评论(0)

基于随机森林的电离辐射诱导DNA双链断裂分类模型的构建与应用

Construction and application of a random forest-based classification model for DNA double-strand break induced by ionizing radiation

作     者:陈锦华 黄晓婷 金佳颖 丁伯洋 朱冉 李文艳 刘芬菊 俞家华 Chen Jinhua;Huang Xiaoting;Jin Jiaying;Ding Boyang;Zhu Ran;Li Wenyan;Liu Fenju;Yu Jiahua

作者机构:苏州大学放射医学与防护学院放射医学与辐射防护国家重点实验室江苏省高校放射医学协同创新中心215123 

出 版 物:《中华放射医学与防护杂志》 (Chinese Journal of Radiological Medicine and Protection)

年 卷 期:2021年第41卷第6期

页      面:413-417页

核心收录:

学科分类:0831[工学-生物医学工程(可授工学、理学、医学学位)] 100207[医学-影像医学与核医学] 1006[医学-中西医结合] 1002[医学-临床医学] 1001[医学-基础医学(可授医学、理学学位)] 08[工学] 1010[医学-医学技术(可授医学、理学学位)] 100106[医学-放射医学] 100602[医学-中西医结合临床] 10[医学] 

基  金:国家自然科学基金(81872548) 

主  题:电离辐射 DNA双链断裂 随机森林 分类模型 表观遗传学 

摘      要:目的构建预测电离辐射诱导DNA双链断裂(DSB)水平的随机森林分类模型,初步研究DSB在基因组中的分布规律。方法将GRCh38参考基因组分为50 kb的片段,根据MCF-7细胞的测序数据把片段分为电离辐射诱导的DSB低水平和高水平区域,以8种表观遗传学特征作为输入,随机将数据集的2/3列为训练集,1/3列为测试集,构建含100棵决策树的随机森林分类模型。分析分类模型中表观遗传学的特征重要性,展示这些标记在不同DSB水平区域的富集差异。结果随机森林分类模型在测试集上预测的准确率为99.4%,精准率为98.9%,召回率为99.9%,受试者操作特征曲线下面积为0.994。8个特征中H3K36me3和DNase标记的重要性最高,富集分析表明DSB高水平区域的这两类标记明显高于DSB低水平区域。结论以表观遗传学数据作为特征输入,随机森林分类模型可在50 kb基因组区域上准确预测电离辐射诱导的DSB水平,分析表明这些DSB可能主要分布在基因组中转录活跃的部位。

读者评论 与其他读者分享你的观点