咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >Oligo基因芯片的异常值处理对有监督疾病分类的影响 收藏

Oligo基因芯片的异常值处理对有监督疾病分类的影响

Effects of Outlier Treatments on Disease Classification for Oligo Microarray Data

作     者:吕莹丽 王栋 郭政 于梁梁 李彦辉 朱晶 王晨光 LV Ying-Li;WANG Dong;GUO Zheng;YU Liang-Liang;LI Yan-Hui;ZHU Jing;WANG Chen-Guang

作者机构:哈尔滨医科大学生物信息学系哈尔滨150086 

出 版 物:《中国生物医学工程学报》 (Chinese Journal of Biomedical Engineering)

年 卷 期:2008年第27卷第1期

页      面:69-75页

核心收录:

学科分类:08[工学] 080501[工学-材料物理与化学] 0805[工学-材料科学与工程(可授工学、理学学位)] 080502[工学-材料学] 

基  金:国家自然科学基金(39970397,30170515,30370388,)资助项目 国家863计划(2003AA2Z2051 2002AA2Z2052)资助项目 哈医大211工程“十五”建设项目 

主  题:基因表达谱 异常值分类 功能表达谱 

摘      要:基因芯片实验产生的表达谱数据中存在大量不合格的检测点,对异常值的不同处理,对于有监督疾病分类结果的影响很大。针对此问题,在Oligo芯片数据中,在表达水平层面,通常对检测值做最大值和最小值的预处理后,进行后续分析。本研究选取了四套Oligo芯片数据集,采用不同限定芯片数据中最大值和最小值的方法,考察支持向量机、K近邻、决策树三种分类器对分类疾病样本效能的影响程度。结果显示:Dudoit等限定最大值和最小值分别为16000和100是一种合理的策略,可以达到很好的分类效果。同时发现对于小于100的检测值较多的数据集,采用限定最小值为10的策略同样能得到很好的分类效果,并可以为后续分析保留更多的原始数据。因此,合理限制Oligo芯片中的异常值,对于提高疾病分型是一种较好的策略。进一步采用功能表达谱方法,构造反映功能结点中全部注释基因的总体表达状态的均值或中值指标,利用构建的功能表达谱进行分类分析。发现不同异常值的限定方法对基于功能表达谱进行分类得到的准确率的影响较小,可以获得较稳定的分类结果。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分