版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
专利申请号:CN202310126779.0
公 开 号:CN116072217B
代 理 人:杭州信与义专利代理有限公司万景旺
代理机构:杭州信与义专利代理有限公司
专利类型:发明专利
申 请 日:20230725
公 开 日:20221102
专利主分类号:G16B25/10
关 键 词:基因表达量 拐点 细胞区 分析 数据可用性 样本数据 转录组 空液 判定 细胞 变化幅度 生物数据 可用性 表达谱 不可用 基因组 比对 遍历 磁珠 可用 排序 统计 预警 参考 分类
摘 要:本发明公开了一种单细胞转录组数据可用性分析方法,涉及生物数据分析方法。包括以下步骤:根据基因表达量从大到小对barcode进行排序;求得基因表达量变化幅度的拐点;遍历所有拐点,将barcode分类为细胞区、空液滴区和磁珠区并统计相应的barcode数量;提取细胞区所有barcode的表达谱;统计比对上参考基因组的read数,计算细胞的平均read数;当有至少一个拐点对应的基因表达量大于G1,有至少1个拐点对应的基因表达量大于G2小于G1,且细胞区的barcode数量大于K3,空液滴区的barcode数量大于K4,细胞的平均read数大于K6时,判定样本数据可用;否则,判定样本数据不可用。本发明能系统性地分析单细胞转录组数据的可用性,在下游分析前提供数据可用性预警,节省分析人员的分析时间与精力。