通过基因组选择(Genomic selection,GS)方法加速畜禽遗传改良是全球动物育种者的共识。近年来,高通量测序技术发展迅速,不断降低的测序成本使基因组序列数据(Whole genome sequencing,WGS)用于GS成为可能。基于WGS数据的GS是在传统基因组选择基础上的一个全新研究领域,具有明显的理论优势,即与性状相关的生物学先验知识均可与基因组序列建立映射关系,进而加入到基因组选择模型中,从而提高育种值或表型值的预测准确性,在育种领域具有广阔的应用前景。然而,目前全基因组测序成本仍相对较高,对畜禽群体全群实施全基因组测序仍难以实现。因此,如何利用基因型填充技术以较低成本获取高质量的WGS数据也成为一个亟待解决的关键问题。综上,本文开展了以下研究工作:1)利用筛选关键个体测序以及下载公共数据库重测序数据构建不同的基因型填充参考群,并探究不同策略对基因型填充准确性的影响;2)探究不同策略填充和修剪全基因组序列数据对基因组预测准确性的影响;3)探究全基因组序列数据、基于群体分化信息预选标记以及不同方法构建亲缘关系矩阵对合并群体GS预测准确性的影响;4)探究多组学数据辅助基因组特征标记预选对基因组选择的预测能力的影响。并获得以下研究结果:1)使用合并参考群的基因型填充准确性最高(0.982±0.003)、外部参考群的基因型填充准确性次之(0.920±0.007)、内部参考群的基因型填充准确性最低(0.834±0.012)。利用合并参考群进行基因型填充的最优策略应综合考虑:内部群体的遗传多样性、公共数据库测序个体的可用性、最小等位基因频率、内部参考群个体测序成本以及所需的计算机资源等因素。2)利用基因型填充获取WGS数据进行基因组预测,应考虑基因型填充参考群体与目标群体的亲缘关系,减少基因型填充的异质性,特别是使用外部参考群个体扩大参考群规模时。此外,利用全基因组关联分析(Genome wide association study,GWAS)结果和连锁不平衡(Linkage disequilibrium,LD)信息进行标记预选能够有效地提高基因组预测准确性。3)使用WGS数据、非线性亲缘关系矩阵或固定指数(Fixation index,)预选标记都能提高合并群体基因组选择的准确性。在约克夏猪合并群体中,基于80K芯片使用0.05<<0.15标准预选标记构建非线性亲缘关系矩阵进行基因组预测,母猪的产活仔数(Number of piglets born alive,NBA)和总产仔数(Total number of piglets born,TNB)性状的最高预测准确性分别为0.451和0.490,与直接使用80K芯片构建线性亲缘关系矩阵进行基因组选择的准确性相比,分别提高了15.94%和9.131%。4)多组学数据辅助基因组特征标记预选可以提高基因组预测的准确性。在雌(雄)性果蝇群体中,利用全转录本关联分析(Transcriptome-wide association studies,TWAS)的显著基因的表达数量性状基因座定位(Expression quantitative trait locus mapping,e QTL mapping)结果预选标记进行基因组预测,发现惊吓反应性状的基因组最佳线性无偏预测(Genomic best linear unbiased prediction,GBLUP)和基因组特征最佳线性无偏预测(Genomic feature best linear unbiased prediction,GFBLUP)的最高预测准确性分别为0.437±0.015(0.427±0.015)和0.419±0.016(0.390±0.014),相对比使用完整WGS的GBLUP准确性,分别提高了60.66%(39.09%)和54.04%(27.04%)。总的来说,该研究获得一套基于合并参考群的畜禽基因型填充优化方案,提出了多种预选基因组特征标记的新策略提高基因组选择的预测能力,为基于WGS数据的基因组选择的应用实施提供理论支持及参考依据。
为探究基于A矩阵期望遗传关系最大化(maximizing the expected genetic relationship for matrix A,RELA)、基于A矩阵目标群体遗传方差最小化(minimized the target population genetic variance for matrix A,MCA)、平均亲缘关系最大化...
详细信息
为探究基于A矩阵期望遗传关系最大化(maximizing the expected genetic relationship for matrix A,RELA)、基于A矩阵目标群体遗传方差最小化(minimized the target population genetic variance for matrix A,MCA)、平均亲缘关系最大化(the highest mean kinship coefficients,KIN)、随机选择(random selection,RAN)、共同祖先筛选(common ancestor,CA)等不同参考群筛选方法及参考群规模对基因型填充准确性的影响。本研究使用矮小型黄羽肉鸡作为试验群体,采用鸡600K SNP芯片(Affymetrix Axion HD genotyping array)进行基因分型,测定435羽子代公鸡45、56、70、84、91日龄体重。利用Beagle软件将低密度SNP芯片填充为高密度SNP芯片数据,比较不同参考群筛选方法、参考群规模对基因型填充准确性的影响,以及填充芯片基因组预测准确性。结果表明,使用Beagle 4.0结合系谱信息进行填充效果最佳,其次为Beagle 4.0,而Beagle 5.1填充效果最差。使用MCA方法筛选参考群进行基因型填充准确性最高,使用RAN方法筛选参考群进行基因型填充准确性最低,MCA、RELA、CA 3种方法基因型填充准确性差别较小。相比其他方法,使用MCA方法筛选个体作为参考群将低密度SNP芯片填充至高密度SNP芯片进行基因组选择的预测准确性较高,与真实高密度SNP芯片的基因组预测准确性相差甚微。随着参考群规模增大,基因型填充准确性也随之增加,但增速逐渐下降,最后趋于平缓。综上所述,可以通过参考群筛选方法构建参考群以及控制参考群规模,以保证基因型填充和基因组预测准确性并节省成本,本研究为基因型填充在畜禽遗传育种中的应用提供技术参考。
暂无评论