首页> 中文会议>第三届全国动植物数量遗传学学术研讨会 >基于贝叶斯统计的遗传连锁分析方法

基于贝叶斯统计的遗传连锁分析方法

摘要

统计分析在遗传学研究领域有着广泛的应用.然而,大多数的研究人员都使用经典的统计分析方法,包括:假设检测、参数的点估计和区间估计等.这些经典方法在多数情况是十分有效的.然而,近年来贝叶斯统计以其鲜明的特点和独到的分析方法,已逐渐引起了人们的重视,在统计学界逐渐被认可.Gelman等、David、Chib等以及Hastings详细阐述了马尔可夫链蒙特卡罗理论(MCMC)、Gibbs抽样以及Metropolis-Hastings算法,使得贝叶斯方法能够很好实现.对侧重于统计应用的研究者来说,它能为一些问题提供更直接的解决方法并可将先验信息综合其中;同时,贝叶斯方法对结果的解释更加直观.特别是在复杂的遗传学问题或者经典的统计方法无法解决的问题上,贝叶斯统计已得到迅速发展,并日益得到遗传学家的广泛应用.遗传图谱在遗传学的诸多领域,如QTL分析,图位克隆方面起着重要作用.而图谱的构建有赖于基因座位间的遗传重组率或遗传距离的估计,这是遗传学研究中的经典问题,也是基因组分析的基础.本文从简单的两点和三点分析出发,探讨了贝叶斯理论和MCMC模型在连锁分析和遗传图谱构建方面的应用.在本文两个位点的连锁分析中,如何选取合适的先验分布是一个重要问题,因为先验的选取对后验分布影响很大.而选取p分布作为遗传重组率分布的先验分布,这是因为两个位点的遗传重组率的参数r在以往的诸多研究中很容易获得,如果现在获得了一个观察数据,要得到基于这个观察数据的重组率,它显然有一个客观、合理的先验分布,就是一个β分布.选取这样的分布符合贝叶斯先验分布选取的基本原则,同时Gelman等人也建议使用β分布作为遗传重组率分布的先验分布.导出r的先验分布后就可获得其后验分布,采用Gibbs抽样方法在其后验分布中抽取大量样本,并进行统计分析,这样即可得到遗传重组率的后验平均值和标准差.然而,构建连锁图谱首先需要测验两个标记或基因位点是否在同一连锁群上.因此,对于上面获得的遗传重组率需要进行假设检验.这里可以求得相应贝叶斯因子,作为两个标记或基因位点连锁与否的判别标准.由此,推广到多个位点情况,就可以确定一个连锁群.确定连锁群后,需要对连锁群上所有位点进行排序.本文以简单的三个位点情况进行分析.以β分布作为遗传重组率分布的先验分布,在约束符合系数在0到1的情况下,采用基于Metropolis-Hastings算法的MCMC模型,通过大量的运算,获得连锁群上各个基因位点最可能的排序,并计算各位点间的遗传距离,从而构建相应的遗传图谱.本文虽然只是研究了两点和三点的情况,但这完全可以推广到一个连锁群的情况,实现基于贝叶斯统计的遗传连锁图谱的构建.为说明该方法的有效性和实用性,我们编制了相应的SAS程序,将模拟研究和实例分析的结果与极大似然法进行了比较,结果表明贝叶斯方法显然是有效而实用的.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号