首页> 中文期刊> 《棉花学报》 >多倍体同源区段二代测序生物信息学分析关键参数优化

多倍体同源区段二代测序生物信息学分析关键参数优化

         

摘要

【目的】多倍体植物同源区段单核苷酸多态性(Single nucleotide polymorphism,SNP)标记分型挑战颇大。本研究以四倍体陆地棉同源区段聚合酶链式反应(Polymerase chain reaction,PCR)靶向扩增子数据集为例,观测同源区段的影响并优化生物信息学分析方案。【方法】首先扩增并测序获得136个陆地棉样本DNA的包含潜在变异的3个区段,其次使用不同参数进行比对与SNP检出,最后比较优化不同方案分析结果的异同。【结果】常规分析发现,区段1的3个SNP位点和区段2的1个SNP位点在样本中均鉴定为野生型或纯合突变型,而几乎所有样本的区段3鉴定为杂合突变型。Blast分析表明,位于A12染色体的区段3与其同源序列(位于D12染色体)相似性为96.28%。仅将区段3的同源序列作为参考序列分析,潜在SNP位点的基因型鉴定结果无变化;而将区段3与其同源序列同时作为参考序列分析,比对到区段3与其同源序列的读长的比例分别为48%、52%,因此存在较多同源区段3的读长是导致分型错误的主要原因,并确定了区段3潜在SNP位点的基因型应为TT。此外,通过对比GATK结果在区段3发现了2个新SNP且排除了3个因部分同源序列变异造成的假阳性SNP。【结论】本研究验证了同源序列的存在会严重影响多倍体SNP鉴定与生物信息学分析;对关键参数优化特别是将多倍体同源序列同时作为参考序列,能够提高SNP分型的准确度。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号