首页> 中国专利> ATP7B基因突变二代测序自动化分析解读方法和报告系统

ATP7B基因突变二代测序自动化分析解读方法和报告系统

摘要

本发明提出了一种ATP7B基因突变二代测序自动化分析报告系统,包括注释模块、过滤模块、解读模块和报告模块,所述注释模块、过滤模块、解读模块和报告模块依次信号连接;注释模块:调用AnnoVar工具并匹配公用数据库,对变异位点快速注释;过滤模块:根据注释结果,过滤极小致病可能位点;解读模块:载入数据库按ACMG标准对过滤后的位点分类;报告模块:根据报告需要的内容筛选栏目并排序分析解读结果,生成格式化报表。本发明整合了多个数据库,针对本病独立进行分析解读流程的优化,检测领域更为全面、精准,参考信息更为详实。同时,大大降低了对分析业务人员在专业性、经验和知识储备等方面的要求。

著录项

  • 公开/公告号CN112233725A

    专利类型发明专利

  • 公开/公告日2021-01-15

    原文格式PDF

  • 申请/专利权人 合肥达徽基因科技有限公司;

    申请/专利号CN202011097527.2

  • 申请日2020-10-14

  • 分类号G16B20/50(20190101);G16B15/30(20190101);G16B20/30(20190101);G16B50/00(20190101);

  • 代理机构32320 南京禾易知识产权代理有限公司;

  • 代理人张松云

  • 地址 230031 安徽省合肥市蜀山区新产业园振兴路(6号厂房)3层(整层)

  • 入库时间 2023-06-19 09:35:27

说明书

技术领域

本发明涉及一种ATP7B基因突变二代测序自动化分析解读方法和报告系统。

背景技术

肝豆状核变性(Hepatolenticular Degeneration,HLD)由Wilson在1912年首先描述,故又称为Wilson病(Wilson Disease,WD)。WD世界范围发病率为1/30000~1/100000,致病基因携带者约为1/90,在我国世界范围发病率为1/10000,致病基因携带者约为1/50,较为多见。WD好发于儿童青少年、少数成年期发病(5-35岁),男性比女性稍多,病情缓慢发展,可有阶段性缓解或加重,亦有进展迅速者。如不恰当治疗将会致残甚至死亡。WD也是至今少数几种可治的遗传病之一,关键是早发现、早诊断、早治疗。本病若早发现、早诊断、早治疗,一般较少影响生活质量和生存期。晚期治疗基本无效,少数病情进展迅速或未经治疗出现严重肝脏和神经系统损害者预后不良,会致残甚至死亡。患者的主要死因是肝衰竭、自杀和肿瘤。尽管20年来早期诊断和治疗水平有了较大的进步,但肝豆状核变性患者的死亡率还是较高,预后不佳。2018年5月11日,国家卫生健康委员会等5部门联合制定了第一批罕见病目录,肝豆状核变性被收录其中。同时也是ACMG SF v2.0要求必须报告的59个突变基因之一。

肝豆为常染色体隐性遗传的铜代谢障碍性疾病,以铜代谢障碍引起的肝硬化、基底节损害为主的脑变性疾病为特点。已知致病基因ATP7B定位于染色体13q14.3,编码一种1411个氨基酸组成的铜转运P型ATP酶。ATP7B基因突变导致ATP酶功能减弱或消失,引致血清铜蓝蛋白(CP)合成减少以及胆道排铜障碍,蓄积在体内的铜离子在肝、脑、肾、角膜等处沉积,引起进行性加重的肝硬化、锥体外系症状、精神症状、肾损害及角膜色素环(K-F环)等。但其铜代谢异常的机制,迄今尚未完全阐明。ATP7B基因的变异位点繁多,人类基因组数据库中记载达300多个位点(HGMD当前收录873个)。基因突变位点具有种族特异性,因此基因检测位点的选择要有针对性。我国WD患者的ATP7B基因有3个突变热点,即R778L,P992L和T935M,占所有突变的60%左右。

基因检测是肝豆临床诊断的金标准。当前临床上针对肝豆的基因检测方法,主要是对ATP7B基因进行Sanger直接测序(一代测序)。由于Sanger测序的长度限制,在部分实践中仅检测该基因突变热点及其附近区域;或者采用数十对引物(一般20对以上)分段扩增该基因编码区并分别测序。前者将导致非热点突变的漏检(这部分比例将高达40%以上),而后者则大大增加了工作量和成本。尤其是一代测序的读图,极大程度上依赖于人工仔细的校对峰图,寻找到变异位点后再由其它手段定位到基因组上,再籍经验判断其致病性,或者通过人工的文献检索和数据库检索来确定其致病性。不仅工作量巨大,而且面对大量样本时,人工分析难免疏漏和错误的产生。解读速度偏慢影响检测的极致交付,解读结果的准确性很大程度取决于解读人员的专业性和经验。

当前二代测序的全外显子组或部分遗传性疾病的大PANEL中亦有包括ATP7B基因检测的内容。但是因其包含内容广泛,分析解读的流程无法针对肝豆病进行专门的优化,亦不能集成肝豆病专门的数据库资源进行针对性的分析和报告,在专门针对本病的检测中效能明显不足;同时由于检测范围较大,对硬件系统的开销也较大(需要大型的服务器和Linux操作系统等)。

发明内容

本发明要解决的技术问题是克服现有技术存在的缺陷,本发明提出了一种ATP7B基因突变二代测序自动化分析解读方法和报告系统,降低对分析业务人员在专业性、经验和知识储备等方面的要求。

为解决上述技术问题,本发明采用的技术方案是:一种ATP7B基因突变二代测序自动化分析报告系统,包括注释模块、过滤模块、解读模块和报告模块,所述注释模块、过滤模块、解读模块和报告模块依次信号连接;

注释模块:调用AnnoVar工具并匹配公用数据库,对变异位点快速注释,快速注释的角度包括位置、功能、变异频率和数据库收录;

过滤模块:根据注释结果,过滤极小致病可能位点,过滤类别包括按热点类型,按变异在基因上的位置和按功能类型;

解读模块:载入数据库按ACMG标准对过滤后的位点分类,ACMG标准分别为致病性、可能致病性、意义未明、可能良性和良性;

报告模块:根据报告需要的内容筛选栏目并排序分析解读结果,生成格式化报表;

所述解读模块中载入的数据库包括公共免费的WD数据库、商业收费的突变数据库HGMD中肝豆相关的部分、自建的基于文献检索和经验积累的已知肝豆致病突变数据库、自建的基于二代测序大量实践积累的常见假阳性报告位点数据库、自建的正常对照人群ATP7B基因高深度二代测序的背景变异库、自建的大规模患者样本ATP7B基因检测结果对比数据库。

进一步地,所述报告模块将所述分析解读结果剔除良性和疑似良性的变异项,以及剔除一些低质量的项目。

进一步地,所述注释模块中匹配的公用数据库包括refGene,dbSNP,1000genomes,ExAC,gnomAD,ClinVar,InterVar,dbNSFP。

进一步地,所述解读模块中载入的数据库包括公共免费的WD数据库、商业收费的突变数据库HGMD中肝豆相关的部分、自建的基于文献检索和经验积累的已知肝豆致病突变数据库、自建的基于二代测序大量实践积累的常见假阳性报告位点数据库、自建的正常对照人群ATP7B基因高深度二代测序的背景变异库、自建的大规模患者样本ATP7B基因检测结果对比数据库。

为解决上述技术问题,本发明采用的另一技术方案是:一种ATP7B基因突变二代测序自动化ATP7B基因突变二代测序自动化分析解读方法,其特征在于,包括如下步骤:

S1、测序数据的获取:通过靶向扩增建库或捕获建库进而二代测序获得的下机数据,经测序系统或公共分析工具分析取得的变异信息文件;

S2、注释变异信息:调用AnnoVar工具和匹配的数据库对变异位点快速注释;

S3、初步过滤变异信息:基于注释信息,对所有变异按是否热点突变、基因位置、功能类型进行初步过滤;

S4、分析解读变异信息:集成数据库,遵循ACMG标准进行致病性评估分级,并排除部分假阳性和假阴性位点;

S5、生成报告:导入分析解读的结果,设定最终输出报告中的变异信息组成成分和先后顺序,按指定的报告模板输出打印为PDF文件。

进一步地,所述S2中快速注释的角度包括位置、功能、变异频率和数据库收录。

进一步地,所述S3中基因位置包括间隔区、非翻译区、内含子区和非编码区,功能类型包括同义突变、未知突变和剪接调控位点。

进一步地,所述S4中ACMG标准包括致病性、可能致病性、意义未明、可能良性和良性。

与现有技术相比,本发明的有益效果包括:

1)自动化的分析和报告流程,友好、简单的用户交互操作,避免了传统Sanger测序大量人工操作(如读图、变异定位、文献检索等)的庞大工作量和易导致的错误,以及在报告生成过程中人工复制粘贴产生的错误。

2)整合了公共数据库、购买的商业数据库相关部分子集、自建的背景库、假阳性库、全球最大规模的患者数据库等,针对本病独立进行分析解读流程的优化,相较市场上其它包含本病的检测产品,在本病检测领域更为全面、精准,参考信息更为详实。同时,大大降低了对分析业务人员在专业性、经验和知识储备等方面的要求。

附图说明

参照附图来说明本发明的公开内容。应当了解,附图仅仅用于说明目的,而并非意在对本发明的保护范围构成限制。在附图中,相同的附图标记用于指代相同的部件。其中:

图1示意性显示了根据本发明一个实施方式提出的ATP7B基因突变二代测序自动化分析报告系统流程图。

图2示意性显示了根据本发明一个实施方式提出的ATP7B基因突变二代测序自动化分析解读方法流程图。

具体实施方式

容易理解,根据本发明的技术方案,在不变更本发明实质精神下,本领域的一般技术人员可以提出可相互替换的多种结构方式以及实现方式。因此,以下具体实施方式以及附图仅是对本发明的技术方案的示例性说明,而不应当视为本发明的全部或者视为对本发明技术方案的限定或限制。

根据本发明的一实施方式结合图2示出。一种ATP7B基因突变二代测序自动化分析解读方法,包括如下步骤:

S1、测序数据的获取:通过靶向扩增建库或捕获建库进而二代测序获得的下机数据,经测序系统内置程序(如Ion Torrent平台上的TVC插件)或其它公共分析工具(如GATK)分析取得的变异信息文件(VCF格式文件),可作为本系统的输入;

S2、注释变异信息:通过图形化的用户交互界面,只须用户通过点击选择待分析样本的VCF文件(可一次导入多个样本),按默认的参数设置直接运行,即可后台调用目前国际上最通用最广泛认可的AnnoVar工具和匹配的公用数据库如refGene,dbSNP,1000genomes,ExAC,gnomAD,ClinVar,InterVar,dbNSFP等,对所有检出的变异位点逐一进行位置、功能、变异频率、数据库收录等多角度的快速注释。

refGene:变异位点在基因上的位置信息和变异类型;

dbscsnv11:变异对转录本剪接可能的影响;

1000g2015aug_all:千人基因组计划中该变异位点在全球人群中的频率信息;

1000g2015aug_eas:千人基因组计划中该变异位点在东亚人群中的频率信息;

exac03:ExAC数据库中该变异位点的人群频率信息;

gnomad_exome:gnomAD外显子组数据库中该变异位点的人群频率信息;

gnomad_genome:gnomAD全基因组数据库中该变异位点的人群频率信息;

clinvar_20170905:ClinVar数据库对该位点变异的致病性推断;

intervar_20170202:InterVar数据库对该位点变异的致病性推断;

avsnp150:dbSNP数据库收录的该变异位点的rsid编号;

dbnsfp33a:dbNSFP数据库收录的对该变异位点有害性的各软件评估。

S3、初步过滤变异信息:基于上述注释信息,对所有变异按是否热点突变、基因位置(间隔区、非翻译区、内含子区、非编码区等)、功能类型(同义突变、未知突变、剪接调控位点)进行初步过滤。

按热点类型:可选过滤掉未突变的热点、未覆盖的热点以及非热点突变;

按基因位置:过滤掉基因上下游及基因间隔区的变异、过滤掉非翻译区、非剪接突变可能的内含子区变异、注释为非编码RNA的变异等,这些位置上的变异,非常小可能会致病。

按功能类型:可选过滤掉同义突变、未知突变、预测的剪接调控位点等,这些类型的变异致病可能亦稍弱。

S4、分析解读变异信息:与WES或其它基因检测大PANEL较大的不同在于,我们的分析除了遵循ACMG变异解读标准之外,额外集成了多个专门针对肝豆病的信息库包括:

a)公共免费的WD数据库,如Wilson Disease Mutation Database

b)商业收费的突变数据库HGMD中肝豆相关的部分

c)自建的基于文献检索和经验积累的已知肝豆致病突变数据库:结合临床实践和文献阅读积累的已知肝豆状核变性病常见突变(或称热点突变)的集合。

d)自建的基于二代测序大量实践积累的常见假阳性报告位点数据库:采用ATP7B基因突变检测试剂盒检测了逾3000例样本,并对检测结果进行了一代测序的验证,从中发现由于该平台测序原理或特殊序列结构导致假阳性变异位点的错误报告。据此将这些假阳性位点建立数据库,在分析流程中自动过滤掉这些假阳性位点。

e)自建的正常对照人群ATP7B基因高深度二代测序的背景变异库:采用ATP7B基因突变检测试剂盒检测200例正常中国人群(成年的非患本病的健康人)。与参考基因组进行比对后,将所有检测出的正常人群的变异位点(含多态性位点和突变位点)信息(主要是基因组位置信息、变异在正常人群中的频率信息、基因型)整合成数据库,在分析流程中主要用作过滤非致病性的变异。

f)自建的大规模患者样本ATP7B基因检测结果对比数据库:采用ATP7B基因突变检测试剂盒检测逾3000例样本,并对检测结果进行了一代测序的验证。检测出的每个样本的基因变异(含多态性位点和突变位点)信息,结合患者表型信息,以及统计后的每变异在大规模患者群体中的等位碱基频率和基因型频率信息,建立数据库,在分析流程中主要用作匹配发现致病性的变异。

以上数据库皆可由用户根据研究进展较为方便地进行更新扩展。通过集成以上专门针对肝豆病的专业数据库和自建数据库,再遵循ACMG标准进行致病性评估分级,能够更全面地、快速地检出肝豆已知致病突变和未知可疑的致病突变,并排除部分假阳性和假阴性位点。

S5、生成报告:通过简单地导入上述分析解读的结果,设定最终输出报告中的变异信息组成成分和先后顺序,并按指定的报告模板输出打印为PDF文件。

基于上述方法结合图1示出,建立一种ATP7B基因突变的二代测序自动化报告系统,包括注释模块、过滤模块、解读模块和报告模块,所述注释模块、过滤模块、解读模块和报告模块依次信号连接;

注释模块:通过靶向扩增建库或捕获建库进而二代测序获得的下机数据,经测序系统内置程序(如Ion Torrent平台上的TVC插件)或其它公共分析工具(如GATK)分析取得的变异信息文件(VCF格式文件),可作为本模块的输入(也是本程序的起始输入数据)。通过图形化的用户交互界面,只须用户通过点击选择待分析样本的VCF文件(可一次导入多个样本),按默认的参数设置直接运行,即可后台调用目前国际上最通用最广泛认可的AnnoVar工具和匹配的公用数据库如refGene,dbSNP,1000genomes,ExAC,gnomAD,ClinVar,InterVar,dbNSFP等,对所有检出的变异位点逐一进行位置、功能、变异频率、数据库收录等多角度的快速注释。

过滤模块:根据注释模块的注释结果,先进行一次初步的过滤。其主要目的,是为了减少后续更复杂的分析流程的工作量,先把极小致病可能的位点过滤掉。过滤选项的设定,的可以分为三个类别:一是按热点类型:可选过滤掉未突变的热点、未覆盖的热点以及非热点突变。二是按变异在基因上的位置:过滤掉基因上下游及基因间隔区的变异、过滤掉非翻译区、非剪接突变可能的内含子区变异、注释为非编码RNA的变异等,这些位置上的变异,非常小可能会致病。三是按功能类型,可选过滤掉同义突变、未知突变、预测的剪接调控位点等,这些类型的变异致病可能亦稍弱。在这一模块,用户可以自定义设置参数,输出结果均可作为下一步的输入,一般用默认参数即可取得较好的结果。输出文件会在输入文件后添加.filter的后缀名。

解读模块:该模块导入过滤模块的数据作为输入,同时自动载入上述的专业数据库、商用数据库、自建数据库信息。使用默认参数,点击运行即可实现这一步的分析。集结上述注释模块AnnoVar对每个变异位点的注释信息,以及在本模块拓展的多个专业、商用、自建数据库信息,按照国际通行的ACMG标准进行逐项的匹配打分;最后根据ACMG规范,根据评估的不同证据组合对每个变异位点的致病性按照致病性(Pathogenic)、可能致病性(Likely Pathogenic)、意义未明(VUS)、可能良性(Likely Benign)、良性(Benign)进行分类。

报告模块:将上述分析解读的结果,剔除良性和疑似良性的变异项,以及剔除一些低质量的项目(测序深度过低或等位碱基检出比过低),并根据最终的报告需要的内容筛选栏目并排序,生成格式化的报表。

该模块输出结果将在输入文件后添加.report的文件后缀名,该文件可用Excel打开检阅。同时,该文件亦可导入独立的报告系统生成系统中,形成报告内容。为方便针对不同的机构定制不同的模板,该报告生成系统与上述的报告模块是分割开的。通过导入样本信息数据源或人工输入样本信息,再导入上述报告生成模块的输出文件(.report文件),再添加结果提示,最后点击生成,即可生成PDF报告。

本发明的技术范围不仅仅局限于上述说明中的内容,本领域技术人员可以在不脱离本发明技术思想的前提下,对上述实施例进行多种变形和修改,而这些变形和修改均应当属于本发明的保护范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号