首页> 中国专利> 用于使用散在遗传元件进行遗传检测的方法:多路复合的DNA分析系统

用于使用散在遗传元件进行遗传检测的方法:多路复合的DNA分析系统

摘要

通过利用靶向反转录转座子的靶位点重复(TSD)序列的小-引物策略,无关插入元件的大小,包括SINE、LINE和SVA的INNUL标志物都可有效地用作用于人鉴定和生物祖系研究的标志物。可大幅降低用于INNUL的扩增子大小以及等位基因状态之间的差异,使得这些标志物对于分析高品质或低品质的人DNA样品有效。成功地设计了以四颜色检测的对DNA进行单管扩增的15种RE标志物和珐琅蛋白(用于性别决定)多路复合。该多路复合提供了适于法医学和亲子分析的辨别力。此外,该检测的灵敏度可使得能够对法医学样品和人类学样品进行人身份和生物祖系研究。根据全球群体中的等位基因分布,可选择INNUL用于人身份测试或用于生物祖系研究。

著录项

  • 公开/公告号CN104822845A

    专利类型发明专利

  • 公开/公告日2015-08-05

    原文格式PDF

  • 申请/专利权人 素德赫·辛哈;

    申请/专利号CN201380062590.4

  • 发明设计人 素德赫·辛哈;

    申请日2013-10-15

  • 分类号

  • 代理机构北京英赛嘉华知识产权代理有限责任公司;

  • 代理人王达佐

  • 地址 美国路易斯安那州

  • 入库时间 2023-12-18 10:02:35

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-02-26

    授权

    授权

  • 2015-11-04

    实质审查的生效 IPC(主分类):C12Q1/68 申请日:20131015

    实质审查的生效

  • 2015-08-05

    公开

    公开

说明书

对优先权的要求

本申请根据35 U.S.C.§119,引用、并入且要求较早前于2012年10 月15日提交到美国专利和商标局并在当时分配了序列号61/714,088的申 请METHOD FOR GENETIC DETECTION USING INTERSPERSED  GENETIC ELEMENTS:A MULTIPLEXED DNA ANALYSIS SYSTEM(用 于使用散在遗传元件进行遗传检测的方法:多路复合的DNA分析系统) 的所有权益。

技术领域

本发明总体涉及人鉴定和生物祖系测试,并且更具体地,涉及在分 析用于人身份测试或用于生物祖系研究的人DNA样品期间提高检测灵 敏度的改进。

发明背景

短串联重复(STR)位点是用于人身份测试的主要遗传标志物。这些 标志物是高多态性的,并且提供了高检测灵敏度,使得可分析相对较低 的模板DNA量(1ng至250pg)(Andersen,J.F.等,Further validation of a  multiplex STR system for use in routine forensic identity testing,Forensic  Science International,78(1):47-64(1996);Brinkmann,B.等,Mutation rate  in human microsatellites:influence of the structure and length of the tandem  repeat,The American Journal of Human Genetics,62(6):1408-1415(1998); Collins,P.J.等,Developmental validation of a single-tube Amplification of the  13CODIS STR Loci,D2S1338,D19S433,and amelogenin:ThePCR Amplification Kit,Journal of Forensic Sciences,49(6): 1265-1277(2004);LaFountain,M.J.等,TWGDAM Validation of the  AmpFeSTR Profiler Plus and AmpFeSTR COfiler STR Multiplex Systems  Using Capillary Electrophoresis,Journal of Forensic Sciences,46(5): 1191-1198(2001);Micka,K.A.等,Validation of multiplex polymorphic STR  amplification sets developed for personal identification applications,Journal  of Forensic Sciences,41:582-590(1996);Moretti,T.等,Validation of short  tandem repeats(STRs)for forensic usage:performance testing of fluorescent  multiplex STR systems and analysis of authentic and simulated forensic  samples,Journal of Forensic Sciences,46(3):647(2001))。

包括长散在核元件(LINE)、短散在核元件(SINE)和SVA元件的 可反转录转座元件(RE)是可用于人身份测试的另一组标志物。SINE是 通常小于500核苷酸长的一类RE;而LINE是通常大于500核苷酸长的 LINE(A.F.A.Smit,The origin of interspersed repeats in the human genome, Current Opinion in Genetics Development,6(6):743-748(1996);Batzer,M.A. 等,Alu repeats and human genomic diversity,Nature Reviews Genetics,3(5): 370-379(2002);Batzer,M.A.等,African origin of human-specific  polymorphic Alu insertions,Proceedings of the National Academy of Sciences, 91(25):12288(1994);Feng,Q.等,Human L1retrotransposon encodes a  conserved endonuclease required for retrotransposition,Cell,87(5):905-916 (1996);Houck,C.M.等,A ubiquitous family of repeated DNA sequences in  the human genome,Journal of Molecular Biology,132(3):289-306(1979); Kazazian,H.H.等,The impact of L1retrotransposons on the human genome, Nature Genetics,19(1):19-24(1998);Ostertag,E.M.等,Biology of  mammalian L1retrotransposons,Annual Review of Genetics,35(1):501-538 (2001))。LINE全长元件长度为~6kb,包含聚合酶II的内部启动子以及 两个开放阅读框(ORF),并且以多聚A尾终止。SINE包括Alu元件— —灵长类的特异性SINE,其在人基因组中已经达到了超过一百万的拷贝 数。一开始,由其散在性质和长度(75bp至500bp)来定义SINE,但 是还通过RNA聚合酶III转录来表征SINE。第三种RE是被称为SVA (SINE/VNTR/Alu)元件的复合反转录转座子(Wang,H.等,SVA Elements: A Hominid-specific Retroposon Family,J.Mol.Biol.354:994–1007 (2005))。SVA是复合元件,根据其主要组分SINE、可变数目的串联重复 (VNTR)和Alu来命名。作为VNTR区的结果,全长SVA元件的大小 可广泛变化。这些标志物具有用于身份测试、亲缘关系分析和进化研究 的潜在应用性(参见上文引用的文献Smit;Batzer等(2002);Batzer等 (1994);Feng等;Houck等;Kazazian等;以及Ostertag等)。插入和无 效等位基因(INNUL)标志物可包括SINE、LINE和SVA。

图1中描述了RE的结构。散在重复的Alu家族是灵长类基因组中最 成功的移动遗传元件,其已经扩增至每单倍基因组大于500,000的拷贝 数。Alu元件通过在定义为反转录转座的过程中的RNA聚合酶III-衍生的 中间体来移动。Alu重复长度约300bp,并且原始衍生自7SL RNA基因。 各Alu元件在结构上是二聚化的,并且侧翼有短的完全正向重复。这些 正向重复序列是在Alu元件插入至基因组中交错的切口内时形成的。此 外,各Alu元件在中间和3'端具有富寡聚dA区(图1)。Alu重复扩增至 如此大的拷贝数已经过了6500万年,并且该过程在现今的基因组中仍然 在进行(A.F.A.Smit,The origin of interspersed repeats in the human genome, Current Opinion in Genetics Development,6(6):743-748(1996);上文引用 的Zangenberg等;Budowle,B.,SNP typing strategies,Forensic Science  International,146:S139(2004))。

人基因组内的Alu序列可基于由亚家族成员共享的诊断性突变的存 在而分成相关成员的亚家族。这些亚家族有着不同的进化龄,年轻的亚 家族(Ya5、Ya8和Yb8)主要限于人基因组(Houck,C.M等,A ubiquitous  family of repeated DNA sequences in the human genome,Journal of  Molecular Biology,132(3):289-306(1979);Kazazian,H.H.等,The impact of  L1 retrotransposons on the human genome,Nature Genetics,19(1):19-24 (1998))。这些亚家族随着进化时间以分级的方式出现,较年轻的亚家族 保留了其之前较老的亚家族的诊断性突变。

Ya5/8亚家族和Yb8亚家族是Alu重复的Y亚家族的独立衍生物。 与主要属于PS亚家族和AS亚家族的Alu重复的主体相比,年轻的亚家 族以相对较小的拷贝数存在于基因组内。例如,Y亚家族由约100,000个 成员组成;Ya5亚家族由1000个成员组成;Ya8亚家族由50个成员组成, 以及Yb8亚家族由约1000个成员组成(Moretti,T.等,Validation of short  tandem repeats(STRs)for forensic usage:performance testing of fluorescent  multiplex STR systems and analysis of authentic and simulated forensic  samples,Journal of Forensic Sciences,46(3):647(2001))。

最年轻的Alu元件亚家族Ya5、Ya8和Yb8在500万年前首次出现于 灵长类基因组中(Batzer,M.A.等,African origin of human-specific  polymorphic Alu insertions,Proceedings of the National Academy of Sciences, 91(25):12288(1994);Feng,Q.等,Human L1retrotransposon encodes a  conserved endonuclease required for retrotransposition,Cell,87(5):905-916 (1996))。人体内Alu元件的扩增仍然是持续进行的过程。随着人类群体 组的迁移并定居至全球的不同部分,在原始群体中不存在属于较新群体 的个体中的所有新Alu插入物,并且反之亦然。换言之,对于其在不同 人类群体组中的存在/不存在而言,一些属于年轻亚家族的元件是二态性 的(Syvanen,A.C.等,Identification of individuals by analysis of biallelic  DNA markers,using PCR and solid-phase minisequencing,American Journal  of Human Genetics,52(1):46-59(1993);LaRue,B.L.等,A validation study  of the Qiagen Investigatorkit;an INDEL-based assay for human  identification,International Journal of Legal Medicine,2012,1-8)。

意识到这些二态性的Alu元件作为遗传标志物的潜在性,研究者已 经从较大的固定Alu元件背景鉴定了二态性的Alu重复。通过使用图2 中描述的Alu插入物PCR测定,针对一些作为模板的人基因组DNA样 品组测试了各Alu元件的多态性水平。已经在全球范围内多至50个不同 的群体组中对每种以及所有二态性的Alu重复各自的等位基因频率进行 了完全描述(Syvanen,A.C等,Identification of individuals by analysis of  biallelic DNA markers,using PCR and solid-phase minisequencing,American  Journal of Human Genetics,52(1):46-59(1993);上文引用的LaRue,B.L. 等;Shriver,M.D.等,Ethnic-affiliation estimation by use of  population-specific DNA markers,American Journal of Human Genetics, 60(4):957(1997))。

Ustyugova,S.V.等(Cell line fingerprinting using retroelement insertion  polymorphism.BioTechniques,38(4):561-565(2005))证实,RE可用于细 胞系鉴定。Novick等(Polymorphic human specific Alu insertions as markers  for human identification.Electrophoresis,16(1):1596-1601(1995))和 Mamedov等(A new set of markers for human identification based on 32 polymorphic Alu insertions,European Journal of Human Genetics,18(7): 808-814(2010))最近描述了用于亲子测试的Alu(一种SINE)组。这两 项研究都提示,该系统可用于法医学分析。RE具有低突变率,这使相比 稳定性较低的STR用于亲缘关系分析更具吸引力。此外,它们不产生因 在PCR期间的滑移而导致残留的人工因素,这可减少法医学混合物谱中 一些与STR相关的解释性问题(Andersen,J.F.等,Further validation of a  multiplex STR system for use in routine forensic identity testing,Forensic  Science International,78(1):47-64(1996);Brinkmann,B.等,Mutation rate  in human microsatellites:influence of the structure and length of the tandem  repeat,The American Journal of Human Genetics,62(6):1408-1415(1998); Moretti,T.等,Validation of short tandem repeats(STRs)for forensic usage: performance testing of fluorescent multiplex STR systems and analysis of  authentic and simulated forensic samples,Journal of Forensic Sciences,46(3): 647(2001))。

法医学样品常常在质与量上受到损害。降解的样品可包含长度小于 250bp的DNA片段,并且量可限制在可回收DNA的亚纳克水平(Burger, J.等,DNA preservation:A microsatellite DNA study on ancient skeletal  remains,Electrophoresis,20(8):1722-1728(1999);Fondevila,M.等, Challenging DNA:assessment of a range of genotyping approaches for highly  degraded forensic samples,Forensic Science International:Genetics  Supplement Series,1(1):26-28(2008);Golenberg,E.M.等,Effect of Highly  Fragmented DNA on PCR,Nucleic Acids Research,24(24):5026-5033 (1996);R.Hughes-Stamm,S.等,Assessment of DNA degradation and the  genotyping success of highly degraded samples,International Journal of Legal  Medicine,125(3):341-348(2011))。RE的大小可介于长度为数百bp (SINE)至数千bp(LINE)的范围(参见上文引用的文献Smit;Batzer 等(2002);Batzer等(1994);Feng等;Houck等;Kazazian等;以及Ostertag 等)。以前试图使用Alu序列来进行身份测试,通过用相同的正向引物和 反向引物扩增完整区来利用插入等位基因与无效等位基因之间的大小差 异(Novick,G.E.等,Polymorphic human specific Alu insertions as markers for  human identification,Electrophoresis,16(1):1596-1601(1995))。插入等位基 因将比无效等位基因大200bp至400bp,并且可通过电泳基于大小差异 来检测。虽然可用于亲子测试以及其中DNA品质未受损的一些群体研 究,但是无效等位基因与插入等位基因的扩增子之间大的大小差异将影 响PCR期间的扩增效率,并且是对法医学样品的限制因素。该限制因素 是差异化的扩增偏好较小的扩增子(即,无效等位基因),并且可能丢失 插入元件,如果样品是高度降解的,这种情况更严重。

已经研究并报道了在确定人的身份中使用SINE如Alu重复(参见上 文引用的Mamedov等,以及Novick等)。但是,直至现在,由于与INNUL 相关的固有大小差异,在实践意义上,RE的使用尚为不可用的。虽然 RE构成了超过人基因组的40%(Lander,E.S.等,Initial sequencing and  analysis of the human genome,Nature,409(6822):860-921(2001)),并且存 在大量的用于人身份测试的潜在标靶,但是对用于法医学人身份测试, 这些INNULS(即,是插入和无效等位基因而不是INDEL,因为这些等 位基因中的一种形式不是缺失的结果)受到的关注有限(Zangenberg等, Multiplex PCR:Optimization Guidelines,in PCR Applications:Protocols for  Functional Genomics,Academic Press,San Diego,CA,1999,第73-94页)。

有利地,先前在Sinha等的美国专利No.7,794,983B2中已经描述了 设计用于PCR扩增相对较短的重复序列的合成引物的方便方法,称为小 -引物设计,该文献通过引用并入本文。通过使用该小-引物设计,可扩增 并定量包含特征性正向重复序列(正向重复)的散在遗传元件。

该背景部分中公开的上述信息仅用于增强对本发明背景的理解,并 且因此,其可包含不构成本领域技术人员已知的现有技术的信息。

发明概述

因此,本发明的一个目的是通过使用该小-引物设计来提供针对散在 元件插入多态性的合成引物,该引物将在扩增人基因组DNA时促进产生 具有小至50个碱基对(bp)至150个碱基对的小PCR产物。

该短序列PCR扩增方法利用了这样的事实,即所有反转录转座子插 入物都在插入物的头和尾处具有称为靶位点重复(TSD)的特征序列。 本发明的另一目的是设计合成引物以包含部分或全长的TSD序列,从而 在多路复合系统中提供特异性插入或非插入等位基因。

本发明的另一目的是设计、优化并验证包含用于法医学应用的 LINE、SINE和SVA的多路复合扩增系统(对多个标靶进行单一扩增)。

本发明的另一目的是设计、优化并验证包含用于生物祖系应用的 LINE、SINE和SVA的多路复合扩增系统(对多个标靶进行单一扩增)。

本发明的另一目的是使用短序列PCR扩增方法的辨别能力和区分性 能来选择适于法医学或生物祖系应用的标志物。

本发明的另一目的是开发用于使用LINE和SVA作为人身份鉴定的 DNA扩增系统中的潜在标志物的实践方法。

本发明的另一目的是开发利用RE标志物并且可用于DNA已经大量 降解的法医学情况的多路复合扩增系统。

通过利用具有INNUL标志物的小-引物策略可实现这些目的和其他 目的,所述INNUL标志物包括SINE、LINE和SVA,并且无论插入元件 的大小如何都可有效地用作用于人鉴定和生物祖系研究的标志物。可大 幅降低用于INNUL的扩增子的大小以及等位基因状态之间的差异,使这 些标志物用于分析高品质或低品质的人DNA样品有效。此外,本发明显 示出足以能够对法医学样品和人类学样品进行人身份和生物祖系研究的 检测灵敏度。根据所选标志物和全球群体中的等位基因分布,可选择 INNUL以用于人身份测试或用于生物祖系研究。

将INNUL标志物优化成单管多位点反应物促进了这些目的。在多路 复合反应物中包含这些标志物产生了基于INNUL的人身份测试组,其是 在无需进一步购置新仪器的情况下用于法医学配置中的强大工具。该多 路复合系统能够同时扩增多种标靶序列,没有非特异性PCR扩增产物, 并且还表现出扩增低至100pg或更低的DNA浓度的灵敏度。该新多路 复合系统具有46-124个碱基对的大小范围,其包含既易于与广泛降解的 DNA样品一起使用又可用于法医学团体的最小大小的扩增子。因此,本 发明的INNUL多路复合系统提供了可用于样品在量与质上受到限制的法 医学应用的统计学辨别工具。

本发明的一个实施方案包括用于遗传检测的方法,其包括,提供待 分析的样品,选择多个可反转录转座元件(GE)标志物,所选择的各RE 标志物是与表示经填充基因组位点的经填充的等位基因和表示空基因组 位点的空等位基因有关的INNUL标志物,各INNUL标志物包含核酸序 列,所述核酸序列出现于靶物种基因组内的位置,提供与所选择的各 INNUL标志物对应的引物组,各引物组由正向引物和两个反向引物组成, 所述两个反向引物由对应于所述INNUL标志物的经填充位点的引物和对 应于所述INNUL标志物的空位点的引物组成,将所述引物组与所述样品 合并以形成反应混合物,使用所述引物组扩增所述标志物以形成扩增产 物的混合物,将所述扩增产物与所述反应混合物的残余物分离,以及检 测并定量各经标记的扩增产物。

在本发明的某些实施方案中,用于上述方法中的各正向引物可具有 包含可观察的标记的结构。在某些实施方案中,用于上述方法中的各反 向引物可具有包含可观察的标记的结构。

在本发明的某些实施方案中,用于上述方法中的各正向引物可具有 包含荧光有机染料的结构。在某些实施方案中,用于上述方法中的各反 向引物可具有包含荧光有机染料的结构。

在本发明的某些实施方案中,所述可观察的标记可选自:6FAMTM、 JOETM、TAMRATM和ROXTM

在本发明的某些实施方案中,可使用实时聚合酶链式反应(PCR) 系统来完成标志物的扩增。

在本发明的某些实施方案中,各扩增产物可由不同的可观察的标记 进行标记。

在本发明的某些实施方案中,各引物组可对应于与经填充的等位基 因对应的PCR扩增子和与空等位基因对应的PCR扩增子,并且各PCR 扩增子可具有约46个碱基对至约200个碱基对的大小。

在本发明的某些实施方案中,所选择的INNUL标志物可选自:SINE、 LINE和SVA。

在本发明的某些实施方案中,所选择的INNUL标志物可选自Alu和 LINE。

在本发明的一些实施方案中,可基于全球群体中的等位基因分布选 择所使用的INNUL标志物组用于人身份测试目的。

在本发明的一些实施方案中,可基于全球群体中的等位基因分布选 择所使用的INNUL标志物组用于生物祖系研究。

在本发明的某些实施方案中,可针对包含少至100pg DNA的样品得 到可用的法医学或生物祖系相关的测定。

在本发明的某些实施方案中,所选择的各INNUL标志物还包含被称 为正向重复序列的靶位点重复(TSD)序列,并且各反向引物包含包括 所述TSD序列的全部或部分的核酸序列。

在本发明的某些实施方案中,所述遗传检测方法可包括选自以下的 INNUL标志物:CHR20-79712、Ya5-MLS48、Yb8NBC13、Ya5ACA1736、 Yb8NBC106、Y5ac2305、HS4.69、AC4027、CH1-6217、Yb8AC1796、 Yac52265、MLS9、TARBP1、SVA306、珐琅蛋白、SVA323、Ya5NBC51、 Yb8AC1141、Yb7AD155和Ya5-MLS18。在一个实施方案中,用于遗传 检测的多路复合系统可包括扩增与这15种INNUL标志物加上珐琅蛋白 对应的经填充的扩增子和空扩增子。

在本发明的某些实施方案中,可使用电泳将反应产物与PCR反应混 合物的残余物分离,以及将反应产物彼此分离。

在本发明的某些实施方案中,各INNUL标志物可包含经填充的等位 基因和空等位基因,并且各经填充的等位基因与所对应的空等位基因之 间的大小差异范围可为约2个碱基对至约8个碱基对。

本发明的实施方案可包括多路复合的DNA分析系统,其包含:DNA 样品,三十种或更少种INNUL标志物的组,各INNUL标志物包含经填 充的等位基因和空等位基因,与各INNUL标志物对应的三个引物的组, 各引物组包括正向引物和两个反向引物,所述正向引物包含可检测标记, 一个反向引物与所述经填充的等位基因对应,并且另一个反向引物与所 述空等位基因对应,产生PCR扩增产物的聚合酶链式反应(PCR)扩增 系统,用于将PCR扩增产物与反应物分离并将PCR扩增产物彼此分离的 装置(means),用于使用所述可检测标记来检测并定量PCR扩增产物的装 置,以及用于从所述定量的PCR结果得到可用的司法鉴定相关结论或生 物祖系相关结论的装置。

在本发明的某些实施方案中,所述多路复合DNA分析系统的分离装 置可为电泳装置。

在本发明的某些实施方案中,所述多路复合DNA分析系统可基于对 15种INNUL等位基因标志物加上珐琅蛋白的组的扩增。

在本发明的某些实施方案中,所述多路复合DNA分析系统可包含标 记有荧光有机染料的正向引物。在一些实施方案中,所述荧光有机染料 可选自由6-FAMTM、JOETM、TAMRATM和ROXTM组成的四种染料 的组。

在本发明的某些实施方案中,上述方法和系统的PCR扩增产物通过 新一代序列分析(NGS)方法来表征。

在本发明的某些实施方案中,上述方法和系统的PCR扩增产物通过 快速DNA分析平台来表征。

附图说明

本专利或申请文件包含至少一幅彩色附图。具有彩色附图(多幅) 的该专利或专利申请出版物的拷贝将由专利局基于请求并在支付了必要 的费用后提供。

当结合附图进行考虑并通过引用下面的详述,对本发明的更完全的 领会以及许多其所伴随的优点将变得显而易见并且更好理解,其中:

图1描述了Alu、L1和SVA。全长的反转录转座子不是按比例绘制 的。如所示出,所有三种RE在头和尾处具有由相同的DNA序列组成的 靶位点重复(TSD)。小引物设计策略利用这些TSD扩增和检测插入等位 基因或无效等位基因。

图2示出了在PCR测定中的Alu元件插入物的示意图。

Alu序列由打了阴影的线表示。带有Alu元件的染色体位点由粗的黑 线表示,并且侧翼单一序列(unique sequence)衍生的PCR引物由箭头 表示。

PCR测定导致产生约100bp或400bp的DNA片段或者产生这二者, 如图中所示。对于Alu插入物纯合的个体将仅扩增400bp片段(#1),而 对于在该位点没有Alu插入物的纯合的个体将仅扩增100bp片段(#3)。 对于Alu插入物杂合的个体将扩增400bp片段和100片段二者(#2)。

图3示出了用于RE标志物Ya5ac2305的经填充位点和空位点的引 物。用于小-引物设计的引物序列以下划线标出。较早期报道的传统“核 心引物(core primer)”设计序列,以黑体和斜体标出。两个位点中的正 向引物是相同的。各位点的唯一性取决于反向引物序列。在经填充的位 点反应(A)中,反向引物包含正向重复序列(红框),侧翼基因组序列以 及5'插入序列中的一些。空位点反应(B)的反向引物包含完整正向重复+ 侧翼的基因组序列。

图4示出了显示标志物、染料和各位点的扩增子大小的多路复合设 计。

图5示出了显示使用3130基因分析仪(Genetic Analyzer)的多路复合 的15种RE标志物和珐琅蛋白电泳图,使用五种荧光团:6-FAMTM(蓝 色)、JOETM(绿色)、TMR(TAMRATM,黑色,但表示黄色)、ROXTM(红色)和CC5(橙色)作为大小标准。

图6示出了150个数据库样品的平均杂合峰高。RFU相对于(vs.)标 志物。

图7示出了数据库样品的杂合性。

图8示出了PowerPlex16HS(PP16HS)相对于InnoTyperTM(IT)。 结果证实,InnoTyperTM在等位基因数的检测中具有两倍的灵敏度。

图9示出了Plus(IDP)相对于InnoTyperTM(IT)。结果 证实,InnoTyperTM在等位基因数的检测中具有四倍的灵敏度。

图10示出了Minifiler PlusTM(Mini)相对于InnoTyperTM(IT)多路 复合。结果证实,InnoTyperTM在等位基因数的检测中具有高百分之十的 灵敏度。

图11示出了使用STR试剂盒PowerPlex 16HS、Identifiler PlusTM、 MinifilerTM和InnoTyperTM多路复合的降解的DNA谱的比较。

图12示出了显示在不同DNA浓度(0.5-0.05ng/μL)下空引物和经 填充的引物平均峰高的标志物灵敏度研究。空引物的结果示出比经填充 的引物的结果稍高的峰强度。

图13示出了InnoTyperTM物种结果。

发明详述

本发明的实施方案首次提供了LINE、SINE或SVA元件插入物用于 法医学应用的用途。本发明的一个目的是基于小-引物设计(参见Sinha 等的US 7,794,983 B2)来设计并得到针对散在元件插入多态性的合成引 物,该引物将在扩增人基因组DNA时产生包含小至50个碱基对(bp) 至150个碱基对的小PCR产物。所有反转录转座子插入物都具有出现于 插入物的头部且还出现于插入物的尾部的特征序列,并且该特征序列称 为靶位点重复(TSD)。本发明的一个实施方案包括设计合成引物以包含 部分或全长的TSD序列,从而使用多路复合系统来定量特异性的插入或 非插入等位基因。在本发明的另一个实施方案中,基于辨别能力和分析 性能来选择并挑选适于法医学或生物祖系应用的标志物。本发明的另一 实施方案提供了对包含用于法医学应用的LINE、SINE和SVA的多路复 合扩增系统(对多个标靶进行单一扩增)的设计、优化和验证。

除了开发用于使用SINE对个体进行基因分型的实践方法外,本发明 首次证实LINE和SVA可用作用于人鉴定的潜在标志物。选择15种适于 法医学的标志物,以将其包括于4-染料多路复合系统中。在该15种标志 物(包括LINE和Alu)中,扩增子的大小范围为46bp至124bp。使用 11种荧光标记的引物组来进行使用51种高加索人样品和51种非裔美国 人样品的群体研究。用STR分析该102种样品,并由统计人员将其与RE 结果进行比较。数据显示,RE标志物对于STR位点以及这些标记物之间 是统计学独立的。该统计学独立性对于确定使用RE标志物对DNA进行 法医学评价的有效性十分重要。对于高加索群体而言,仅这11种标记物 的组合的总辨别能力大于1比1000,并且对于非裔美国人而言,是前者 的10倍,大于1比10,000。添加更多的位点只会使样品之间的该辨别能 力升高。

进行了降解研究以评估受损样品上的RE标志物的性能,例如,在法 医学的情况下所遇到的样品。结果显示,该系统成功地从高度降解的DNA 得到有意义的结果。

进行灵敏度研究以确立可从中精确得到结果的最小DNA量。该研究 显示,可将大小介于46-124bp范围内的双等位性的INNUL多路复合以 用于对个体进行基因分型,并且所述INNUL提供的检测灵敏度和辨别能 力将使其可用于对降解样品进行人鉴定。

下面将描述可用于本发明多路复合系统的某些实施方案中的RE组 织和引物设计策略。

在本发明的一个实施方案中,提供了合成引物,所述合成引物包含 部分或全长的TSD序列,并且能够在多路复合系统内扩增特异性的插入 或非插入等位基因。对使用这些引物得到的结果的解读,将取决于较早 前描述的在各种群体组中二态性Alu重复的各等位基因频率的特征。这 些重复的等位基因频率可为十分可变的,范围从在美国高加索人中 HS4.65的低至0.01到在非裔美国人中HS3.23的高至0.99。Alu元件中的 一些具有约0.5的杂合值,其为双等位位点的理论最大值。对一些全球范 围的群体组之间的许多二态性Alu重复的调查揭示,约80%的标志物显 示出0.3-0.7的等位基因频率。

对于亲子测试而言,这些频率对计算排除概率和选入概率是理想的 (Wang,J.等,dbRIP:A highly integrated database of retrotransposon  insertion polymorphisms in humans,Human Mutation,27(4):323-329 (2006))。在特定群体组内以非常高频率存在的那些少数标志物对于在法 医学个案工作中估计未知样品的地理起源是极其有用的。一般而言,通 过使用迄今已经表征了的所有二态性Alu重复来对任意未知样品进行基 因分型,有可能用非常高的确定程度来确定样品的地理起源(Benson,D.A. 等,GenBank,Nucleic Acids Research,33(增刊1):D34-D38(2005))。

Alu是双等位性的,在经填充的(包含Alu)位点与空(没有Alu) 位点之间的大小差异大(~300个碱基对)。现有技术的Alu引物设计中已 经表现出基本的设计缺陷。当多路复合一些引物组时,后面发生等位基 因“丢失”,并且这是由于等位基因大小差异或随机效应所致。为了避免 该问题,本发明的实施方案提供了基本去除杂合子中发生的内部特异性 的位点竞争(参见上文引用的Anderson等)的引物设计方法。该设计涉 及利用Alu元件侧翼的正向重复单元。Alu和侧翼的正向重复序列构成了 完全唯一的基因组位点。存在数以百计的包含正向重复的多态性Alu (Excoffier,L.等,Arlequin(3.0版):an integrated software package for  population genetics data analysis,Evolutionary Bioinformatics Online,1:47 (2005))。用于经填充位点反应的反向引物可包含一些5'Alu序列、正向 重复单元以及延伸超出所述正向重复单元的一些侧翼基因组序列。用于 空位点反应的反向引物可包含预整合位点以及两侧的侧翼基因组序列, 以使寡聚物的长度贯穿预整合位点5'和3'的侧翼基因组序列。空位点反向 引物的5'端可包含超出预整合位点的一个或两个基因组序列的碱基对。

图3示出了已经适配为检测个体Alu位点的经改进的“小-引物”设 计方法。该设计导致排除位点内的特异性竞争,这降低了在STR基系统 中尤其是当使用痕量模板DNA时常见的等位基因丢失的可能性。使用该 引物设计方法还可导致扩增单一的切割/脱落的毛发样品中的核DNA的 能力。在已经扩增了靶位点产物后,可使用标准毛细管电泳系统(ABI 310 或3130)或微流基毛细管电泳系统来检测它们。

本文描述的并且随后被称为小-引物的本发明实施方案的引物设计, 降低了全局扩增子大小以及INNUL的两种等位状态之间扩增子大小的差 异。通过常用的荧光标记的正向引物和两种未标记的反向引物,可扩增 两种等位基因。用于无效等位基因的经标记的正向引物可与RE的插入位 点重叠,并且用于插入等位基因的未经标记的反向引物可具有与连接和 RE本身或者仅RE内的重叠区。通过该设计,可将所得的INNUL等位 扩增子设计成差异小至一个碱基对。此外,可将扩增子大小大幅降低至 比现有使用的STR标志物小得多的大小,从而可分型大量降解的样品。 通过该设计,可将更简化的和自动化的分型技术用于LINE和SINE分型。

用于INNUL标志物以包括于多路复合中的选择标准取决于用途。对 于人身份测试而言,可取的是在所有主要群体中的标志物具有高多态性 (即,约50%杂合度)(LaFountain,M.J.等,TWGDAM Validation of the  AmpFeSTR Profiler Plus and AmpFeSTR COfiler STR Multiplex Systems  Using Capillary Electrophoresis,Journal of Forensic Sciences,46(5): 1191-1198(2001);Moretti,T.等,Validation of short tandem repeats(STRs) for forensic usage:performance testing of fluorescent multiplex STR systems  and analysis of authentic and simulated forensic samples,Journal of Forensic  Sciences,46(3):647(2001);Budowle,B.,SNP typing strategies.Forensic  Science International,146:S139(2004);上文引用的Syvanen,A.C.等;上 文引用的LaRue,B.L.等),而显示高同系繁殖系数的那些(例如,其中不 同群体中不同等位基因状态趋近固定值的SNP)可用于生物祖系分析(参 见上文引用的Shriver,M.D.等)。为了证实新设计的引物组用于人身份测 试的潜在性,所述人身份测试将支撑高品质的DNA分型应用,例如亲子 测试,以及在犯罪法医个案工作中可能遇到的低品质样品,选择基于Alu 和LINE的初始INNUL标志物组。基于分子特征和现有的群体数据选择 基于Alu的INNUL标志物(Wang,J.等,dbRIP:A highly integrated database  of retrotransposon insertion polymorphisms in humans,Human Mutation, 27(4):323-329(2006);上文引用的Benson,D.A.等;Cheung,K.H.等, ALFRED:an allele frequency database for diverse populations and DNA  polymorphisms,Nucleic Acids Research,28(1):361(2000))。在基于LINE 的INNUL标志物方面没有可用的群体数据库,因此仅使用分子特征作为 用于该研究的选择标准。

请求专利权的本发明引物设计分析严重降解和碎片化的DNA样品 的能力比现有技术有大幅改进,因为现有法医学技术如小-STR试剂盒等 常常对这样的样品给出非确定性的结果。为了评估这些新标志物用于法 医学用途的潜在性,在机械降解和酶降解的DNA样品上测试了三种荧光 标记的标志物。理论上,基于小-引物设计策略而设计的引物应当在这些 样品上得到有用的结果,即使它们是降解的亦如此。因为该系统依赖于 Alu侧翼区中的重复单元序列以及其他反转录转座子插入位点的唯一性, 所以仅需要<100bp的小扩增子长度来得到确定性的结果。

对于法医学个案工作应用而言,所选引物可被多路复合至单一扩增 反应中是硬性要求。法医个案工作的样品常常是非常低的量,并且是降 解的。合适的多路复合系统应当能够同时扩增多种标靶序列而没有非特 异性PCR扩增产物,并且还具有扩增低至100pg或更低的DNA浓度的 灵敏度。在多路复合多种标志物中最具挑战性的技术任务是,以当单独 扩增各标志物时所得到的相同高灵敏度和特异性,在单一扩增中共扩增 多种标志物。可用系统内所需的标志物数量取决于统计学计算的所得试 剂盒的辨别能力。当前,一些包含多至32种标志物的多路复合系统是商 业用途的(上文引用的LaRue,B.L.等)。存在一些指导实现成功的PCR 多路复合的已出版报道(Markoulatos,P.等,Multiplex Polymerase Chain  Reaction:A Practical Approach,Journal of Clinical Laboratory Analysis 16: 47-51(2002);Schoske,R.等,Multiplex PCR Design Strategy Used for the  Simultaneous Amplification of 10Y Chromosome Short Tandem Repeat(STR) Loci,Analytical&Bioanalytical Chemistry 375:333-343(2003);O. Henegariu等,Multiplex PCR:Critical Parameters and Step-by-Step Protocol, BioTechniques 23:504-511(1997);Shuber,A.P.等,A Simplified Procedure  for Developing Multiplex PCRs,Genome Research 5:488-493(1995))。考虑 用于开发多路复合PCR系统的参数是:引物长度和序列、各引物的解链 温度、引物的相对浓度、PCR缓冲剂的浓度、氯化镁与dNTP浓度之间 的平衡、循环温度和次数、Taq DNA聚合酶的浓度以及PCR修饰剂的添 加。为了实现具有特异性和高灵敏度的多路复合扩增,对用于标靶DNA 扩增各步骤的优化是必不可少的。下面描述了本发明的一个实施方案, 用于法医学应用的四染料多路复合的制备。

本文中包括下面的实施例在内的描述证实,通过利用小-引物策略, 无论插入元件的大小如何,包括SINE、LINE和SVA在内的INNUL标 志物都可有效地用作用于人鉴定和生物祖系研究的标志物。可大幅降低 用于INNUL的扩增子大小以及等位基因状态之间的差异,使这些标志物 对分析高品质或低品质的人DNA样品有效。此外,初步结果显示,检测 灵敏度足以能够对法医学样品和人类学样品进行人身份和生物祖系研 究。根据所选标志物和全球群体中的等位基因分布,可选择INNUL用于 人身份测试或用于生物祖系研究。

本文的描述与下面的实施例一起还显示了将INNUL标志物优化成单 管多位点的反应物。在多路复合反应物中包含这些标志物产生了基于 INNUL的人身份测试组,其是在无需购置新仪器的情况下用于许多法医 学配置中的强大工具。该多路复合系统能够同时扩增多种标靶序列,具 有最少的特异性PCR扩增产物,并且还表现出扩增低至100pg或更低的 DNA浓度的灵敏度。该多路复合系统具有46-124个碱基对的扩增子大小 范围,其包含既易于与广泛降解的DNA样品一起使用又可一般性地供法 医学团体使用的最小大小的扩增子。因此,该研究提出的INNUL多路复 合系统提供了可用于样品在量与质上受到限制的法医学应用的统计学辨 别工具。

虽然通过引用下面的实施例中描述的实施方案来具体示出和描述本 发明,但是本领域技术人员应认识到,在不脱离本描述的精神和范围的 情况下还可存在其他实施方案。例如,本文中描述的方法和系统的PCR 扩增产物可通过使用新一代序列分析(NGS)分析方法来表征(Mak,H.C., Next-Generation Sequence Analysis,Nature Biotechnology 29:45-46(2011); Metzker,M.L.,Sequencing Technologies—The Next Generation,Nature  Reviews/Genetics 11:31-46(2010))。本发明的另一些实施方案可利用快速 DNA分析平台(参见例如,Khandurina等,Integrated System for Rapid  PCR-Based DNA Analysis in Microfluidic Devices,Analytical Chemistry 72: 2995-3000(2000))来表征本发明的方法和系统的PCR扩增产物。在另一 些实施方案中,实施者可发现,标记反向引物来代替标记正向引物对特 定目的更有效。

实施例

实施例1:用于法医学应用的四染料多路复合系统。

选择一些标志物来进行可用于法医学试剂盒的多路复合。用三种荧 光团6-羧基荧光素(6-FAMTM)、4,5-二氯-二甲氧基-荧光素(JOETM)或 羧基四甲基罗丹明(TAMRATM)(使用5-羧基-X-罗丹明(ROXTM)和橙 色波长的第五荧光团作为大小标准)中的一种标记各标志物的正向引物。 所选择的标志物的扩增子大小范围为约46-124bp,并且单个INNUL等 位基因的扩增子大小差为3-8bp。还将性别标志物珐琅蛋白添加至多路复 合。进行了解决引物浓度和峰高问题的多路复合优化实验。

标志物选自http://dbRIP.org、现有文献以及通过BLAST序列分析来 选择(A.F.A.Smit等;Batzer,M.A.等(2002);Batzer,M.A.等(1994);Feng, Q.等;Houck,C.M.等;Kazazian,H.H.等;Ostertag,E.M.等;Ustyugova,S.V. 等;Mamedov,I.Z.等;Novick,G.E.等;Wang,J.等(2006),所有都在上文 引用过;McGinnis,S.等,BLAST:at the core of a powerful and diverse set of  sequence analysis tools,Nucleic Acids Research,32(增刊2):W20-W25 (2004))。在初始选择后,评估潜在位点对引物设计的适用性(上文引用 的Zangenberg,G.等)。

使用gDNA口腔细胞试剂盒(Buccal Cell Kit) (Invitrogen)通过磁珠分离从人口腔擦拭物提取基因组DNA。所有提取 都与试剂空白一起运行。将样品储存于-20℃直至扩增。

使用人定量试剂盒(Human Quantification Kit)(Applied  Biosystems)或InnoQuantTM人DNA定量和降解评估试剂盒(Human DNA  Quantification&Degradation Assessment Kit)定量提取的样品,并在7500 实时PCR系统(Real-Time PCR System)(Applied Biosystems)上进行该定 量。循环条件基于QuantifilerTM试剂盒或InnoQuantTM试剂盒的用户手册 (Applied Biosystems,2010)。根据生产商建议设置的阈值使用HID实时 PCR分析软件1.1版(Applied Biosystems)来分析数据。

实施例2:引物设计

使用Primer3(输入版本0.4.0,http://frodo.wi.mit.edu/primer3/)设计 引物。针对各标志物设计三个引物的组:一条正向引物和两条反向引物, 其中一条用于插入等位基因,一条用于无效等位基因。所有设计的引物 都具有范围为58-61℃的Tm值。使用来自哈佛医疗技术集团(Harvard  Medical Technology Group)和计算基因组学Lipper中心(Lipper Center for  Computational Genomics)的程序“Reverse Complement” (arep.med.harvard.edu/)。然后,针对GenBank的非冗余数据库(National  Center for Biotechnology Information,U.S.National Library of Medicine, National Institutes of Health)筛选引物,以确定它们是否是唯一的DNA 序列)。表1提供了可用的标志物,并且表2提供了用于所选择的标志物 的引物序列。

表1.可用于选择的RE标志物。

                   

                   

            

表2.用于各INNUL标志物的引物序列以及产生的所得扩增子大小。

                   

                   

            

*Hill C.等,Characterization of 26MiniSTR Loci for Improved Analysis of  Degraded DNA Samples,Journal of Forensic Science 53(1):73-80(2008)。

实施例3:引物制备

通过Eurofins MWG Operon(Huntsville,AL,USA)或Integrated DNA  Technologies(Skokie,IL)来合成荧光标记的或未经标记的寡核苷酸引物。 将所有冻干引物(经标记的或未经标记的)溶解于10mM TE(三(羟甲 基)氨基甲烷(“Tris”)和乙二胺四乙酸(“EDTA”))缓冲剂(pH 8.0)中 至100μM储备液浓度(10×)。将储备液引物储存于4℃待用。在重构后, 使用TE缓冲剂稀释各引物至10μM(1×)终浓度。各引物混合物由三种 引物组成:一种经标记的正向引物以及两种相应的未经标记的反向引物。 两种反向引物的合并体积与正向引物的体积相等。将所有经标记的引物 都储存于不透明的的聚丙烯管中,以避免荧光标记的淬灭。

实施例4:经标记的引物的扩增

使用PCR System 9700热循环仪(Applied Biosystems)来 扩增所有经标记的标志物。反应组分(Bio-Rad)的终浓度如下:1.25U iTaq  DNA聚合酶、10×iTaq缓冲剂、5mM MgCl2和100μM dNTP混合物。 各组分的体积如下:0.125μL iTaq DNA聚合酶、2.5μL iTaq缓冲剂、2.5 μL MgCl2、0.5μL dNTP混合物、17.375μL不含核酸酶的水、1μL引物 混合物以及1μL 0.5ng DNA,使最终反应体积为25μL。所有运行都包 括0.5ng/μL的K562DNA标准(Promega Corporation)作为阳性对照和 阴性对照。使用相同条件扩增所有经标记的标志物:

循环参数:

95℃3分钟    95℃0.30分钟|            72℃10.00分钟

             60℃0.30分钟|32次循环    4℃不限时

             72℃0.30分钟|

实施例5:使用ABI 310和3130毛细管电泳系统进行数据分析。

在扩增后,通过组合20μL Hi-DiTM甲酰胺、0.25μL 350ROXTM(或 CC5内部泳道标准500)大小标准和1μL DNA产物/每个反应来制备样 品。将样品于95℃下孵育3分钟。使用以下用于GS STR POP4(1ml)F 组件的参数来在ABI310基因分析仪(Genetic Analyzer)(Applied  Biosystems)上进行对STR扩增产物的分离和检测:于15kV下注射5 秒,于60℃下进行15kV分离,运行时间28分钟。使用以下用于GS STR  POP4(1ml)G5v2组件的参数来在ABI3130基因分析仪(Applied  Biosystems)上对STR扩增产物进行分离和检测:于1.2kV下注射12秒, 数据延时1秒,并且运行时间900秒。使用GeneMapper ID软件3.2版 (Applied Biosystems)来分析数据。

基于50RFU的最小检测阈值,基于与对照比较时的各标志物峰高和 等位基因丢失来解读电泳图。制造用于各标志物的宏,以将所有峰鉴定 为插入或未插入,并且确定峰高和扩增子大小。然后测试经标记的标志 物的质量控制和再现性,以所有三种基因型(杂合子、无插入纯合子以 及插入纯合子)重扩增DNA样品以确保得到精确的谱图。

实施例6:设计用于同时扩增15种标志物的多路复合

多路复合15种RE标志物和珐琅蛋白,以提供在四染料系统中同时 扩增各标志物的所有插入和未插入等位基因。图4中示出了预期的标志 物大小。对于该15种标志物和珐琅蛋白中的每一个,表3示出了连接至 相关正向引物的染料、等位基因类型、相应的无效等位基因和插入等位 基因的序列长度以及与基因组中发现等位基因的位置对应的染色体数。

表3.示出名称、类型、染料标记、染色体位置和扩增子的多路复合 标志物

            

选择标志物,并按如下优化系统:

针对标志物选择的初始努力集中于上文引用的Mamedov等中描述的 法医学候选标志物的组。使用这些标志物作为基准以及前文描述的小-引 物策略,试图降低来自上文引用的Mamedov等的标志物亚组的扩增子大 小。将用于5种标志物的引物设计成使对于插入等位基因和无效等位基 因的所有扩增子大小都小于120bp。使用凝胶电泳来显示反应产物。该 结果支持小-引物策略的有效性。

在该初始成功后,从文献(Batzer,M.A.等(1994);Feng,Q.等; Ustyugova,S.V.等;Mamedov,I.Z.等;Novick,G.E.等;Wang,J.等;McGinnis, S.等,所有都在上文引用)选择RE标志物(Alu、LINE和SVA)。通过 对单个标志物的扩增子大小和分析性能的分析,选择候选标志物组来证 明用于多路复合的小-引物方法的有效性。表1中描述了这些位点。在选 择后,优化用于各标志物的引物浓度。平衡用于各标志物的杂合样品, 并确定峰高比。在一系列反应中,通过升高“弱”等位基因的引物浓度 以及降低“强”等位基因的引物浓度来进行优化。使用相同的DNA样品, 通过以逐步的方式添加标志物至反应,从而在多路复合中使各标志物的 峰重平衡。大多数标志物已经表现出平衡峰,同时改变了另一些引物混 合物比例。

所选择的用于多路复合的标志物有总共20种标志物,15种Alu,以 及2种LINE、2种SVA和珐琅蛋白,其扩增子长度为46-124bp。图5 示出了针对9种多路复合的RE标志物和珐琅蛋白的等位基因大小范围的 示例性电泳图。因此,在更适于法医学样品并且还在精确度上更适于高 品质样品的多路复合反应中生成Alu、LINE和SVA的等位基因状态的扩 增产物是可行的。当等位基因状态的扩增产物的大小相似时,测定倾向 于更强大,并且示出对较小大小的等位基因的更低偏好扩增。

实施例7:优化用于同时扩增15种标志物的多路复合反应。

按如下确保引物的质量。对于产生具有大的PCR产物大小差异的产 物的引物而言,优化多路复合反应的一个最大障碍是,因对较短产物的 偏好扩增而导致较大等位基因的等位基因丢失。通过设计具有相当的等 位基因大小(通常空等位基因与经填充的等位基因之间为2-8bp的差异) 克服了该问题。使用Primer 3软件来进行引物设计。使用默认盐浓度计 算的各引物Tm计算值在5℃以内(57-62℃)。检查引物核苷酸组合和序 列以排除引物-引物相互作用,从而防止引物之间进行结合而不是结合靶 DNA模板。

具有“G”尾和荧光染料标记的引物修饰是另一种改进数据质量的方 法。在扩增期间,Taq DNA聚合酶通常在产物的3'端添加一个额外的腺 苷(A)核苷酸(Magnuson V.L.等,Substrate Nucleotide-Determined  Non-Templated Addition of Adenine by Taq DNA Polymerase:Implications  for PCR-Based Genotyping and Cloning,BioTechniques 21(4):700-709 (1996))。所得的产物称为“+A”产物。该额外A添加的范围取决于相对 的引物的5'端序列。这产生了具有“-A”和+A的分裂峰,PCR产物大小 差一个碱基。据Brownstein和同事(Brownstein M.J.等,Modulation of  Non-Templated Nucleotide Addition by Taq DNA Polymerase:Primer  Modifications that Facilitate Genotyping,BioTechniques 20(6):1004-1006, 1008-1010(1996))报道,如果未经标记的引物5'末端上核苷酸是鸟嘌呤 (G),则倾向于完全添加A,并且所得的产物是均质的。与染料标记相 邻的G的存在降低荧光强度,因此避免了检测到+A/-A产物。为了避免 许多引物组出现+A/-A的情况,在扩增循环的末尾进行额外的步骤,于 72℃保持10分钟。

按如下找到用于多路复合反应中的引物的最优浓度。首先,每个反 应使用1.0μL、1.5μL和2.0μL的各引物混合物,将经6-FAMTM标记的 5种标志物多路复合。然后分别使用针对ABI 310或3130方法的经标记 引物的扩增和数据分析来扩增并分析样品。结果提示,1μL引物混合物 更有效,并且示出1000RFU至2000RFU的最优峰高,相比之下,1.5μL 和2μL分别为1000RFU和500RFU。当针对多路复合样品进行峰高比 测试时,使用1μL的各引物混合物。使用杂合样品来评估峰平衡以及优 化峰高比。

优化多路复合反应中使用的MgCl2浓度。单独地对每个选择的标志 物进行Mg2+离子优化。测试的MgCl2终浓度为1.5mM、2.0mM和2.5 mM。由于该浓度下最优的峰形态和平衡以及非特异性人工因素的降低, 而选择了2.5mM浓度。

实施例8:群体和统计学分析。

对两个北美样品群体(非裔美国人,N=134;以及高加索人,N=48; 针对15个INNUL位点进行了分型。确定每个位点的未插入(N)等位基 因和插入(I)等位基因的频率。计算观察到的杂合度、随机匹配概率以 及辨别能力。对三个群体中的每一个测试标志物背离连锁平衡的杂合度 (即,位点对之间的连锁不平衡(LD))。等位基因频率在一个或多个群 体中大幅不同的标志物倾向于对生物祖系研究更有用。对100例包含得 自来自高加索人和非裔美国人群体的母亲、孩子和所谓父亲的样品的亲 子分析,使用称为InnoTyperTM的16种标志物(15种RE和珐琅蛋白) 多路复合进行分析。将来自非裔美国人和高加索人群体的父亲和母亲样 品的结果用于等位基因频率和基因型频率,并在表4和表5中示出。

表4:群体研究数据:通过使用15种RE标志物多路复合 (InnoTyperTM)得到的高加索和非裔美国人DNA样品的等位基因频率。

                   

            

表5:群体研究:使用多路复合系统分析的高加索人和非裔美国人群 体的15种RE标志物的基因型频率。

                   

            

针对以下参数分析对100例包含得自母亲、孩子和所谓父亲的样品 进行亲子分析:

·RMP=随机匹配概率(在HWE假设下三种基因型频率的平方和)

·PD=辨别概率=1-RMP

·PE(Trio)=用Trio的数据的亲子关系排除概率(即,母亲-孩子- 所谓父亲)=H(2-H)/4,其中H是在HWE下双等位性位点的预期杂合 度

·PE(Def)=在无母亲情况下的亲子关系排除概率(即,仅有孩子 和所谓父亲的数据)=1/2.H2

·PI(最小)=最小亲子关系指数(用于非排除的所谓父亲)=1/{4(1 -p)},其中p是双等位性位点的较稀有等位基因

·PI(最大)=最大亲子关系指数(用于非排除的所谓父亲)=1/p, 其中p是双等位性位点的较稀有等位基因

结果概括于表6和表7中。

表6.估计高加索人群体中15种标志物的法医学参数和亲子关系测 试参数

            

表7.估计非裔美国人群体中15种标志物的法医学参数和亲子关系 测试参数

      

标志物 RMP PD PE(Trio) PE(Def) PI(最小) PI(最大) 79712 0.4017 0.5983 0.1753 0.1027 0.3828 2.8818 MLS48 0.3938 0.6062 0.1787 0.1085 0.3964 2.7071 1736 0.3915 0.6085 0.1797 0.1103 0.4012 2.6532 NBC106 0.3761 0.6239 0.1869 0.1239 0.4685 2.1441
      

      

1141 0.4545 0.5455 0.1546 0.0731 0.3367 3.8835 MLS9 0.4902 0.5098 0.1422 0.0589 0.3206 4.5434 TARBP1 0.4350 0.5650 0.1619 0.0825 0.3490 3.5261 NBC241 0.6305 0.3695 0.0985 0.0246 0.2863 7.8802 HS4.69R 0.4233 0.5767 0.1664 0.0889 0.3583 3.3091 1766 0.4196 0.5804 0.1679 0.0911 0.3401 3.7750 2250 0.7327 0.2673 0.0697 0.0114 0.2724 12.1803 MLS18 0.3803 0.6197 0.1849 0.1200 0.4375 2.3331 NBC13 0.4032 0.5968 0.1746 0.1017 0.3807 2.9129 NBC51 0.3796 0.6204 0.1852 0.1205 0.4408 2.3105 2265 0.3858 0.6142 0.1823 0.1151 0.4162 2.5044 组合的             15个位点 4.16×10-60.999996 0.9284 0.7548 3.12×10-7130百万

结果显示,大多数标志物都遵循哈迪-温伯格平衡。因为群体样品来 自亲子关系案例中的母亲和父亲,并且样品收集自农村县市,可能存在 供体之间的关联性,所以需要使用得自非相关个体的随机DNA样品来进 一步分析而确认是否排除一些标志物,以使得该多路复合更适于法医学 和亲子测试应用。但是,初始数据显示,15-20种标志物的多路复合的 RE将提供高亲子关系指示以及高辨别能力,并且可成功地作为单独的标 记物系统来用于亲子测试应用。

用GDA软件(Lewis,P.O.等,Genetic Data Analysis:Computer program  for the analysis of allelic data,Version 1.0(2001))、Arlequin 3.11(Excoffier, L.等,Arlequin(3.0版):an integrated software package for population  genetics data analysis,Evolutionary Bioinformatics Online,1:47(2005))或 内部开发的软件进行群体和统计学分析。使用费舍尔精确检验来测试从 哈迪-温伯格平衡(HWE)和连锁平衡的背离。根据Weir和Cockerham[33] 对多重比较进行Bonferroni校正。结果在表8中示出。

表8.标志物的等位基因频率

                   

            

实施例9:使用降解的DNA样品的多路复合反应物的有效性研究。

对5种单一来源的DNA样品进行多至8小时的超声处理。用称为 InnoTyperTM的15种RE加上珐琅蛋白多路复合扩增1ng输入DNA,并 使用3130基因分析仪(Genetic Analyzer)与16HS、Plus和MinifilerTM比较。

对于降解的样品,InnoTyperTM比STR试剂盒在更多位点产生结果, 因此,其胜过了包括MiniFilerTM在内的测试的所有三种STR试剂盒。 该数据示出,与当前市场上使用的任何STR试剂盒相比,InnoTyperTM 试剂盒是高度成功的。

更详细地,按如下进行降解研究。超声清洗装置(device)提供了将 DNA样品机械剪切成片段的方法。用蒸馏水填充该装置,并设置于50℃。 对来自不同样品的30μL体积经提取的DNA进行声处理达8小时。此外, DNA酶I的两种处理水平提供了切割基因组材料的酶方法,并严重降低 DNA样品的品质。使样品于37℃经历10单位的DNA酶I处理30分钟, 以及于37℃下经历100单位的DNA酶I处理20分钟。通过添加0.5M  EDTA终止DNA酶反应,并使用Microcon YM-30(Millipore Corp)纯化 样品,并用TE缓冲剂洗脱。为测试所述引物对降解的DNA的有效性, 使用InnoTyper标志物,因为它们的扩增子长度不大于125bp。在前文描 述的条件下扩增所述降解的样品。相应的未降解的DNA样品充当阳性对 照。

实施例10:多路复合反应的灵敏度研究。

选择用于上述多路复合反应的所有标志物使用0.5-0.2ng/μL DNA浓 度产生全谱。在0.1ng/μL下,除Y5ac2305外的所有标志物都展示了全 谱。在0.05ng/μL下,除六种外的所有标志物都展示了全谱。标志物 CH4-12-7012、LC3-2601和CH1-6217展示了部分谱,而Yb7AD155、 Y5ac2305和Yb8NBC106未展示谱。结果示出200pg范围是用于进一步 分析的最优DNA浓度。图12中以图的方式示出了所有标志物的平均峰 高简况。当使用InnoTyperTM的15种标志物RE和珐琅蛋白多路复合来扩 增时,从低至40pg的总DNA得到了16种标志物DNA的全谱。

还评价了以上称为InnoTyperTM的多路复合系统的RE内和RE间平 均峰高平衡和检测灵敏度。分析300种数据库样品的峰高。对纯合峰高 除以2。一些位点具有比其他位点更高的峰高,但是就平均值而言,当使 用1ng总DNA靶样品时,所有峰都落在1000-2000RFU之间。图6示 出了对150种数据库样品的峰高分析。

还检查了数据库样品的杂合度百分比。除MLS48外,所有标志物都 产生70%以上杂合度的杂合峰(参见图7)。MLS48为50%以上。

将各标志物的杂合DNA谱稀释于10mM TE缓冲剂(pH 8.0)中, 得到以下浓度:0.5ng/μL、0.2ng/μL、0.1ng/μL和0.05ng/μL。在前文描 述的条件下用以下标志物扩增稀释物。表9示出了对于大多数相应的空 等位基因和经填充的等位基因对来说,峰强度的量级相似。

表9.使用2μL引物混合物的引物优化。对于各遗传标志物,确定 扩增子长度、峰高比和峰强度。星号(*)表示基于310基因分析仪的扩 增子bp大小。

            

实施例11:物种特异性研究。

为了确定与非人物种的任何交叉反应性,提取来自多种非人物种的 DNA,并用InnoTyper 16多路复合扩增。用表10中示出的总输入DNA 测试了以下物种。

表10.用于评价15种RE多路复合的物种特异性的DNA类型和量。

      

物种 输入DNA 1ng 黑猩猩 1ng 猩猩 1ng 维罗猴 1ng 鹿 10ng 10ng
      

      

10ng 小鼠 10ng 10ng 蚊子 10ng 葡萄球菌 10ng

所测试的非人灵长类物种(黑猩猩、猩猩和维罗猴)中观察到一些 交叉反应性。在一些哺乳动物物种(猫和鹿)观察到非特异性峰。结果 参见图13。

虽然已参照本发明的实施方案具体示出并描述了本发明,但是本领 域技术人员应理解,可在不脱离由所附权利要求限定的本发明的精神和 范围的情况下对其做出多种形式和细节上的变化。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号