公开/公告号CN114921484A
专利类型发明专利
公开/公告日2022-08-19
原文格式PDF
申请/专利权人 四川大学华西医院;
申请/专利号CN202210664175.7
申请日2022-06-14
分类号C12N15/65(2006.01);C12N15/53(2006.01);C12N15/62(2006.01);C12N15/867(2006.01);C12Q1/66(2006.01);C12Q1/02(2006.01);
代理机构成都天嘉专利事务所(普通合伙) 51211;
代理人赵玉玲
地址 610041 四川省成都市武侯区国学巷37号
入库时间 2023-06-19 16:26:56
法律状态公告日
法律状态信息
法律状态
2023-08-18
发明专利申请公布后的撤回 IPC(主分类):C12N15/65 专利申请号:2022106641757 申请公布日:20220819
发明专利申请公布后的撤回
2022-09-06
实质审查的生效 IPC(主分类):C12N15/65 专利申请号:2022106641757 申请日:20220614
实质审查的生效
技术领域
本发明涉及一种报告基因组、试剂盒及其应用,尤其涉及用于体外筛选引起基因沉默药物的报告基因组、试剂盒及其应用,属于采用生物技术进行药物筛选技术领域。
背景技术
一些关键基因的含量增加或活性升高是大多数疾病的诱发因素,因此,这些关键基因是天然的药物靶点。其中,可从DNA、mRNA及蛋白质三个层面进行干预,以实现基因的沉默。目前,已有通过CRISPR/Cas9在DNA水平上进行基因敲除的尝试,在mRNA水平上经RNAi、shRNA等进行基因沉默,在蛋白水平上经PROTAC进行蛋白降解,经小分子抑制剂抑制蛋白活性等方法。然而,CRISPR/Cas9、RNAi、shRNA等方案需要经过递送,增加了药物开发的难度;蛋白水平的干预需要有合适的蛋白靶点,并不适合所有基因的药物开发,因此,有必要开发一种新的治疗机制,以拓宽疾病的治疗手段。
在真核生物蛋白质合成过程中,核糖体沿mRNA向前移动,根据mRNA上的信息合成蛋白质,在核糖体移动过程中会遇到障碍物阻止其沿mRNA的向前移动,这些障碍物包括较强的RNA二级结构、特殊的RNA序列、特殊的新生多肽链、抑制性密码子及稀有密码子、编码多聚赖氨酸及精氨酸的mRNA、以及被化学试剂损伤的核苷酸,这些因素都会引起核糖体停滞。如果不迅速去除这些引起核糖体阻滞的因素,将会引起该mRNA的降解,这种现象被称为no-go decay(NGD),这是一种mRNA监控系统,可以降解翻译过程中状态异常的mRNA。NGD过程的标志是mRNA的内部磷酸二酯键断裂,产生的5’及3’片段,之后被迅速降解。ZNF598、RACK1及 ASCC3识别停滞核糖体,NEMF、Listerin和VCP识别多肽,核酸内切酶N4BP2负责No-Go decay过程中的mRNA剪切。
发明内容
发明人团队基于NGD过程,以及现有基因药物研发现状,进行了长期的研究,发现:将药物引起的NGD现象,构建一种报告基因组,可实现体外筛选引起基因沉默的药物,最终达到治疗疾病的目的。基于此,本技术方案提出用于体外筛选引起基因沉默药物的报告基因组、试剂盒及其应用。
为了实现上述技术目的,提出如下的技术方案:
本技术方案提出:用于体外筛选引起基因沉默药物的报告基因组,包括:
报告基因1:依次连接的泛素和报告基因A;
报告基因2:依次连接的泛素、报告基因B、IRES和待降解蛋白编码区;
其中,报告基因A为荧光素酶基因、荧光蛋白基因或有色蛋白基因,报告基因B为荧光素酶基因、荧光蛋白基因或有色蛋白基因;待降解蛋白编码区可根据实际需求,即具体药物种类,而选择对应的待降解蛋白编码,比如:针对Dienogest药物,采用待降解蛋白编码为STAT3 cDNA;报告基因A≠报告基因B。
进一步的,所述报告基因A和报告基因B同属为荧光素酶基因,作为优选,所述报告基因A为海肾荧光素酶基因,报告基因B为萤火虫荧光素酶基因,则报告基因1(泛素-海肾荧光素酶基因)的序列包括SEQ ID NO. 1所示的序列,报告基因2(泛素-萤火虫荧光素酶基因-IRES- STAT3 cDNA)的序列包括SEQ ID NO. 2所示的序列;或者,所述报告基因A为萤火虫荧光素酶基因,报告基因B为海肾荧光素酶基因。
进一步的,所述报告基因A和报告基因B同属为荧光蛋白基因,作为优选,所述报告基因A为绿色荧光蛋白基因(GFP),报告基因B为红色荧光蛋白基因(RFP),则报告基因1(泛素-绿色荧光蛋白基因)的序列包括SEQ ID NO. 3所示的序列,报告基因2(泛素-红色荧光蛋白基因-IRES- STAT3)的序列包括SEQ ID NO. 4所示的序列;或者,所述报告基因A为红色荧光蛋白基因,报告基因B为绿色荧光蛋白基因。
进一步的,所述报告基因A和报告基因B同属为有色蛋白基因,作为优选,所述报告基因A为红色蛋白基因(asPink),报告基因B为蓝色蛋白基因(amiLCP),则报告基因1(泛素-红色蛋白基因)的序列包括SEQ ID NO. 5所示的序列,报告基因2(泛素-蓝色蛋白基因-IRES- STAT3)的序列包括SEQ ID NO. 6所示的序列;或者,所述报告基因A为蓝色蛋白基因,报告基因B为红色蛋白基因。
本技术方案提出:将所述报告基因组在制备体外筛选引起基因沉默药物的试剂中的应用。
本技术方案提出:将所述报告基因组在制备体外筛选引起基因沉默药物的试剂盒中的应用。
本技术方案提出:一种用于体外筛选引起基因沉默药物的试剂盒,包括所述报告基因组、与所述报告基因组反向互补的核酸和所述报告基因组或所述核酸的重组核酸载体;
其中,与所述报告基因组反向互补的核酸,可通过逆转录等本领域常规技术手段获得所述报告基因组,其最终功能与所述报告基因组等同。
优选的,所述重组核酸载体为慢病毒载体、逆转录病毒载体、腺病毒载体或质粒载体。
优选的,所述试剂盒还包括携带所述报告基因组或所述核酸的重组病毒。
优选的,所述试剂盒还包括携带所述报告基因组的动物细胞。
优选的,所述引起基因沉默药物包括抗病毒、抗肿瘤、抗神经退行性疾病、抗自身免疫病、抗不育症等疾病的药物。
在本技术方案中,将报告基因组用于体外筛选引起基因沉默药物,所涉及的机理包括:
利用药物造成核糖体在mRNA上的阻滞就会激活NGD过程,引起整条mRNA降解而不影响细胞内其它mRNA的稳定性,因此,NGD可被用于开发基因沉默药物,最终达到治疗疾病的目的。
将报告基因组用于体外mRNA降解药物筛选时,若mRNA翻译被药物抑制,该mRNA会被核酸内切酶降解,进而报告基因B相对于报告基因A(内参)的表达会受到影响,即可根据两套报告基因的信号相对强弱来反映mRNA被降解的情况,完成药物筛选。涉及的报告基因组是全新的mRNA降解报告基因,相比检测mRNA或蛋白含量更为省时,对于推进靶向基因沉默的新药开发进程具有重要意义。
在本技术方案中,涉及的术语包括:
内部核糖体进入位点(internal ribosome entry site,IRES):为病毒的翻译元件,用于介导翻译的起始。一些真核生物mRNA中含有IRES序列,该元件已被广泛应用于基因翻译调控研究中。
采用本技术方案,带来的有益技术效果为:
1)在本发明中,基于NGD过程,将药物引起的NGD现象,构建一种报告基因组,可实现体外筛选引起基因沉默的药物(比如:抗病毒、抗肿瘤、抗神经退行性疾病、抗自身免疫病、抗不育症等疾病的药物),最终达到治疗疾病的目的;
2)在本发明中,将报告基因组在制备体外筛选引起基因沉默药物的试剂/试剂盒等产品中的应用,具有省时、易于分辨、安全、可高通量筛选等特点。
其中,现有药物筛选技术中的细胞病变观察及评估药效通常需要4-5d,而使用携带有本报告基因组的产品,只需2h就能完成药效评估等。且在现有药物筛选技术中的细胞病变观察时,易出现模棱两可的情形(比如:药物引起细胞收缩可被判定为药物有效,也可以判定为药物的副作用);而本发明中采用的荧光信号则容易量化,辨识度高,可用于高通量筛选;
对于本发明中报告基因组的使用,其稳定表达细胞系,不涉及有感染能力的活体病毒,因此不存在感染或传播病毒的风险。此外,涉及的双荧光蛋白报告基因(报告基因A和报告基因B同属为荧光蛋白基因),可用于高内涵显微镜进行高通量筛选,双荧光素酶报告基因(报告基因A和报告基因B同属为荧光素酶基因)可用于酶标仪筛选,双有色蛋白(报告基因A和报告基因B同属为有色蛋白基因)可直接进行肉眼筛选,即本发明中涉及的报告基因组实用性强,较好的满足实际需求。
附图说明
图1为双荧光素酶报告基因组的原理示意图;
图2为双荧光素酶报告基因组的检测流程;
图3为双荧光素酶报告基因组检测Dienogest的NGD效率;
图4为CCK8实验检测10 μM 浓度Dienogest对细胞活力的影响;
图5为双荧光蛋白报告基因的原理示意图;
图6为双荧光蛋白报告基因的检测流程;
图7为荧光蛋白报告基因的检测结果(其中,a. 流式分析结果中的绿色荧光蛋白阳性细胞比例;b. 流式分析结果中的红色荧光蛋白阳性细胞比例(mean ± s.d., n = 6tests; by two-tailed Student’s t test));
图8为双颜色蛋白报告基因组的原理示意图;
图9为双颜色蛋白报告基因组的检测流程;
图10为颜色蛋白报告基因组的检测结果(其中,两种有色蛋白阳性细胞比例(mean± s.d., n = 6 tests; by two-tailed Student’s t test));
图11为Dienogest对STAT3 mRNA表达量的荧光定量PCR结果;
图12为Western Blot检测Dienogest对STAT3蛋白表达量的影响(其中,a.Western 结果;b. 条带灰度值分析 (mean ± s.d., n = 3 tests; by two-tailedStudent’s t test));
图13为Dienogest对Hela细胞增殖的影响(其中,mean ± s.d., n = 3 tests;by two-tailed Student’s t test)。
具体实施方式
以下通过具体实施方式的描述对本发明作进一步说明,但这并非是对本发明的限制,本领域技术人员根据本发明的基本思想,可以做出各种修改或改进,但是只要不脱离本发明的基本思想,均在本发明的范围之内。
在下述实施例中,涉及的基因序列如下:
SEQ ID NO. 1:
GCCACCATGGAGATCTTCGTGAAGACTCTGACTGGTAAGACCATCACCCTCGAGGTTGAGCCCAGTGACACCATTGAGAATGTCAAGGCAAAGATCCAAGATAAGGAAGGCATCCCTCCTGACCAGCAGAGGCTGATCTTTGCTGGAAAACAGCTGGAAGATGGGCGCACCCTGTCTGACTACAACATCCAGAAAGAGTCCACCCTGCACCTGGTACTCCGTCTCAGAGGTGGGGGCGGGGGCGGCTCAATGGCTTCCAAGGTGTACGACCCCGAGCAACGCAAACGCATGATCACTGGGCCTCAGTGGTGGGCTCGCTGCAAGCAAATGAACGTGCTGGACTCCTTCATCAACTACTATGATTCCGAGAAGCACGCCGAGAACGCCGTGATTTTTCTGCATGGTAACGCTGCCTCCAGCTACCTGTGGAGGCACGTCGTGCCTCACATCGAGCCCGTGGCTAGATGCATCATCCCTGATCTGATCGGAATGGGTAAGTCCGGCAAGAGCGGGAATGGCTCATATCGCCTCCTGGATCACTACAAGTACCTCACCGCTTGGTTCGAGCTGCTGAACCTTCCAAAGAAAATCATCTTTGTGGGCCACGACTGGGGGGCTTGTCTGGCCTTTCACTACTCCTACGAGCACCAAGACAAGATCAAGGCCATCGTCCATGCTGAGAGTGTCGTGGACGTGATCGAGTCCTGGGACGAGTGGCCTGACATCGAGGAGGATATCGCCCTGATCAAGAGCGAAGAGGGCGAGAAAATGGTGCTTGAGAATAACTTCTTCGTCGAGACCATGCTCCCAAGCAAGATCATGCGGAAACTGGAGCCTGAGGAGTTCGCTGCCTACCTGGAGCCATTCAAGGAGAAGGGCGAGGTTAGACGGCCTACCCTCTCCTGGCCTCGCGAGATCCCTCTCGTTAAGGGAGGCAAGCCCGACGTCGTCCAGATTGTCCGCAACTACAACGCCTACCTTCGGGCCAGCGACGATCTGCCTAAGATGTTCATCGAGTCCGACCCTGGGTTCTTTTCCAACGCTATTGTCGAGGGAGCTAAGAAGTTCCCTAACACCGAGTTCGTGAAGGTGAAGGGCCTCCACTTCAGCCAGGAGGACGCTCCAGATGAAATGGGTAAGTACATCAAGAGCTTCGTGGAGCGCGTGCTGAAGAACGAGCAGTAATAGTGA
SEQ ID NO. 2:
GCCACCATGGAGATCTTCGTGAAGACTCTGACTGGTAAGACCATCACCCTCGAGGTTGAGCCCAGTGACACCATTGAGAATGTCAAGGCAAAGATCCAAGATAAGGAAGGCATCCCTCCTGACCAGCAGAGGCTGATCTTTGCTGGAAAACAGCTGGAAGATGGGCGCACCCTGTCTGACTACAACATCCAGAAAGAGTCCACCCTGCACCTGGTACTCCGTCTCAGAGGTGGGGGCGGGGGCGGCTCAATGGAAGACGCCAAAAACATAAAGAAAGGCCCGGCGCCATTCTATCCGCTGGAAGATGGAACCGCTGGAGAGCAACTGCATAAGGCTATGAAGAGATACGCCCTGGTTCCTGGAACAATTGCTTTTACAGATGCACATATCGAGGTGGACATCACTTACGCTGAGTACTTCGAAATGTCCGTTCGGTTGGCAGAAGCTATGAAACGATATGGGCTGAATACAAATCACAGAATCGTCGTATGCAGTGAAAACTCTCTTCAATTCTTTATGCCGGTGTTGGGCGCGTTATTTATCGGAGTTGCAGTTGCGCCCGCGAACGACATTTATAATGAACGTGAATTGCTCAACAGTATGGGCATTTCGCAGCCTACCGTGGTGTTCGTTTCCAAAAAGGGGTTGCAAAAAATTTTGAACGTGCAAAAAAAGCTCCCAATCATCCAAAAAATTATTATCATGGATTCTAAAACGGATTACCAGGGATTTCAGTCGATGTACACGTTCGTCACATCTCATCTACCTCCCGGTTTTAATGAATACGATTTTGTGCCAGAGTCCTTCGATAGGGACAAGACAATTGCACTGATCATGAACTCCTCTGGATCTACTGGTCTGCCTAAAGGTGTCGCTCTGCCTCATAGAACTGCCTGCGTGAGATTCTCGCATGCCAGAGATCCTATTTTTGGCAATCAAATCATTCCGGATACTGCGATTTTAAGTGTTGTTCCATTCCATCACGGTTTTGGAATGTTTACTACACTCGGATATTTGATATGTGGATTTCGAGTCGTCTTAATGTATAGATTTGAAGAAGAGCTGTTTCTGAGGAGCCTTCAGGATTACAAGATTCAAAGTGCGCTGCTGGTGCCAACCCTATTCTCCTTCTTCGCCAAAAGCACTCTGATTGACAAATACGATTTATCTAATTTACACGAAATTGCTTCTGGTGGCGCTCCCCTCTCTAAGGAAGTCGGGGAAGCGGTTGCCAAGAGGTTCCATCTGCCAGGTATCAGGCAAGGATATGGGCTCACTGAGACTACATCAGCTATTCTGATTACACCCGAGGGGGATGATAAACCGGGCGCGGTCGGTAAAGTTGTTCCATTTTTTGAAGCGAAGGTTGTGGATCTGGATACCGGGAAAACGCTGGGCGTTAATCAAAGAGGCGAACTGTGTGTGAGAGGTCCTATGATTATGTCCGGTTATGTAAACAATCCGGAAGCGACCAACGCCTTGATTGACAAGGATGGATGGCTACATTCTGGAGACATAGCTTACTGGGACGAAGACGAACACTTCTTCATCGTTGACCGCCTGAAGTCTCTGATTAAGTACAAAGGCTATCAGGTGGCTCCCGCTGAATTGGAATCCATCTTGCTCCAACACCCCAACATCTTCGACGCAGGTGTCGCAGGTCTTCCCGACGATGACGCCGGTGAACTTCCCGCCGCCGTTGTTGTTTTGGAGCACGGAAAGACGATGACGGAAAAAGAGATCGTGGATTACGTCGCCAGTCAAGTAACAACCGCGAAAAAGTTGCGCGGAGGAGTTGTGTTTGTGGACGAAGTACCGAAAGGTCTTACCGGAAAACTCGACGCAAGAAAAATCAGAGAGATCCTCATAAAGGCCAAGAAGGGCGGAAAGATCGCCGTGTAACCCCTCTCCCTCCCCCCCCCCTAACGTTACTGGCCGAAGCCGCTTGGAATAAGGCCGGTGTGCGTTTGTCTATATGTTATTTTCCACCATATTGCCGTCTTTTGGCAATGTGAGGGCCCGGAAACCTGGCCCTGTCTTCTTGACGAGCATTCCTAGGGGTCTTTCCCCTCTCGCCAAAGGAATGCAAGGTCTGTTGAATGTCGTGAAGGAAGCAGTTCCTCTGGAAGCTTCTTGAAGACAAACAACGTCTGTAGCGACCCTTTGCAGGCAGCGGAACCCCCCACCTGGCAACAGGTGCCTCTGCGGCCAAAAGCCACGTGTATAAGATACACCTGCAAAGGCGGCACAACCCCAGTGCCACGTTGTGAGTTGGATAGTTGTGGAAAGAGTCAAATGGCTCTCCTCAAGCGTATTCAACAAGGGGCTGAAGGATGCCCAGAAGGTACCCCATTGTATGGGATCTGATCTGGGGCCTCGGTGCACATGCTTTACATGTGTTTAGTCGAGGTTAAAAAAACGTCTAGGCCCCCCGAACCACGGGGACGTGGTTTTCCTTTGAAAAACACGATGATAATATGGCCCAATGGAATCAGCTACAGCAGCTTGACACACGGTACCTGGAGCAGCTCCATCAGCTCTACAGTGACAGCTTCCCAATGGAGCTGCGGCAGTTTCTGGCCCCTTGGATTGAGAGTCAAGATTGGGCATATGCGGCCAGCAAAGAATCACATGCCACTTTGGTGTTTCATAATCTCCTGGGAGAGATTGACCAGCAGTATAGCCGCTTCCTGCAAGAGTCGAATGTTCTCTATCAGCACAATCTACGAAGAATCAAGCAGTTTCTTCAGAGCAGGTATCTTGAGAAGCCAATGGAGATTGCCCGGATTGTGGCCCGGTGCCTGTGGGAAGAATCACGCCTTCTACAGACTGCAGCCACTGCGGCCCAGCAAGGGGGCCAGGCCAACCACCCCACAGCAGCCGTGGTGACGGAGAAGCAGCAGATGCTGGAGCAGCACCTTCAGGATGTCCGGAAGAGAGTGCAGGATCTAGAACAGAAAATGAAAGTGGTAGAGAATCTCCAGGATGACTTTGATTTCAACTATAAAACCCTCAAGAGTCAAGGAGACATGCAAGATCTGAATGGAAACAACCAGTCAGTGACCAGGCAGAAGATGCAGCAGCTGGAACAGATGCTCACTGCGCTGGACCAGATGCGGAGAAGCATCGTGAGTGAGCTGGCGGGGCTTTTGTCAGCGATGGAGTACGTGCAGAAAACTCTCACGGACGAGGAGCTGGCTGACTGGAAGAGGCGGCAACAGATTGCCTGCATTGGAGGCCCGCCCAACATCTGCCTAGATCGGCTAGAAAACTGGATAACGTCATTAGCAGAATCTCAACTTCAGACCCGTCAACAAATTAAGAAACTGGAGGAGTTGCAGCAAAAAGTTTCCTACAAAGGGGACCCCATTGTACAGCACCGGCCGATGCTGGAGGAGAGAATCGTGGAGCTGTTTAGAAACTTAATGAAAAGTGCCTTTGTGGTGGAGCGGCAGCCCTGCATGCCCATGCATCCTGACCGGCCCCTCGTCATCAAGACCGGCGTCCAGTTCACTACTAAAGTCAGGTTGCTGGTCAAATTCCCTGAGTTGAATTATCAGCTTAAAATTAAAGTGTGCATTGACAAAGACTCTGGGGACGTTGCAGCTCTCAGAGGATCCCGGAAATTTAACATTCTGGGCACAAACACAAAAGTGATGAACATGGAAGAATCCAACAACGGCAGCCTCTCTGCAGAATTCAAACACTTGACCCTGAGGGAGCAGAGATGTGGGAATGGGGGCCGAGCCAATTGTGATGCTTCCCTGATTGTGACTGAGGAGCTGCACCTGATCACCTTTGAGACCGAGGTGTATCACCAAGGCCTCAAGATTGACCTAGAGACCCACTCCTTGCCAGTTGTGGTGATCTCCAACATCTGTCAGATGCCAAATGCCTGGGCGTCCATCCTGTGGTACAACATGCTGACCAACAATCCCAAGAATGTAAACTTTTTTACCAAGCCCCCAATTGGAACCTGGGATCAAGTGGCCGAGGTCCTGAGCTGGCAGTTCTCCTCCACCACCAAGCGAGGACTGAGCATCGAGCAGCTGACTACACTGGCAGAGAAACTCTTGGGACCTGGTGTGAATTATTCAGGGTGTCAGATCACATGGGCTAAATTTTGCAAAGAAAACATGGCTGGCAAGGGCTTCTCCTTCTGGGTCTGGCTGGACAATATCATTGACCTTGTGAAAAAGTACATCCTGGCCCTTTGGAACGAAGGGTACATCATGGGCTTTATCAGTAAGGAGCGGGAGCGGGCCATCTTGAGCACTAAGCCTCCAGGCACCTTCCTGCTAAGATTCAGTGAAAGCAGCAAAGAAGGAGGCGTCACTTTCACTTGGGTGGAGAAGGACATCAGCGGTAAGACCCAGATCCAGTCCGTGGAACCATACACAAAGCAGCAGCTGAACAACATGTCATTTGCTGAAATCATCATGGGCTATAAGATCATGGATGCTACCAATATCCTGGTGTCTCCACTGGTCTATCTCTATCCTGACATTCCCAAGGAGGAGGCATTCGGAAAGTATTGTCGGCCAGAGAGCCAGGAGCATCCTGAAGCTGACCCAGGTAGCGCTGCCCCATACCTGAAGACCAAGTTTATCTGTGTGACACCAACGACCTGCAGCAATACCATTGACCTGCCGATGTCCCCCCGCACTTTAGATTCATTGATGCAGTTTGGAAATAATGGTGAAGGTGCTGAACCCTCAGCAGGAGGGCAGTTTGAGTCCCTCACCTTTGACATGGAGTTGACCTCGGAGTGCGCTACCTCCCCCATGTAATAGTGA
SEQ ID NO. 3:
GCCACCATGGAGATCTTCGTGAAGACTCTGACTGGTAAGACCATCACCCTCGAGGTTGAGCCCAGTGACACCATTGAGAATGTCAAGGCAAAGATCCAAGATAAGGAAGGCATCCCTCCTGACCAGCAGAGGCTGATCTTTGCTGGAAAACAGCTGGAAGATGGGCGCACCCTGTCTGACTACAACATCCAGAAAGAGTCCACCCTGCACCTGGTACTCCGTCTCAGAGGTGGGGGCGGGGGCGGCTCAATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTAATAGTGA
SEQ ID NO. 4:
GCCACCATGGAGATCTTCGTGAAGACTCTGACTGGTAAGACCATCACCCTCGAGGTTGAGCCCAGTGACACCATTGAGAATGTCAAGGCAAAGATCCAAGATAAGGAAGGCATCCCTCCTGACCAGCAGAGGCTGATCTTTGCTGGAAAACAGCTGGAAGATGGGCGCACCCTGTCTGACTACAACATCCAGAAAGAGTCCACCCTGCACCTGGTACTCCGTCTCAGAGGTGGGGGCGGGGGCGGCTCAATGGTGAGCAAGGGCGAGGAGGATAACATGGCCATCATCAAGGAGTTCATGCGCTTCAAGGTGCACATGGAGGGCTCCGTGAACGGCCACGAGTTCGAGATCGAGGGCGAGGGCGAGGGCCGCCCCTACGAGGGCACCCAGACCGCCAAGCTGAAGGTGACCAAGGGTGGCCCCCTGCCCTTCGCCTGGGACATCCTGTCCCCTCAGTTCATGTACGGCTCCAAGGCCTACGTGAAGCACCCCGCCGACATCCCCGACTACTTGAAGCTGTCCTTCCCCGAGGGCTTCAAGTGGGAGCGCGTGATGAACTTCGAGGACGGCGGCGTGGTGACCGTGACCCAGGACTCCTCCCTGCAGGACGGCGAGTTCATCTACAAGGTGAAGCTGCGCGGCACCAACTTCCCCTCCGACGGCCCCGTAATGCAGAAGAAGACCATGGGCTGGGAGGCCTCCTCCGAGCGGATGTACCCCGAGGACGGCGCCCTGAAGGGCGAGATCAAGCAGAGGCTGAAGCTGAAGGACGGCGGCCACTACGACGCTGAGGTCAAGACCACCTACAAGGCCAAGAAGCCCGTGCAGCTGCCCGGCGCCTACAACGTCAACATCAAGTTGGACATCACCTCCCACAACGAGGACTACACCATCGTGGAACAGTACGAACGCGCCGAGGGCCGCCACTCCACCGGCGGCATGGACGAGCTGTACAAGTAACCCCTCTCCCTCCCCCCCCCCTAACGTTACTGGCCGAAGCCGCTTGGAATAAGGCCGGTGTGCGTTTGTCTATATGTTATTTTCCACCATATTGCCGTCTTTTGGCAATGTGAGGGCCCGGAAACCTGGCCCTGTCTTCTTGACGAGCATTCCTAGGGGTCTTTCCCCTCTCGCCAAAGGAATGCAAGGTCTGTTGAATGTCGTGAAGGAAGCAGTTCCTCTGGAAGCTTCTTGAAGACAAACAACGTCTGTAGCGACCCTTTGCAGGCAGCGGAACCCCCCACCTGGCAACAGGTGCCTCTGCGGCCAAAAGCCACGTGTATAAGATACACCTGCAAAGGCGGCACAACCCCAGTGCCACGTTGTGAGTTGGATAGTTGTGGAAAGAGTCAAATGGCTCTCCTCAAGCGTATTCAACAAGGGGCTGAAGGATGCCCAGAAGGTACCCCATTGTATGGGATCTGATCTGGGGCCTCGGTGCACATGCTTTACATGTGTTTAGTCGAGGTTAAAAAAACGTCTAGGCCCCCCGAACCACGGGGACGTGGTTTTCCTTTGAAAAACACGATGATAATATGGCCCAATGGAATCAGCTACAGCAGCTTGACACACGGTACCTGGAGCAGCTCCATCAGCTCTACAGTGACAGCTTCCCAATGGAGCTGCGGCAGTTTCTGGCCCCTTGGATTGAGAGTCAAGATTGGGCATATGCGGCCAGCAAAGAATCACATGCCACTTTGGTGTTTCATAATCTCCTGGGAGAGATTGACCAGCAGTATAGCCGCTTCCTGCAAGAGTCGAATGTTCTCTATCAGCACAATCTACGAAGAATCAAGCAGTTTCTTCAGAGCAGGTATCTTGAGAAGCCAATGGAGATTGCCCGGATTGTGGCCCGGTGCCTGTGGGAAGAATCACGCCTTCTACAGACTGCAGCCACTGCGGCCCAGCAAGGGGGCCAGGCCAACCACCCCACAGCAGCCGTGGTGACGGAGAAGCAGCAGATGCTGGAGCAGCACCTTCAGGATGTCCGGAAGAGAGTGCAGGATCTAGAACAGAAAATGAAAGTGGTAGAGAATCTCCAGGATGACTTTGATTTCAACTATAAAACCCTCAAGAGTCAAGGAGACATGCAAGATCTGAATGGAAACAACCAGTCAGTGACCAGGCAGAAGATGCAGCAGCTGGAACAGATGCTCACTGCGCTGGACCAGATGCGGAGAAGCATCGTGAGTGAGCTGGCGGGGCTTTTGTCAGCGATGGAGTACGTGCAGAAAACTCTCACGGACGAGGAGCTGGCTGACTGGAAGAGGCGGCAACAGATTGCCTGCATTGGAGGCCCGCCCAACATCTGCCTAGATCGGCTAGAAAACTGGATAACGTCATTAGCAGAATCTCAACTTCAGACCCGTCAACAAATTAAGAAACTGGAGGAGTTGCAGCAAAAAGTTTCCTACAAAGGGGACCCCATTGTACAGCACCGGCCGATGCTGGAGGAGAGAATCGTGGAGCTGTTTAGAAACTTAATGAAAAGTGCCTTTGTGGTGGAGCGGCAGCCCTGCATGCCCATGCATCCTGACCGGCCCCTCGTCATCAAGACCGGCGTCCAGTTCACTACTAAAGTCAGGTTGCTGGTCAAATTCCCTGAGTTGAATTATCAGCTTAAAATTAAAGTGTGCATTGACAAAGACTCTGGGGACGTTGCAGCTCTCAGAGGATCCCGGAAATTTAACATTCTGGGCACAAACACAAAAGTGATGAACATGGAAGAATCCAACAACGGCAGCCTCTCTGCAGAATTCAAACACTTGACCCTGAGGGAGCAGAGATGTGGGAATGGGGGCCGAGCCAATTGTGATGCTTCCCTGATTGTGACTGAGGAGCTGCACCTGATCACCTTTGAGACCGAGGTGTATCACCAAGGCCTCAAGATTGACCTAGAGACCCACTCCTTGCCAGTTGTGGTGATCTCCAACATCTGTCAGATGCCAAATGCCTGGGCGTCCATCCTGTGGTACAACATGCTGACCAACAATCCCAAGAATGTAAACTTTTTTACCAAGCCCCCAATTGGAACCTGGGATCAAGTGGCCGAGGTCCTGAGCTGGCAGTTCTCCTCCACCACCAAGCGAGGACTGAGCATCGAGCAGCTGACTACACTGGCAGAGAAACTCTTGGGACCTGGTGTGAATTATTCAGGGTGTCAGATCACATGGGCTAAATTTTGCAAAGAAAACATGGCTGGCAAGGGCTTCTCCTTCTGGGTCTGGCTGGACAATATCATTGACCTTGTGAAAAAGTACATCCTGGCCCTTTGGAACGAAGGGTACATCATGGGCTTTATCAGTAAGGAGCGGGAGCGGGCCATCTTGAGCACTAAGCCTCCAGGCACCTTCCTGCTAAGATTCAGTGAAAGCAGCAAAGAAGGAGGCGTCACTTTCACTTGGGTGGAGAAGGACATCAGCGGTAAGACCCAGATCCAGTCCGTGGAACCATACACAAAGCAGCAGCTGAACAACATGTCATTTGCTGAAATCATCATGGGCTATAAGATCATGGATGCTACCAATATCCTGGTGTCTCCACTGGTCTATCTCTATCCTGACATTCCCAAGGAGGAGGCATTCGGAAAGTATTGTCGGCCAGAGAGCCAGGAGCATCCTGAAGCTGACCCAGGTAGCGCTGCCCCATACCTGAAGACCAAGTTTATCTGTGTGACACCAACGACCTGCAGCAATACCATTGACCTGCCGATGTCCCCCCGCACTTTAGATTCATTGATGCAGTTTGGAAATAATGGTGAAGGTGCTGAACCCTCAGCAGGAGGGCAGTTTGAGTCCCTCACCTTTGACATGGAGTTGACCTCGGAGTGCGCTACCTCCCCCATGTAATAGTGA
SEQ ID NO. 5:
GCCACCATGGAGATCTTCGTGAAGACTCTGACTGGTAAGACCATCACCCTCGAGGTTGAGCCCAGTGACACCATTGAGAATGTCAAGGCAAAGATCCAAGATAAGGAAGGCATCCCTCCTGACCAGCAGAGGCTGATCTTTGCTGGAAAACAGCTGGAAGATGGGCGCACCCTGTCTGACTACAACATCCAGAAAGAGTCCACCCTGCACCTGGTACTCCGTCTCAGAGGTGGGGGCGGGGGCGGCTCAATGGCTTCTTTCCTGAAGAAAACAATGCCCTTCAAAACAACTATTGAGGGGACCGTCAACGGGCATTATTTCAAGTGCACAGGCAAGGGGGAGGGCAATCCCTTCGAGGGCACCCAGGAAATGAAGATTGAGGTCATAGAAGGCGGCCCACTGCCTTTTGCCTTCCATATCCTGTCCACTAGCTGTATGTACGGCAGTAAGACCTTCATCAAATACGTGTCCGGCATCCCGGATTATTTTAAACAGAGTTTCCCCGAGGGGTTTACATGGGAAAGAACTACCACATACGAGGATGGGGGTTTTCTGACTGCGCATCAGGATACCTCACTGGATGGCGACTGCCTGGTGTATAAGGTGAAAATTCTCGGCAACAACTTCCCAGCCGATGGGCCTGTGATGCAGAACAAAGCGGGTCGATGGGAACCAGCGACAGAGATCGTATACGAAGTGGATGGCGTTTTGCGGGGGCAGTCATTGATGGCCCTGAAGTGCCCAGGAGGCAGGCACCTCACCTGCCACCTGCACACTACCTACCGGTCTAAGAAGCCTGCAAGCGCATTGAAGATGCCCGGCTTTCATTTCGAGGATCACCGCATCGAGATTATGGAAGAGGTGGAAAAGGGGAAATGTTATAAGCAGTACGAAGCTGCCGTGGGGCGGTACTGTGACGCAGCCCCGTCAAAGTTGGGGCATAATTAATAGTGA
SEQ ID NO. 6:
GCCACCATGGAGATCTTCGTGAAGACTCTGACTGGTAAGACCATCACCCTCGAGGTTGAGCCCAGTGACACCATTGAGAATGTCAAGGCAAAGATCCAAGATAAGGAAGGCATCCCTCCTGACCAGCAGAGGCTGATCTTTGCTGGAAAACAGCTGGAAGATGGGCGCACCCTGTCTGACTACAACATCCAGAAAGAGTCCACCCTGCACCTGGTACTCCGTCTCAGAGGTGGGGGCGGGGGCGGCTCAATGTCCGTGATCGCCAAGCAGATGACTTACAAAGTATATATGTCCGGCACTGTGAACGGTCACTATTTCGAGGTTGAGGGCGATGGCAAAGGCAAGCCATACGAAGGCGAGCAGACCGTAAAACTGACAGTTACCAAAGGGGGGCCGCTGCCATTTGCCTGGGACATCCTCTCCCCACAATGCCAGTATGGTAGCATCCCATTTACCAAGTACCCAGAGGATATCCCAGATTACGTGAAACAGTCATTTCCTGAAGGTTACACATGGGAAAGAATTATGAACTTCGAAGACGGAGCCGTGTGCACCGTTAGCAATGACTCTAGCATCCAGGGCAATTGCTTTATCTATCACGTGAAGTTTTCCGGCCTGAATTTTCCACCCAACGGCCCAGTGATGCAGAAAAAGACTCAAGGTTGGGAGCCAAATACTGAACGGTTGTTCGCCCGAGACGGCATGCTGCTCGGCAACAATTTTATGGCGCTTAAGCTGGAGGGCGGAGGCCACTACCTGTGCGAATTTAAAACTACGTATAAAGCTAAGAAGCCTGTGAAGATGCCTGGGTATCACTATGTCGATCGGAAGCTGGATGTTACCAATCACAACAAAGATTACACCAGCGTGGAGCAATGTGAGATTTCAATTGCCCGAAAACCCGTCGTCGCATAACCCCTCTCCCTCCCCCCCCCCTAACGTTACTGGCCGAAGCCGCTTGGAATAAGGCCGGTGTGCGTTTGTCTATATGTTATTTTCCACCATATTGCCGTCTTTTGGCAATGTGAGGGCCCGGAAACCTGGCCCTGTCTTCTTGACGAGCATTCCTAGGGGTCTTTCCCCTCTCGCCAAAGGAATGCAAGGTCTGTTGAATGTCGTGAAGGAAGCAGTTCCTCTGGAAGCTTCTTGAAGACAAACAACGTCTGTAGCGACCCTTTGCAGGCAGCGGAACCCCCCACCTGGCAACAGGTGCCTCTGCGGCCAAAAGCCACGTGTATAAGATACACCTGCAAAGGCGGCACAACCCCAGTGCCACGTTGTGAGTTGGATAGTTGTGGAAAGAGTCAAATGGCTCTCCTCAAGCGTATTCAACAAGGGGCTGAAGGATGCCCAGAAGGTACCCCATTGTATGGGATCTGATCTGGGGCCTCGGTGCACATGCTTTACATGTGTTTAGTCGAGGTTAAAAAAACGTCTAGGCCCCCCGAACCACGGGGACGTGGTTTTCCTTTGAAAAACACGATGATAATATGGCCCAATGGAATCAGCTACAGCAGCTTGACACACGGTACCTGGAGCAGCTCCATCAGCTCTACAGTGACAGCTTCCCAATGGAGCTGCGGCAGTTTCTGGCCCCTTGGATTGAGAGTCAAGATTGGGCATATGCGGCCAGCAAAGAATCACATGCCACTTTGGTGTTTCATAATCTCCTGGGAGAGATTGACCAGCAGTATAGCCGCTTCCTGCAAGAGTCGAATGTTCTCTATCAGCACAATCTACGAAGAATCAAGCAGTTTCTTCAGAGCAGGTATCTTGAGAAGCCAATGGAGATTGCCCGGATTGTGGCCCGGTGCCTGTGGGAAGAATCACGCCTTCTACAGACTGCAGCCACTGCGGCCCAGCAAGGGGGCCAGGCCAACCACCCCACAGCAGCCGTGGTGACGGAGAAGCAGCAGATGCTGGAGCAGCACCTTCAGGATGTCCGGAAGAGAGTGCAGGATCTAGAACAGAAAATGAAAGTGGTAGAGAATCTCCAGGATGACTTTGATTTCAACTATAAAACCCTCAAGAGTCAAGGAGACATGCAAGATCTGAATGGAAACAACCAGTCAGTGACCAGGCAGAAGATGCAGCAGCTGGAACAGATGCTCACTGCGCTGGACCAGATGCGGAGAAGCATCGTGAGTGAGCTGGCGGGGCTTTTGTCAGCGATGGAGTACGTGCAGAAAACTCTCACGGACGAGGAGCTGGCTGACTGGAAGAGGCGGCAACAGATTGCCTGCATTGGAGGCCCGCCCAACATCTGCCTAGATCGGCTAGAAAACTGGATAACGTCATTAGCAGAATCTCAACTTCAGACCCGTCAACAAATTAAGAAACTGGAGGAGTTGCAGCAAAAAGTTTCCTACAAAGGGGACCCCATTGTACAGCACCGGCCGATGCTGGAGGAGAGAATCGTGGAGCTGTTTAGAAACTTAATGAAAAGTGCCTTTGTGGTGGAGCGGCAGCCCTGCATGCCCATGCATCCTGACCGGCCCCTCGTCATCAAGACCGGCGTCCAGTTCACTACTAAAGTCAGGTTGCTGGTCAAATTCCCTGAGTTGAATTATCAGCTTAAAATTAAAGTGTGCATTGACAAAGACTCTGGGGACGTTGCAGCTCTCAGAGGATCCCGGAAATTTAACATTCTGGGCACAAACACAAAAGTGATGAACATGGAAGAATCCAACAACGGCAGCCTCTCTGCAGAATTCAAACACTTGACCCTGAGGGAGCAGAGATGTGGGAATGGGGGCCGAGCCAATTGTGATGCTTCCCTGATTGTGACTGAGGAGCTGCACCTGATCACCTTTGAGACCGAGGTGTATCACCAAGGCCTCAAGATTGACCTAGAGACCCACTCCTTGCCAGTTGTGGTGATCTCCAACATCTGTCAGATGCCAAATGCCTGGGCGTCCATCCTGTGGTACAACATGCTGACCAACAATCCCAAGAATGTAAACTTTTTTACCAAGCCCCCAATTGGAACCTGGGATCAAGTGGCCGAGGTCCTGAGCTGGCAGTTCTCCTCCACCACCAAGCGAGGACTGAGCATCGAGCAGCTGACTACACTGGCAGAGAAACTCTTGGGACCTGGTGTGAATTATTCAGGGTGTCAGATCACATGGGCTAAATTTTGCAAAGAAAACATGGCTGGCAAGGGCTTCTCCTTCTGGGTCTGGCTGGACAATATCATTGACCTTGTGAAAAAGTACATCCTGGCCCTTTGGAACGAAGGGTACATCATGGGCTTTATCAGTAAGGAGCGGGAGCGGGCCATCTTGAGCACTAAGCCTCCAGGCACCTTCCTGCTAAGATTCAGTGAAAGCAGCAAAGAAGGAGGCGTCACTTTCACTTGGGTGGAGAAGGACATCAGCGGTAAGACCCAGATCCAGTCCGTGGAACCATACACAAAGCAGCAGCTGAACAACATGTCATTTGCTGAAATCATCATGGGCTATAAGATCATGGATGCTACCAATATCCTGGTGTCTCCACTGGTCTATCTCTATCCTGACATTCCCAAGGAGGAGGCATTCGGAAAGTATTGTCGGCCAGAGAGCCAGGAGCATCCTGAAGCTGACCCAGGTAGCGCTGCCCCATACCTGAAGACCAAGTTTATCTGTGTGACACCAACGACCTGCAGCAATACCATTGACCTGCCGATGTCCCCCCGCACTTTAGATTCATTGATGCAGTTTGGAAATAATGGTGAAGGTGCTGAACCCTCAGCAGGAGGGCAGTTTGAGTCCCTCACCTTTGACATGGAGTTGACCTCGGAGTGCGCTACCTCCCCCATGTAATAGTGA
SEQ ID NO. 7:
ATGGCCCAATGGAATCAGCTACAGCAGCTTGACACACGGTACCTGGAGCAGCTCCATCAGCTCTACAGTGACAGCTTCCCAATGGAGCTGCGGCAGTTTCTGGCCCCTTGGATTGAGAGTCAAGATTGGGCATATGCGGCCAGCAAAGAATCACATGCCACTTTGGTGTTTCATAATCTCCTGGGAGAGATTGACCAGCAGTATAGCCGCTTCCTGCAAGAGTCGAATGTTCTCTATCAGCACAATCTACGAAGAATCAAGCAGTTTCTTCAGAGCAGGTATCTTGAGAAGCCAATGGAGATTGCCCGGATTGTGGCCCGGTGCCTGTGGGAAGAATCACGCCTTCTACAGACTGCAGCCACTGCGGCCCAGCAAGGGGGCCAGGCCAACCACCCCACAGCAGCCGTGGTGACGGAGAAGCAGCAGATGCTGGAGCAGCACCTTCAGGATGTCCGGAAGAGAGTGCAGGATCTAGAACAGAAAATGAAAGTGGTAGAGAATCTCCAGGATGACTTTGATTTCAACTATAAAACCCTCAAGAGTCAAGGAGACATGCAAGATCTGAATGGAAACAACCAGTCAGTGACCAGGCAGAAGATGCAGCAGCTGGAACAGATGCTCACTGCGCTGGACCAGATGCGGAGAAGCATCGTGAGTGAGCTGGCGGGGCTTTTGTCAGCGATGGAGTACGTGCAGAAAACTCTCACGGACGAGGAGCTGGCTGACTGGAAGAGGCGGCAACAGATTGCCTGCATTGGAGGCCCGCCCAACATCTGCCTAGATCGGCTAGAAAACTGGATAACGTCATTAGCAGAATCTCAACTTCAGACCCGTCAACAAATTAAGAAACTGGAGGAGTTGCAGCAAAAAGTTTCCTACAAAGGGGACCCCATTGTACAGCACCGGCCGATGCTGGAGGAGAGAATCGTGGAGCTGTTTAGAAACTTAATGAAAAGTGCCTTTGTGGTGGAGCGGCAGCCCTGCATGCCCATGCATCCTGACCGGCCCCTCGTCATCAAGACCGGCGTCCAGTTCACTACTAAAGTCAGGTTGCTGGTCAAATTCCCTGAGTTGAATTATCAGCTTAAAATTAAAGTGTGCATTGACAAAGACTCTGGGGACGTTGCAGCTCTCAGAGGATCCCGGAAATTTAACATTCTGGGCACAAACACAAAAGTGATGAACATGGAAGAATCCAACAACGGCAGCCTCTCTGCAGAATTCAAACACTTGACCCTGAGGGAGCAGAGATGTGGGAATGGGGGCCGAGCCAATTGTGATGCTTCCCTGATTGTGACTGAGGAGCTGCACCTGATCACCTTTGAGACCGAGGTGTATCACCAAGGCCTCAAGATTGACCTAGAGACCCACTCCTTGCCAGTTGTGGTGATCTCCAACATCTGTCAGATGCCAAATGCCTGGGCGTCCATCCTGTGGTACAACATGCTGACCAACAATCCCAAGAATGTAAACTTTTTTACCAAGCCCCCAATTGGAACCTGGGATCAAGTGGCCGAGGTCCTGAGCTGGCAGTTCTCCTCCACCACCAAGCGAGGACTGAGCATCGAGCAGCTGACTACACTGGCAGAGAAACTCTTGGGACCTGGTGTGAATTATTCAGGGTGTCAGATCACATGGGCTAAATTTTGCAAAGAAAACATGGCTGGCAAGGGCTTCTCCTTCTGGGTCTGGCTGGACAATATCATTGACCTTGTGAAAAAGTACATCCTGGCCCTTTGGAACGAAGGGTACATCATGGGCTTTATCAGTAAGGAGCGGGAGCGGGCCATCTTGAGCACTAAGCCTCCAGGCACCTTCCTGCTAAGATTCAGTGAAAGCAGCAAAGAAGGAGGCGTCACTTTCACTTGGGTGGAGAAGGACATCAGCGGTAAGACCCAGATCCAGTCCGTGGAACCATACACAAAGCAGCAGCTGAACAACATGTCATTTGCTGAAATCATCATGGGCTATAAGATCATGGATGCTACCAATATCCTGGTGTCTCCACTGGTCTATCTCTATCCTGACATTCCCAAGGAGGAGGCATTCGGAAAGTATTGTCGGCCAGAGAGCCAGGAGCATCCTGAAGCTGACCCAGGTAGCGCTGCCCCATACCTGAAGACCAAGTTTATCTGTGTGACACCAACGACCTGCAGCAATACCATTGACCTGCCGATGTCCCCCCGCACTTTAGATTCATTGATGCAGTTTGGAAATAATGGTGAAGGTGCTGAACCCTCAGCAGGAGGGCAGTTTGAGTCCCTCACCTTTGACATGGAGTTGACCTCGGAGTGCGCTACCTCCCCCATGTGA
SEQ ID NO. 8:
CAGCAGCTTGACACACGGTA
SEQ ID NO. 9:
AAACACCAAAGTGGCATGTGA
实施例1
本实施例采用双荧光素酶报告基因组筛选STAT3基因沉默的药物,以对本发明作进一步的说明。
一、双荧光素酶报告基因组的构成及其工作原理
为确定是否有药物可以引起靶基因的mRNA降解,发明人构建了报告基因组。该报告基因组由两套报告质粒组成,第一套报告质粒包含:泛素和海肾荧光素酶基因,组成顺序为泛素-海肾荧光素酶基因(包括SEQ ID NO. 1所示的序列);第二套报告质粒包含:泛素、萤火虫荧光素酶基因、IRES和STAT3 cDNA,其中,STAT3 cDNA包括SEQ ID NO. 7所示的序列,组成顺序为泛素-萤火虫荧光素酶基因-IRES-STAT3 cDNA(包括SEQ ID NO. 2所示的序列);其中,关于泛素基因的使用,在不需要检测时,双荧光素酶报告基因组表达的蛋白能因泛素化标记而被蛋白酶体降解,进而以减少检测前产生的背景。
细胞内存在NGD现象时,核糖体在STAT3 mRNA上发生停滞,引起该mRNA降解,该细胞无萤火虫荧光素酶蛋白表达。由于海肾荧光素酶位于另一条mRNA上,其表达不受NGD影响,因此可正常表达海肾荧光素酶(其中,原理如图1所示),即细胞环境中人工添加荧光素酶底物,能观察荧光素酶信号。
二、报告基因组的使用
本报告基因组可以被构建到真核表达载体(可选用慢病毒载体、逆转录病毒载体、腺病毒载体、质粒载体等)内,其中,本实施例将报告基因组构建到慢病毒载体。
具体操作包括:
1)重组病毒构建:将报告基因组构建到慢病毒载体,经293T细胞包装出大量带有该报告基因组的重组慢病毒;
2)获得重组细胞系:将所得的重组慢病毒感染人胚胎成纤维细胞系HEK293,经嘌呤霉素筛选后,获得稳定表达本报告基因组的阳性细胞系,用于药物筛选;
3)药物筛选:将获得的阳性细胞单克隆培养至96孔板,24h后,向孔板中分别加入不同小分子化合物(FDA批准化合物库,其中,共涉及1808种小分子化合物),培养8h,裂解细胞,先后加入萤火虫荧光素酶及海肾荧光素酶底物,然后,化学发光检测(萤火虫荧光素酶与海肾荧光素酶的比值为NGD效率),具体流程如图2所示。
NGD效率高,表明mRNA被降解。随着Dienogest的用药浓度升高,STAT3 mRNA含量降低,该种药物具有较好的诱导STAT3基因沉默的效果(如图3所示);利用CCK8检测细胞活力,结果显示:10μM的 Dienogest使用,并未引起细胞活力的下降(如图4所示)。
由此,得出:本实施例中的双荧光素酶报告基因组可用于筛选引起STAT3基因沉默的药物。
实施例2
本实施例采用双荧光蛋白报告基因组筛选STAT3基因沉默的药物,以对本发明作进一步的说明。
一、双荧光蛋白报告基因组的构成及其工作原理
该报告基因组由两套报告质粒组成,第一套报告质粒包含:泛素和绿色荧光蛋白基因,组成顺序为泛素-绿色荧光蛋白基因(包括SEQ ID NO. 3所示的序列);第二套报告质粒包含:泛素、红色荧光蛋白基因、IRES和STAT3 cDNA,其中,STAT3 cDNA包括SEQ ID NO. 7所示的序列,组成顺序为泛素-红色荧光蛋白基因-IRES-STAT3 cDNA(包括SEQ ID NO. 4所示的序列);
细胞内存在NGD现象时,核糖体在STAT3 mRNA上发生停滞,引起该mRNA降解,该细胞红色荧光蛋白基因蛋白不表达。由于绿色荧光蛋白基因位于另一条mRNA上,其表达不受NGD影响,因此可正常表达绿色荧光蛋白基因,通过荧光显微镜可直接观察荧光蛋白强度,并根据RFP与GFP的比值确定NGD效率(其原理与实施例1本质相同,如图5所示)。
二、报告基因组的使用
本报告基因组可以被构建到真核表达载体(可选用慢病毒载体、逆转录病毒载体、腺病毒载体、质粒载体等)内,其中,本实施例将报告基因组构建到慢病毒载体。
具体操作包括:
1)重组病毒构建:将报告基因组构建到慢病毒载体,经293T细胞包装出大量带有该报告基因组的重组慢病毒;
2)获得重组细胞系:将所得的重组慢病毒感染人胚胎成纤维细胞系HEK293,经嘌呤霉素筛选后,获得稳定表达本报告基因组的阳性细胞系,用于药物筛选;
3)药物筛选
a. 细胞铺板:提前24h于六孔板中传代稳定表达的报告基因组的阳性细胞,使其在加药时细胞融合度至80-90%为宜;
b. 细胞加药处理:每个药设置3个复孔,加10μM的药物终浓度处理1h后,加5μMMG-132后继续处理2-3h;
c. 处理完后,吸除培养基,用PBS洗一次,加0.25%胰酶消化细胞,加有血清培养基终止消化,收集细胞于EP管中,500 g离心3min;
d. 丢弃上清,加300 μL-500μLPBS重悬细胞,并用70μm滤网过滤细胞后转移至流式管中,用于流式细胞仪检测分析;
e. 流式检测:开机流式检测仪器(FACSAria SORP),打开液流调节至稳定,用次氯酸冲洗管路,上样前轻轻涡旋上样管,防止细胞沉底,上样检测PE和FITC双通道荧光;
具体流程如图6所示。
利用流式细胞仪对Dienogest的作用效果进行进一步检测,结果显示:与荧光素酶实验结果(实施例1)类似,即Dienogest在荧光蛋白检测报告基因组中,同样具有诱导STAT3基因沉默的作用。
由此,得出:本实施例中的双荧光蛋白报告基因组可用于筛选诱导STAT3基因沉默的药物。
实施例3
荧光蛋白需要荧光显微镜进行激发,但一些小分子化合物存在自发荧光现象,进而导致无法通过荧光蛋白对此类药物进行筛选,因此,发明人构建以颜色蛋白为基础的报告基因组,即采用双颜色蛋白报告基因组筛选STAT3基因沉默的药物,以对本发明作进一步的说明。
一、双颜色蛋白报告基因组的构成及其工作原理
该报告基因组由两套报告质粒组成,第一套报告质粒包含:泛素和粉红色蛋白基因,组成顺序为泛素-粉红色蛋白基因(包括SEQ ID NO. 5所示的序列);第二套报告质粒包含:泛素、蓝色蛋白基因、IRES和STAT3 cDNA,其中,STAT3 cDNA包括SEQ ID NO. 7所示的序列,组成顺序为泛素-蓝色蛋白基因-IRES-STAT3 cDNA(包括SEQ ID NO. 6所示的序列);
细胞内存在NGD现象时,核糖体在STAT3 mRNA上发生停滞,引起该mRNA降解,该细胞蓝色蛋白基因蛋白不表达。由于红色蛋白基因位于另一条mRNA上,其表达不受NGD影响,因此可正常表达红色蛋白基因。粉红色蛋白基因蛋白在可见光下呈粉红色,蓝色蛋白基因蛋白在可见光下呈深蓝色,可用肉眼直接观察。并根据蓝色蛋白基因与粉红色蛋白基因的比值确定NGD效率(其原理与实施例1本质相同,如图8所示)。
二、报告基因组的使用
本报告基因组可以被构建到真核表达载体(可选用慢病毒载体、逆转录病毒载体、腺病毒载体、质粒载体等)内,其中,本实施例将报告基因组构建到慢病毒载体。
具体操作包括:
1)重组病毒构建:将报告基因组构建到慢病毒载体,经293T细胞包装出大量带有该报告基因组的重组慢病毒;
2)获得重组细胞系:将所得的重组慢病毒感染人胚胎成纤维细胞系HEK293,经嘌呤霉素筛选后,获得稳定表达本报告基因组的阳性细胞系,用于药物筛选;
3)药物筛选
a. 细胞铺板:提前24h于六孔板中传代稳定表达的报告基因组的阳性细胞,使其在加药时细胞融合度至80-90%为宜;
b. 细胞加药处理:每个药设置3个复孔,加10μM的药物终浓度处理1h后,加5μMMG-132后继续处理2-3h;
c. 处理完后,吸除培养基,用PBS洗一次,直接肉眼观察颜色变化;
具体流程如图9所示。
通过明场显微镜观察,对Dienogest的作用效果进行进一步检测,结果显示:与荧光素酶实验结果(实施例1)类似,即Dienogest在有色蛋白检测报告基因组中,同样具有诱导STAT3基因沉默的作用(图10)。
由此,得出:本实施例中的双颜色蛋白报告基因组可用于筛选诱导STAT3基因沉默的药物。
实施例4
本实施例研究Dienogest对肿瘤细胞生长的抑制效果,即通过对Hela进行药物处理,进一步验证Dienogest对肿瘤细胞的生长抑制效果,以对本发明作进一步的说明。
具体步骤如下:
1)培养人宫颈癌细胞Hela,分别向培养皿中加入DMSO及10μM Dienogest,继续培养24h并收集细胞,裂解后提取mRNA及蛋白;
2)利用Oligo dT引物进行逆转录;
3)对逆转录产物进行PCR,检测STAT3 mRNA含量,引物如下:
Target:ORF1ab
正向引物(F):CAGCAGCTTGACACACGGTA (SEQ ID NO. 8)
反向引物(R):AAACACCAAAGTGGCATGTGA(SEQ ID NO. 9)
4)对蛋白提取物进行Western blot,检测STAT3 蛋白含量;
5)使用EdU细胞增殖检测试剂盒进行染色,经流式细胞仪检测增殖细胞占总细胞的比例。
经RT-PCR及Western blot分析结果显示:10μM Dienogest处理后,STAT3的mRNA及蛋白含量明显下降。该结果说明,Dienogest对STAT3具有明显的基因沉默效果(图11)。EDU结果显示,10μM Dienogest处理后,细胞增殖明显减少(图12)。
由此,可知:通过本发明报告基因组筛选得到的药物,经细胞水平验证,能够起到明显沉默STAT3及抑制肿瘤细胞增殖的作用,表明本发明的报告基因组具有可靠的筛选能力。
综上,利用mRNA翻译过程中的NGD现象,本发明构建报告基因组,按其中信号分子类型,可分为双荧光素酶报告基因组、双荧光蛋白报告基因组和双颜色蛋白基因组。通过两种颜色的荧光信号相对强弱来反映基因沉默的情况,可完成药物体外快速筛选工作,对于推进抗肿瘤、抗病毒及抗自身免疫病等疾病的新药开发进程具有重要意义。
序列表
<110> 四川大学华西医院
<120> 用于体外筛选引起基因沉默药物的报告基因组、试剂盒及其应用
<160> 9
<170> SIPOSequenceListing 1.0
<210> 1
<211> 1191
<212> DNA
<213> 泛素-海肾荧光素酶基因
<400> 1
gccaccatgg agatcttcgt gaagactctg actggtaaga ccatcaccct cgaggttgag 60
cccagtgaca ccattgagaa tgtcaaggca aagatccaag ataaggaagg catccctcct 120
gaccagcaga ggctgatctt tgctggaaaa cagctggaag atgggcgcac cctgtctgac 180
tacaacatcc agaaagagtc caccctgcac ctggtactcc gtctcagagg tgggggcggg 240
ggcggctcaa tggcttccaa ggtgtacgac cccgagcaac gcaaacgcat gatcactggg 300
cctcagtggt gggctcgctg caagcaaatg aacgtgctgg actccttcat caactactat 360
gattccgaga agcacgccga gaacgccgtg atttttctgc atggtaacgc tgcctccagc 420
tacctgtgga ggcacgtcgt gcctcacatc gagcccgtgg ctagatgcat catccctgat 480
ctgatcggaa tgggtaagtc cggcaagagc gggaatggct catatcgcct cctggatcac 540
tacaagtacc tcaccgcttg gttcgagctg ctgaaccttc caaagaaaat catctttgtg 600
ggccacgact ggggggcttg tctggccttt cactactcct acgagcacca agacaagatc 660
aaggccatcg tccatgctga gagtgtcgtg gacgtgatcg agtcctggga cgagtggcct 720
gacatcgagg aggatatcgc cctgatcaag agcgaagagg gcgagaaaat ggtgcttgag 780
aataacttct tcgtcgagac catgctccca agcaagatca tgcggaaact ggagcctgag 840
gagttcgctg cctacctgga gccattcaag gagaagggcg aggttagacg gcctaccctc 900
tcctggcctc gcgagatccc tctcgttaag ggaggcaagc ccgacgtcgt ccagattgtc 960
cgcaactaca acgcctacct tcgggccagc gacgatctgc ctaagatgtt catcgagtcc 1020
gaccctgggt tcttttccaa cgctattgtc gagggagcta agaagttccc taacaccgag 1080
ttcgtgaagg tgaagggcct ccacttcagc caggaggacg ctccagatga aatgggtaag 1140
tacatcaaga gcttcgtgga gcgcgtgctg aagaacgagc agtaatagtg a 1191
<210> 2
<211> 4796
<212> DNA
<213> 泛素-萤火虫荧光素酶基因-IRES- STAT3 cDNA
<400> 2
gccaccatgg agatcttcgt gaagactctg actggtaaga ccatcaccct cgaggttgag 60
cccagtgaca ccattgagaa tgtcaaggca aagatccaag ataaggaagg catccctcct 120
gaccagcaga ggctgatctt tgctggaaaa cagctggaag atgggcgcac cctgtctgac 180
tacaacatcc agaaagagtc caccctgcac ctggtactcc gtctcagagg tgggggcggg 240
ggcggctcaa tggaagacgc caaaaacata aagaaaggcc cggcgccatt ctatccgctg 300
gaagatggaa ccgctggaga gcaactgcat aaggctatga agagatacgc cctggttcct 360
ggaacaattg cttttacaga tgcacatatc gaggtggaca tcacttacgc tgagtacttc 420
gaaatgtccg ttcggttggc agaagctatg aaacgatatg ggctgaatac aaatcacaga 480
atcgtcgtat gcagtgaaaa ctctcttcaa ttctttatgc cggtgttggg cgcgttattt 540
atcggagttg cagttgcgcc cgcgaacgac atttataatg aacgtgaatt gctcaacagt 600
atgggcattt cgcagcctac cgtggtgttc gtttccaaaa aggggttgca aaaaattttg 660
aacgtgcaaa aaaagctccc aatcatccaa aaaattatta tcatggattc taaaacggat 720
taccagggat ttcagtcgat gtacacgttc gtcacatctc atctacctcc cggttttaat 780
gaatacgatt ttgtgccaga gtccttcgat agggacaaga caattgcact gatcatgaac 840
tcctctggat ctactggtct gcctaaaggt gtcgctctgc ctcatagaac tgcctgcgtg 900
agattctcgc atgccagaga tcctattttt ggcaatcaaa tcattccgga tactgcgatt 960
ttaagtgttg ttccattcca tcacggtttt ggaatgttta ctacactcgg atatttgata 1020
tgtggatttc gagtcgtctt aatgtataga tttgaagaag agctgtttct gaggagcctt 1080
caggattaca agattcaaag tgcgctgctg gtgccaaccc tattctcctt cttcgccaaa 1140
agcactctga ttgacaaata cgatttatct aatttacacg aaattgcttc tggtggcgct 1200
cccctctcta aggaagtcgg ggaagcggtt gccaagaggt tccatctgcc aggtatcagg 1260
caaggatatg ggctcactga gactacatca gctattctga ttacacccga gggggatgat 1320
aaaccgggcg cggtcggtaa agttgttcca ttttttgaag cgaaggttgt ggatctggat 1380
accgggaaaa cgctgggcgt taatcaaaga ggcgaactgt gtgtgagagg tcctatgatt 1440
atgtccggtt atgtaaacaa tccggaagcg accaacgcct tgattgacaa ggatggatgg 1500
ctacattctg gagacatagc ttactgggac gaagacgaac acttcttcat cgttgaccgc 1560
ctgaagtctc tgattaagta caaaggctat caggtggctc ccgctgaatt ggaatccatc 1620
ttgctccaac accccaacat cttcgacgca ggtgtcgcag gtcttcccga cgatgacgcc 1680
ggtgaacttc ccgccgccgt tgttgttttg gagcacggaa agacgatgac ggaaaaagag 1740
atcgtggatt acgtcgccag tcaagtaaca accgcgaaaa agttgcgcgg aggagttgtg 1800
tttgtggacg aagtaccgaa aggtcttacc ggaaaactcg acgcaagaaa aatcagagag 1860
atcctcataa aggccaagaa gggcggaaag atcgccgtgt aacccctctc cctccccccc 1920
ccctaacgtt actggccgaa gccgcttgga ataaggccgg tgtgcgtttg tctatatgtt 1980
attttccacc atattgccgt cttttggcaa tgtgagggcc cggaaacctg gccctgtctt 2040
cttgacgagc attcctaggg gtctttcccc tctcgccaaa ggaatgcaag gtctgttgaa 2100
tgtcgtgaag gaagcagttc ctctggaagc ttcttgaaga caaacaacgt ctgtagcgac 2160
cctttgcagg cagcggaacc ccccacctgg caacaggtgc ctctgcggcc aaaagccacg 2220
tgtataagat acacctgcaa aggcggcaca accccagtgc cacgttgtga gttggatagt 2280
tgtggaaaga gtcaaatggc tctcctcaag cgtattcaac aaggggctga aggatgccca 2340
gaaggtaccc cattgtatgg gatctgatct ggggcctcgg tgcacatgct ttacatgtgt 2400
ttagtcgagg ttaaaaaaac gtctaggccc cccgaaccac ggggacgtgg ttttcctttg 2460
aaaaacacga tgataatatg gcccaatgga atcagctaca gcagcttgac acacggtacc 2520
tggagcagct ccatcagctc tacagtgaca gcttcccaat ggagctgcgg cagtttctgg 2580
ccccttggat tgagagtcaa gattgggcat atgcggccag caaagaatca catgccactt 2640
tggtgtttca taatctcctg ggagagattg accagcagta tagccgcttc ctgcaagagt 2700
cgaatgttct ctatcagcac aatctacgaa gaatcaagca gtttcttcag agcaggtatc 2760
ttgagaagcc aatggagatt gcccggattg tggcccggtg cctgtgggaa gaatcacgcc 2820
ttctacagac tgcagccact gcggcccagc aagggggcca ggccaaccac cccacagcag 2880
ccgtggtgac ggagaagcag cagatgctgg agcagcacct tcaggatgtc cggaagagag 2940
tgcaggatct agaacagaaa atgaaagtgg tagagaatct ccaggatgac tttgatttca 3000
actataaaac cctcaagagt caaggagaca tgcaagatct gaatggaaac aaccagtcag 3060
tgaccaggca gaagatgcag cagctggaac agatgctcac tgcgctggac cagatgcgga 3120
gaagcatcgt gagtgagctg gcggggcttt tgtcagcgat ggagtacgtg cagaaaactc 3180
tcacggacga ggagctggct gactggaaga ggcggcaaca gattgcctgc attggaggcc 3240
cgcccaacat ctgcctagat cggctagaaa actggataac gtcattagca gaatctcaac 3300
ttcagacccg tcaacaaatt aagaaactgg aggagttgca gcaaaaagtt tcctacaaag 3360
gggaccccat tgtacagcac cggccgatgc tggaggagag aatcgtggag ctgtttagaa 3420
acttaatgaa aagtgccttt gtggtggagc ggcagccctg catgcccatg catcctgacc 3480
ggcccctcgt catcaagacc ggcgtccagt tcactactaa agtcaggttg ctggtcaaat 3540
tccctgagtt gaattatcag cttaaaatta aagtgtgcat tgacaaagac tctggggacg 3600
ttgcagctct cagaggatcc cggaaattta acattctggg cacaaacaca aaagtgatga 3660
acatggaaga atccaacaac ggcagcctct ctgcagaatt caaacacttg accctgaggg 3720
agcagagatg tgggaatggg ggccgagcca attgtgatgc ttccctgatt gtgactgagg 3780
agctgcacct gatcaccttt gagaccgagg tgtatcacca aggcctcaag attgacctag 3840
agacccactc cttgccagtt gtggtgatct ccaacatctg tcagatgcca aatgcctggg 3900
cgtccatcct gtggtacaac atgctgacca acaatcccaa gaatgtaaac ttttttacca 3960
agcccccaat tggaacctgg gatcaagtgg ccgaggtcct gagctggcag ttctcctcca 4020
ccaccaagcg aggactgagc atcgagcagc tgactacact ggcagagaaa ctcttgggac 4080
ctggtgtgaa ttattcaggg tgtcagatca catgggctaa attttgcaaa gaaaacatgg 4140
ctggcaaggg cttctccttc tgggtctggc tggacaatat cattgacctt gtgaaaaagt 4200
acatcctggc cctttggaac gaagggtaca tcatgggctt tatcagtaag gagcgggagc 4260
gggccatctt gagcactaag cctccaggca ccttcctgct aagattcagt gaaagcagca 4320
aagaaggagg cgtcactttc acttgggtgg agaaggacat cagcggtaag acccagatcc 4380
agtccgtgga accatacaca aagcagcagc tgaacaacat gtcatttgct gaaatcatca 4440
tgggctataa gatcatggat gctaccaata tcctggtgtc tccactggtc tatctctatc 4500
ctgacattcc caaggaggag gcattcggaa agtattgtcg gccagagagc caggagcatc 4560
ctgaagctga cccaggtagc gctgccccat acctgaagac caagtttatc tgtgtgacac 4620
caacgacctg cagcaatacc attgacctgc cgatgtcccc ccgcacttta gattcattga 4680
tgcagtttgg aaataatggt gaaggtgctg aaccctcagc aggagggcag tttgagtccc 4740
tcacctttga catggagttg acctcggagt gcgctacctc ccccatgtaa tagtga 4796
<210> 3
<211> 975
<212> DNA
<213> 泛素-绿色荧光蛋白基因
<400> 3
gccaccatgg agatcttcgt gaagactctg actggtaaga ccatcaccct cgaggttgag 60
cccagtgaca ccattgagaa tgtcaaggca aagatccaag ataaggaagg catccctcct 120
gaccagcaga ggctgatctt tgctggaaaa cagctggaag atgggcgcac cctgtctgac 180
tacaacatcc agaaagagtc caccctgcac ctggtactcc gtctcagagg tgggggcggg 240
ggcggctcaa tggtgagcaa gggcgaggag ctgttcaccg gggtggtgcc catcctggtc 300
gagctggacg gcgacgtaaa cggccacaag ttcagcgtgt ccggcgaggg cgagggcgat 360
gccacctacg gcaagctgac cctgaagttc atctgcacca ccggcaagct gcccgtgccc 420
tggcccaccc tcgtgaccac cctgacctac ggcgtgcagt gcttcagccg ctaccccgac 480
cacatgaagc agcacgactt cttcaagtcc gccatgcccg aaggctacgt ccaggagcgc 540
accatcttct tcaaggacga cggcaactac aagacccgcg ccgaggtgaa gttcgagggc 600
gacaccctgg tgaaccgcat cgagctgaag ggcatcgact tcaaggagga cggcaacatc 660
ctggggcaca agctggagta caactacaac agccacaacg tctatatcat ggccgacaag 720
cagaagaacg gcatcaaggt gaacttcaag atccgccaca acatcgagga cggcagcgtg 780
cagctcgccg accactacca gcagaacacc cccatcggcg acggccccgt gctgctgccc 840
gacaaccact acctgagcac ccagtccgcc ctgagcaaag accccaacga gaagcgcgat 900
cacatggtcc tgctggagtt cgtgaccgcc gccgggatca ctctcggcat ggacgagctg 960
tacaagtaat agtga 975
<210> 4
<211> 3854
<212> DNA
<213> 泛素-红色荧光蛋白基因-IRES- STAT3
<400> 4
gccaccatgg agatcttcgt gaagactctg actggtaaga ccatcaccct cgaggttgag 60
cccagtgaca ccattgagaa tgtcaaggca aagatccaag ataaggaagg catccctcct 120
gaccagcaga ggctgatctt tgctggaaaa cagctggaag atgggcgcac cctgtctgac 180
tacaacatcc agaaagagtc caccctgcac ctggtactcc gtctcagagg tgggggcggg 240
ggcggctcaa tggtgagcaa gggcgaggag gataacatgg ccatcatcaa ggagttcatg 300
cgcttcaagg tgcacatgga gggctccgtg aacggccacg agttcgagat cgagggcgag 360
ggcgagggcc gcccctacga gggcacccag accgccaagc tgaaggtgac caagggtggc 420
cccctgccct tcgcctggga catcctgtcc cctcagttca tgtacggctc caaggcctac 480
gtgaagcacc ccgccgacat ccccgactac ttgaagctgt ccttccccga gggcttcaag 540
tgggagcgcg tgatgaactt cgaggacggc ggcgtggtga ccgtgaccca ggactcctcc 600
ctgcaggacg gcgagttcat ctacaaggtg aagctgcgcg gcaccaactt cccctccgac 660
ggccccgtaa tgcagaagaa gaccatgggc tgggaggcct cctccgagcg gatgtacccc 720
gaggacggcg ccctgaaggg cgagatcaag cagaggctga agctgaagga cggcggccac 780
tacgacgctg aggtcaagac cacctacaag gccaagaagc ccgtgcagct gcccggcgcc 840
tacaacgtca acatcaagtt ggacatcacc tcccacaacg aggactacac catcgtggaa 900
cagtacgaac gcgccgaggg ccgccactcc accggcggca tggacgagct gtacaagtaa 960
cccctctccc tccccccccc ctaacgttac tggccgaagc cgcttggaat aaggccggtg 1020
tgcgtttgtc tatatgttat tttccaccat attgccgtct tttggcaatg tgagggcccg 1080
gaaacctggc cctgtcttct tgacgagcat tcctaggggt ctttcccctc tcgccaaagg 1140
aatgcaaggt ctgttgaatg tcgtgaagga agcagttcct ctggaagctt cttgaagaca 1200
aacaacgtct gtagcgaccc tttgcaggca gcggaacccc ccacctggca acaggtgcct 1260
ctgcggccaa aagccacgtg tataagatac acctgcaaag gcggcacaac cccagtgcca 1320
cgttgtgagt tggatagttg tggaaagagt caaatggctc tcctcaagcg tattcaacaa 1380
ggggctgaag gatgcccaga aggtacccca ttgtatggga tctgatctgg ggcctcggtg 1440
cacatgcttt acatgtgttt agtcgaggtt aaaaaaacgt ctaggccccc cgaaccacgg 1500
ggacgtggtt ttcctttgaa aaacacgatg ataatatggc ccaatggaat cagctacagc 1560
agcttgacac acggtacctg gagcagctcc atcagctcta cagtgacagc ttcccaatgg 1620
agctgcggca gtttctggcc ccttggattg agagtcaaga ttgggcatat gcggccagca 1680
aagaatcaca tgccactttg gtgtttcata atctcctggg agagattgac cagcagtata 1740
gccgcttcct gcaagagtcg aatgttctct atcagcacaa tctacgaaga atcaagcagt 1800
ttcttcagag caggtatctt gagaagccaa tggagattgc ccggattgtg gcccggtgcc 1860
tgtgggaaga atcacgcctt ctacagactg cagccactgc ggcccagcaa gggggccagg 1920
ccaaccaccc cacagcagcc gtggtgacgg agaagcagca gatgctggag cagcaccttc 1980
aggatgtccg gaagagagtg caggatctag aacagaaaat gaaagtggta gagaatctcc 2040
aggatgactt tgatttcaac tataaaaccc tcaagagtca aggagacatg caagatctga 2100
atggaaacaa ccagtcagtg accaggcaga agatgcagca gctggaacag atgctcactg 2160
cgctggacca gatgcggaga agcatcgtga gtgagctggc ggggcttttg tcagcgatgg 2220
agtacgtgca gaaaactctc acggacgagg agctggctga ctggaagagg cggcaacaga 2280
ttgcctgcat tggaggcccg cccaacatct gcctagatcg gctagaaaac tggataacgt 2340
cattagcaga atctcaactt cagacccgtc aacaaattaa gaaactggag gagttgcagc 2400
aaaaagtttc ctacaaaggg gaccccattg tacagcaccg gccgatgctg gaggagagaa 2460
tcgtggagct gtttagaaac ttaatgaaaa gtgcctttgt ggtggagcgg cagccctgca 2520
tgcccatgca tcctgaccgg cccctcgtca tcaagaccgg cgtccagttc actactaaag 2580
tcaggttgct ggtcaaattc cctgagttga attatcagct taaaattaaa gtgtgcattg 2640
acaaagactc tggggacgtt gcagctctca gaggatcccg gaaatttaac attctgggca 2700
caaacacaaa agtgatgaac atggaagaat ccaacaacgg cagcctctct gcagaattca 2760
aacacttgac cctgagggag cagagatgtg ggaatggggg ccgagccaat tgtgatgctt 2820
ccctgattgt gactgaggag ctgcacctga tcacctttga gaccgaggtg tatcaccaag 2880
gcctcaagat tgacctagag acccactcct tgccagttgt ggtgatctcc aacatctgtc 2940
agatgccaaa tgcctgggcg tccatcctgt ggtacaacat gctgaccaac aatcccaaga 3000
atgtaaactt ttttaccaag cccccaattg gaacctggga tcaagtggcc gaggtcctga 3060
gctggcagtt ctcctccacc accaagcgag gactgagcat cgagcagctg actacactgg 3120
cagagaaact cttgggacct ggtgtgaatt attcagggtg tcagatcaca tgggctaaat 3180
tttgcaaaga aaacatggct ggcaagggct tctccttctg ggtctggctg gacaatatca 3240
ttgaccttgt gaaaaagtac atcctggccc tttggaacga agggtacatc atgggcttta 3300
tcagtaagga gcgggagcgg gccatcttga gcactaagcc tccaggcacc ttcctgctaa 3360
gattcagtga aagcagcaaa gaaggaggcg tcactttcac ttgggtggag aaggacatca 3420
gcggtaagac ccagatccag tccgtggaac catacacaaa gcagcagctg aacaacatgt 3480
catttgctga aatcatcatg ggctataaga tcatggatgc taccaatatc ctggtgtctc 3540
cactggtcta tctctatcct gacattccca aggaggaggc attcggaaag tattgtcggc 3600
cagagagcca ggagcatcct gaagctgacc caggtagcgc tgccccatac ctgaagacca 3660
agtttatctg tgtgacacca acgacctgca gcaataccat tgacctgccg atgtcccccc 3720
gcactttaga ttcattgatg cagtttggaa ataatggtga aggtgctgaa ccctcagcag 3780
gagggcagtt tgagtccctc acctttgaca tggagttgac ctcggagtgc gctacctccc 3840
ccatgtaata gtga 3854
<210> 5
<211> 954
<212> DNA
<213> 泛素-红色蛋白基因
<400> 5
gccaccatgg agatcttcgt gaagactctg actggtaaga ccatcaccct cgaggttgag 60
cccagtgaca ccattgagaa tgtcaaggca aagatccaag ataaggaagg catccctcct 120
gaccagcaga ggctgatctt tgctggaaaa cagctggaag atgggcgcac cctgtctgac 180
tacaacatcc agaaagagtc caccctgcac ctggtactcc gtctcagagg tgggggcggg 240
ggcggctcaa tggcttcttt cctgaagaaa acaatgccct tcaaaacaac tattgagggg 300
accgtcaacg ggcattattt caagtgcaca ggcaaggggg agggcaatcc cttcgagggc 360
acccaggaaa tgaagattga ggtcatagaa ggcggcccac tgccttttgc cttccatatc 420
ctgtccacta gctgtatgta cggcagtaag accttcatca aatacgtgtc cggcatcccg 480
gattatttta aacagagttt ccccgagggg tttacatggg aaagaactac cacatacgag 540
gatgggggtt ttctgactgc gcatcaggat acctcactgg atggcgactg cctggtgtat 600
aaggtgaaaa ttctcggcaa caacttccca gccgatgggc ctgtgatgca gaacaaagcg 660
ggtcgatggg aaccagcgac agagatcgta tacgaagtgg atggcgtttt gcgggggcag 720
tcattgatgg ccctgaagtg cccaggaggc aggcacctca cctgccacct gcacactacc 780
taccggtcta agaagcctgc aagcgcattg aagatgcccg gctttcattt cgaggatcac 840
cgcatcgaga ttatggaaga ggtggaaaag gggaaatgtt ataagcagta cgaagctgcc 900
gtggggcggt actgtgacgc agccccgtca aagttggggc ataattaata gtga 954
<210> 6
<211> 3809
<212> DNA
<213> 泛素-蓝色蛋白基因-IRES- STAT3
<400> 6
gccaccatgg agatcttcgt gaagactctg actggtaaga ccatcaccct cgaggttgag 60
cccagtgaca ccattgagaa tgtcaaggca aagatccaag ataaggaagg catccctcct 120
gaccagcaga ggctgatctt tgctggaaaa cagctggaag atgggcgcac cctgtctgac 180
tacaacatcc agaaagagtc caccctgcac ctggtactcc gtctcagagg tgggggcggg 240
ggcggctcaa tgtccgtgat cgccaagcag atgacttaca aagtatatat gtccggcact 300
gtgaacggtc actatttcga ggttgagggc gatggcaaag gcaagccata cgaaggcgag 360
cagaccgtaa aactgacagt taccaaaggg gggccgctgc catttgcctg ggacatcctc 420
tccccacaat gccagtatgg tagcatccca tttaccaagt acccagagga tatcccagat 480
tacgtgaaac agtcatttcc tgaaggttac acatgggaaa gaattatgaa cttcgaagac 540
ggagccgtgt gcaccgttag caatgactct agcatccagg gcaattgctt tatctatcac 600
gtgaagtttt ccggcctgaa ttttccaccc aacggcccag tgatgcagaa aaagactcaa 660
ggttgggagc caaatactga acggttgttc gcccgagacg gcatgctgct cggcaacaat 720
tttatggcgc ttaagctgga gggcggaggc cactacctgt gcgaatttaa aactacgtat 780
aaagctaaga agcctgtgaa gatgcctggg tatcactatg tcgatcggaa gctggatgtt 840
accaatcaca acaaagatta caccagcgtg gagcaatgtg agatttcaat tgcccgaaaa 900
cccgtcgtcg cataacccct ctccctcccc cccccctaac gttactggcc gaagccgctt 960
ggaataaggc cggtgtgcgt ttgtctatat gttattttcc accatattgc cgtcttttgg 1020
caatgtgagg gcccggaaac ctggccctgt cttcttgacg agcattccta ggggtctttc 1080
ccctctcgcc aaaggaatgc aaggtctgtt gaatgtcgtg aaggaagcag ttcctctgga 1140
agcttcttga agacaaacaa cgtctgtagc gaccctttgc aggcagcgga accccccacc 1200
tggcaacagg tgcctctgcg gccaaaagcc acgtgtataa gatacacctg caaaggcggc 1260
acaaccccag tgccacgttg tgagttggat agttgtggaa agagtcaaat ggctctcctc 1320
aagcgtattc aacaaggggc tgaaggatgc ccagaaggta ccccattgta tgggatctga 1380
tctggggcct cggtgcacat gctttacatg tgtttagtcg aggttaaaaa aacgtctagg 1440
ccccccgaac cacggggacg tggttttcct ttgaaaaaca cgatgataat atggcccaat 1500
ggaatcagct acagcagctt gacacacggt acctggagca gctccatcag ctctacagtg 1560
acagcttccc aatggagctg cggcagtttc tggccccttg gattgagagt caagattggg 1620
catatgcggc cagcaaagaa tcacatgcca ctttggtgtt tcataatctc ctgggagaga 1680
ttgaccagca gtatagccgc ttcctgcaag agtcgaatgt tctctatcag cacaatctac 1740
gaagaatcaa gcagtttctt cagagcaggt atcttgagaa gccaatggag attgcccgga 1800
ttgtggcccg gtgcctgtgg gaagaatcac gccttctaca gactgcagcc actgcggccc 1860
agcaaggggg ccaggccaac caccccacag cagccgtggt gacggagaag cagcagatgc 1920
tggagcagca ccttcaggat gtccggaaga gagtgcagga tctagaacag aaaatgaaag 1980
tggtagagaa tctccaggat gactttgatt tcaactataa aaccctcaag agtcaaggag 2040
acatgcaaga tctgaatgga aacaaccagt cagtgaccag gcagaagatg cagcagctgg 2100
aacagatgct cactgcgctg gaccagatgc ggagaagcat cgtgagtgag ctggcggggc 2160
ttttgtcagc gatggagtac gtgcagaaaa ctctcacgga cgaggagctg gctgactgga 2220
agaggcggca acagattgcc tgcattggag gcccgcccaa catctgccta gatcggctag 2280
aaaactggat aacgtcatta gcagaatctc aacttcagac ccgtcaacaa attaagaaac 2340
tggaggagtt gcagcaaaaa gtttcctaca aaggggaccc cattgtacag caccggccga 2400
tgctggagga gagaatcgtg gagctgttta gaaacttaat gaaaagtgcc tttgtggtgg 2460
agcggcagcc ctgcatgccc atgcatcctg accggcccct cgtcatcaag accggcgtcc 2520
agttcactac taaagtcagg ttgctggtca aattccctga gttgaattat cagcttaaaa 2580
ttaaagtgtg cattgacaaa gactctgggg acgttgcagc tctcagagga tcccggaaat 2640
ttaacattct gggcacaaac acaaaagtga tgaacatgga agaatccaac aacggcagcc 2700
tctctgcaga attcaaacac ttgaccctga gggagcagag atgtgggaat gggggccgag 2760
ccaattgtga tgcttccctg attgtgactg aggagctgca cctgatcacc tttgagaccg 2820
aggtgtatca ccaaggcctc aagattgacc tagagaccca ctccttgcca gttgtggtga 2880
tctccaacat ctgtcagatg ccaaatgcct gggcgtccat cctgtggtac aacatgctga 2940
ccaacaatcc caagaatgta aactttttta ccaagccccc aattggaacc tgggatcaag 3000
tggccgaggt cctgagctgg cagttctcct ccaccaccaa gcgaggactg agcatcgagc 3060
agctgactac actggcagag aaactcttgg gacctggtgt gaattattca gggtgtcaga 3120
tcacatgggc taaattttgc aaagaaaaca tggctggcaa gggcttctcc ttctgggtct 3180
ggctggacaa tatcattgac cttgtgaaaa agtacatcct ggccctttgg aacgaagggt 3240
acatcatggg ctttatcagt aaggagcggg agcgggccat cttgagcact aagcctccag 3300
gcaccttcct gctaagattc agtgaaagca gcaaagaagg aggcgtcact ttcacttggg 3360
tggagaagga catcagcggt aagacccaga tccagtccgt ggaaccatac acaaagcagc 3420
agctgaacaa catgtcattt gctgaaatca tcatgggcta taagatcatg gatgctacca 3480
atatcctggt gtctccactg gtctatctct atcctgacat tcccaaggag gaggcattcg 3540
gaaagtattg tcggccagag agccaggagc atcctgaagc tgacccaggt agcgctgccc 3600
catacctgaa gaccaagttt atctgtgtga caccaacgac ctgcagcaat accattgacc 3660
tgccgatgtc cccccgcact ttagattcat tgatgcagtt tggaaataat ggtgaaggtg 3720
ctgaaccctc agcaggaggg cagtttgagt ccctcacctt tgacatggag ttgacctcgg 3780
agtgcgctac ctcccccatg taatagtga 3809
<210> 7
<211> 2313
<212> DNA
<213> STAT3 cDNA
<400> 7
atggcccaat ggaatcagct acagcagctt gacacacggt acctggagca gctccatcag 60
ctctacagtg acagcttccc aatggagctg cggcagtttc tggccccttg gattgagagt 120
caagattggg catatgcggc cagcaaagaa tcacatgcca ctttggtgtt tcataatctc 180
ctgggagaga ttgaccagca gtatagccgc ttcctgcaag agtcgaatgt tctctatcag 240
cacaatctac gaagaatcaa gcagtttctt cagagcaggt atcttgagaa gccaatggag 300
attgcccgga ttgtggcccg gtgcctgtgg gaagaatcac gccttctaca gactgcagcc 360
actgcggccc agcaaggggg ccaggccaac caccccacag cagccgtggt gacggagaag 420
cagcagatgc tggagcagca ccttcaggat gtccggaaga gagtgcagga tctagaacag 480
aaaatgaaag tggtagagaa tctccaggat gactttgatt tcaactataa aaccctcaag 540
agtcaaggag acatgcaaga tctgaatgga aacaaccagt cagtgaccag gcagaagatg 600
cagcagctgg aacagatgct cactgcgctg gaccagatgc ggagaagcat cgtgagtgag 660
ctggcggggc ttttgtcagc gatggagtac gtgcagaaaa ctctcacgga cgaggagctg 720
gctgactgga agaggcggca acagattgcc tgcattggag gcccgcccaa catctgccta 780
gatcggctag aaaactggat aacgtcatta gcagaatctc aacttcagac ccgtcaacaa 840
attaagaaac tggaggagtt gcagcaaaaa gtttcctaca aaggggaccc cattgtacag 900
caccggccga tgctggagga gagaatcgtg gagctgttta gaaacttaat gaaaagtgcc 960
tttgtggtgg agcggcagcc ctgcatgccc atgcatcctg accggcccct cgtcatcaag 1020
accggcgtcc agttcactac taaagtcagg ttgctggtca aattccctga gttgaattat 1080
cagcttaaaa ttaaagtgtg cattgacaaa gactctgggg acgttgcagc tctcagagga 1140
tcccggaaat ttaacattct gggcacaaac acaaaagtga tgaacatgga agaatccaac 1200
aacggcagcc tctctgcaga attcaaacac ttgaccctga gggagcagag atgtgggaat 1260
gggggccgag ccaattgtga tgcttccctg attgtgactg aggagctgca cctgatcacc 1320
tttgagaccg aggtgtatca ccaaggcctc aagattgacc tagagaccca ctccttgcca 1380
gttgtggtga tctccaacat ctgtcagatg ccaaatgcct gggcgtccat cctgtggtac 1440
aacatgctga ccaacaatcc caagaatgta aactttttta ccaagccccc aattggaacc 1500
tgggatcaag tggccgaggt cctgagctgg cagttctcct ccaccaccaa gcgaggactg 1560
agcatcgagc agctgactac actggcagag aaactcttgg gacctggtgt gaattattca 1620
gggtgtcaga tcacatgggc taaattttgc aaagaaaaca tggctggcaa gggcttctcc 1680
ttctgggtct ggctggacaa tatcattgac cttgtgaaaa agtacatcct ggccctttgg 1740
aacgaagggt acatcatggg ctttatcagt aaggagcggg agcgggccat cttgagcact 1800
aagcctccag gcaccttcct gctaagattc agtgaaagca gcaaagaagg aggcgtcact 1860
ttcacttggg tggagaagga catcagcggt aagacccaga tccagtccgt ggaaccatac 1920
acaaagcagc agctgaacaa catgtcattt gctgaaatca tcatgggcta taagatcatg 1980
gatgctacca atatcctggt gtctccactg gtctatctct atcctgacat tcccaaggag 2040
gaggcattcg gaaagtattg tcggccagag agccaggagc atcctgaagc tgacccaggt 2100
agcgctgccc catacctgaa gaccaagttt atctgtgtga caccaacgac ctgcagcaat 2160
accattgacc tgccgatgtc cccccgcact ttagattcat tgatgcagtt tggaaataat 2220
ggtgaaggtg ctgaaccctc agcaggaggg cagtttgagt ccctcacctt tgacatggag 2280
ttgacctcgg agtgcgctac ctcccccatg tga 2313
<210> 8
<211> 20
<212> DNA
<213> 正向引物
<400> 8
cagcagcttg acacacggta 20
<210> 9
<211> 21
<212> DNA
<213> 反向引物
<400> 9
aaacaccaaa gtggcatgtg a 21
机译: 分离的核酸,重组载体,宿主细胞,非人类转基因哺乳动物,筛选物质或分子的方法,体外筛选候选分子或物质的试剂盒,体内筛选物质或分子的方法,试剂盒或包装体内至少一种候选分子或物质,目的多核苷酸的转录修饰物质,药物组合物,用于检测个体中abc1基因转录损伤的方法和试剂盒以及筛选候选分子或物质的试剂盒或包装
机译: hiv-1,hiv-2和siv型逆转录病毒基因组的核苷酸序列及其应用,尤其是逆转录病毒基因组的扩增以及用于体外诊断由这些病毒引起的感染
机译: 由HIV-1和SIV逆转录病毒的基因组产生的核苷酸序列及其应用,特别是用于扩增这些逆转录病毒的基因组以及体外诊断由这些病毒引起的感染的方法