首页> 中文学位 >基于广义主成分分析的全基因组生物检测模型研究
【6h】

基于广义主成分分析的全基因组生物检测模型研究

代理获取

目录

摘要

第1章 绪论

1.1 研究背景

1.1.1 GWAS

1.1.2 GPCA

1.2 已有SNPs检测方法介绍

1.2.1 皮尔逊的x2检验

1.2.2 Logistic回归

1.2.3 回归分析

1.2.4 Lasso回归

1.2.5 Logistic ANOVA

1.3 本文研究主要内容和创新点

第2章 GPCA模型及参数估计

2.1 GPCA模型

2.2 参数估计—MM算法

2.3 惩罚项参数的选择

2.4 本章小结

第3章 模拟研究

3.1 模拟设计

3.2 SNP筛选准则评估

3.2.1 使用Logistic ANOVA模型对SNP筛选准则评估

3.2.2 使用Logistic SVD模型对SNP筛选准则评估

3.3 Logistic SVD模型稳健性探测

3.4 本章小结

第4章 基于NMRI小鼠数据的实例分析

4.1 数据预处理

4.2 结果分析

结论

参考文献

致谢

攻读学位期间发表的学术论文

声明

展开▼

摘要

广义主成分分析(Generalized principal component analysis,GPCA)是以主成分分析(Principal component analysis,PCA)为基础发展起来的,其思想与主成分分析相同,是用较少的指标代替多的指标来反映原来指标的信息.例如,有n个样品,每个样品测得p个指标,共有np个数据.由于指标之间往往互有影响,从p个指标中找出几个综合指标并对其进行分析,这样就可以使用小于p个指标去计算,却能得到p个指标计算出来的结果.
  从海量的单核苷酸多态性(Single nucleotide polymorphisms,SNPs)中,挑选出与疾病或某些临床、环境因素有关的位点,仍是全基因组关联分析中(Genomewide association study,GWAS)的一个重要的课题,本文针对表型-SNP构成的二维列联表结构,提出了一个GPCA模型,该模型是同时对所有SNPs建立的.具体就是对该模型的矩阵作奇异值分解(Singular value decomposition,SVD),来达到减少模型中参数的个数,因此该模型也可称Logistic SVD模型,另外,本文通过刻画SNP基因型在不同表型下的分布差异,构建了一个SNPs筛选准则.模拟研究显示,本文基于Logistic SVD模型和重新构建的SNPs筛选准则都优于现有的方法.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号