首页> 中文学位 >基于蚁群算法的复杂疾病上位性分析方法研究
【6h】

基于蚁群算法的复杂疾病上位性分析方法研究

代理获取

目录

声明

摘要

插图索引

附表索引

第1章 绪论

1.1 研究背景及意义

1.2 国内外研究现状

1.3 本文研究内容及所做的工作

1.4 本文结构安排

第2章 上位性分析算法概述

2.1 引言

2.2 基本概念

2.2.1 SNP与HAPMAP计划

2.2.2 基因突变的类型

2.2.3 上位性

2.2.4 全基因组关联研究

2.3 连锁不平衡的概念

2.4 上位性检测算法

2.4.1 关联分析方法

2.4.2 基于机器学习的方法

2.4.3 贝叶斯网络理论的方法

2.5 小结

第3章 基于蚁群算法的上位性分析方法

3.1 上位性分析模型

3.2 数据预处理

3.3 多准则融合过滤

3.4 基于蚁群算法的上位性分析

3.4.1 蚁群算法基本原理

3.4.2 上位性分析

3.5 样本个体状态预测

3.6 本文方法整体流程图

3.7 小结

第4章 复杂疾病模拟数据的上位性分析

4.1 模拟数据

4.1.1 疾病数据生成模型

4.1.2 模拟数据集

4.2 实验结果及分析

4.2.1 五折交叉验证

4.2.2 运算时间

4.3 小结

结论

参考文献

附录A (攻读学位期间所发表的学术论文和参加的项目)

致谢

展开▼

摘要

复杂疾病不同于孟德尔疾病,它的形成与发展通常涉及到多个基因的相互作用或者基因与环境的交互作用即上位作用。全基因组范围内的复杂疾病易感基因的发掘,及其与疾病关联方式的确定,将有利于更全面理解复杂疾病发病机理,从而实现复杂疾病的预防,诊断和治疗。尽管针对复杂疾病的基因芯片已经产生海量的数据,但是由于该数据本身具有的特征维数高和上位性分析存在组合爆炸等特点,使得该数据的分析异常困难。该研究中如何对数据进行有效降维,保留关键的上位作用,并有效刻画上位作用与复杂疾病之间关系,成为了复杂疾病的全基因组关联研究的热点。因此,在本文中提出了一种基于蚁群算法的上位性分析方法,主要的创新和工作如下:
  根据复杂疾病上位性分析中存在基因搜索组合空间极大的特点,及其少样本的特性使得不同基因中单核苷酸多态性位点评估方法的差别很大,因此本文借鉴多分类器融合策略,采用多准则融合方法对每个单核苷酸多态性位点进行综合评价,更可靠地剔除与复杂疾病无关的基因,同时,有效保留呈现弱相关的单个单核苷酸多态性位点。
  在剔除大量无关位点之后,搜素上位性组合空间仍然是一项艰巨的任务,本文采用具有较好学习能力的蚁群算法进行上位性组合空间搜索。在该过程中,首先根据复杂疾病SNP芯片数据的特点设计了概率选择函数,并且依据复杂疾病状态分类准确度设计了信息素更新函数,有效找出上位性组合,从而保证了分类准确度。
  最后,本文在复杂疾病的模拟数据集上进行了比较实验。该实验从复杂疾病的分类准确度以及运行时间指标上评价了本文方法。实验结果表明,本文方法所设计的二阶段策略有效降低了算法运行时间,并有效找出致病的上位性组合,具有一定实用意义。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号