首页> 中文学位 >基于MeSH主题词关联规则的医学热点挖掘研究——以哮喘为例
【6h】

基于MeSH主题词关联规则的医学热点挖掘研究——以哮喘为例

代理获取

目录

文摘

英文文摘

表目录

图目录

第一章 绪论

1.1 研究背景

1.2 研究内容

1.3 研究意义

1.4 知识发现、数据挖掘概述

1.5 对医学文献数据库知识发现的研究现状

1.5.1 非相关文献发现

1.5.2 关联规则

1.5.3 共词分析

1.5.4 共篇分析

1.6 数据挖掘研究现状

1.6.1 关联规则挖掘

1.6.2 分类挖掘

1.6.3 聚类挖掘

第二章 实验基于理论及假设

2.1 MeSH主题词代表文献的内容特征

2.1.1 MeSH的组成

2.1.2 MeSH词表的特点

2.1.3 以MeSH主题词为对象对文献进行挖掘

2.2 主题词共现分析揭示词间关系的紧密

2.3 共词聚类分析是以词间关系紧密程度对主题词群聚

2.3.1 聚类

2.3.2 层次聚类法

2.3.3 共词聚类分析对MeSH主题词大体归类

2.4 关联规则发现主题词之间的联系

2.4.1 关联规则的基本概念

2.4.2 Apriori算法

2.4.3 关联规则揭示主题词间的关系

第三章 实验设计

3.1 实验目的

3.2 实验思路

3.3 实验步骤

3.4 实验工具介绍

第四章 实现与分析

4.1 数据预处理

4.1.1 获取原始数据

4.1.2 提取关键数据

4.1.3 数据清洗

4.1.4 降维

4.2 关联规则的生成

4.2.1 构建词篇矩阵

4.2.2 关联规则挖掘处理

4.3 聚类

4.3.1 构建词词矩阵

4.3.2 聚类运算

4.4 实验数据整合

4.5 实验结果分析

4.5.1 哮喘免疫学发病机制

4.5.2 哮喘诱因及流行病学

4.5.3 气道重塑

4.5.4 哮喘诊断与评估

4.5.5 哮喘治疗

4.5.6 职业性哮喘

4.6 实验结果验证

第五章 总结与展望

5.1 实验讨论

5.2 本研究的成果与意义

5.3 本研究的创新

5.4 本研究的不足

5.5 后续研究展望

参考文献

致 谢

展开▼

摘要

在当今信息爆炸的社会,生物医学作为21世纪的重点研究领域,其文献增长速度惊人。但面对数量庞大的文献,人们不再满足于对数据库中的数据进行检索存取等简单操作,而是希望计算机自动智能地分析数据库中的大量数据,以揭示隐藏在这些数据中的更重要信息,即关于这些数据整体特征的描述及对其发展趋势的预测。本研究尝试使用关联规则方法对哮喘相关文献挖掘其近年的研究热点,目的在于寻求一种效果比较理想的计算机处理文献方法分析特定专题领域的研究热点,解决依靠人工阅读工作量过大和人工分析具有主观性的问题。
   本研究以PubMed数据库中2004-2008年发表的以哮喘为主题的文献作为研究对象。下载文献的XML题录,提取各篇文献的主题词和对应副主题词,并统计主题词/副主题词出现的频次,截取频次大于100的主题词作为高频主题词。高频主题词和各篇文献形成词篇矩阵,利用SPSS Clementine软件做关联规则挖掘,生成规则800余条。构建高频主题词共现矩阵,利用SPSS统计软件对矩阵做层次聚类。分析出哮喘研究热点的6大领域。然后依据聚类树状图最底层两两合并的主题词,在各自作为前件的关联规则中找出高置信度的共同后件,组成形如(主题词A/主题词B)→主题词C的“共同关联规则”。通过“共同关联规则”分析各领域的研究热点。
   哮喘的研究热点集中在6大领域:(1)哮喘免疫学发病机制;(2)哮喘诱因及流行病学;(3)气道重塑;(4)哮喘诊断与评估;(5)哮喘治疗;(6)职业性哮喘。通过“共同关联规则”分析得到的各领域的研究热点详见文内。检索SCI影响因子大于3.8的呼吸系统核心期刊2004-2008期间发表的哮喘相关文献,通过人工阅读文摘对文献主题内容提取并分类,结果发现90%以上的文献的主题内容在本研究总结的研究热点中出现。
   本研究利用关联规则分析方法对哮喘相关文献进行研究热点挖掘分析,具有较好的准确度,为计算机处理文献分析特定专题领域的研究热点做出了一个新的尝试。相对于成熟的共词聚类分析方法,本研究在其基础上能赋予更多的主题词之间关系,能更加具体地分析研究热点。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号