首页> 中文会议>中华医学会第十五次全国医学信息学术会议 >采用主题词与自然语言处理相结合的方法挖掘急性白血病与相关基因的关系

采用主题词与自然语言处理相结合的方法挖掘急性白血病与相关基因的关系

摘要

目前的研究大多采用主题词共现的方法来对医学文献数据进行挖掘,我们也曾尝试采用主题词共现的方法挖掘急性白血病与相关基因的关系,但主题词是经过规范化的词,它表示的是一些比较成熟的概念,就基因这一研究比较活跃的领域而言,对于一些新出现的基因和更专指的基因,在文献标引时不会出现在主题词字段,因此使用主题词方法不可能完全反应更新更细更为专指的基因内容,即会忽略掉一些重要基因的作用。为了克服主题词不能表示某些具体基因的缺点,本研究通过自然语言处理方法,使用MetaMap程序提取文本中的基因名,并计算其与主题词途径提取的急性白血病相关主题词的共现情况,对共现数据使用GenePattern程序进行聚类分析,以发现急性白血病与相关基因的关系。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号