首页> 中文学位 >面向领域知识图谱的信息抽取方法及其在医学文本中的应用
【6h】

面向领域知识图谱的信息抽取方法及其在医学文本中的应用

代理获取

目录

声明

第1章绪论

1.1 研究背景与意义

1.2 国内外研究现状

1.2.1 知识图谱研究现状

1.2.2 医学命名实体识别研究现状

1.2.3 医学实体关系抽取研究现状

1.3.1 论文研究内容

1.3.2 论文结构安排

第2章知识图谱与深度学习基本模型

2.1.1 知识图谱的定义

2.1.2 知识图谱构建方式

2.1.3 知识图谱存储方式

2.2 词向量

2.3 条件随机场

2.4.1 卷积神经网络

2.4.2 长短期记忆网络

2.4.3 注意力机制

2.5 本章小结

第3章基于深度学习的医学命名实体识别方法

3.1 命名实体识别问题定义

3.2 命名实体识别方法建模流程

3.3 多特征融合的CNN-BiLSTM-CRF 医学命名实体识别模型

3.3.1 数据嵌入模块

3.3.2 双向LSTM模块

3.3.3 CRF标注模块

3.4 模型优化策略

(1)模型目标函数

(2)缓解过拟合策略

(3)参数优化策略

3.5 实验设计与结果分析

3.5.1 实验数据集描述及预处理

3.5.2 实验设置

3.5.3 模型性能评估标准

3.5.4 实验结果与分析

3.6 本章小结

第4章基于深度学习的医学实体关系分类抽取方法

4.1 实体关系分类问题定义

4.2 实体关系分类方法建模流程

4.3 基于ConvLSTM 与层级注意力机制的医学实体关系分类模型

4.3.1 数据重构模块

4.3.2 数据嵌入模块

4.3.3 ConvLSTM模块

4.3.4 层级注意力池化模块

4.3.5 语义关系预测模块

4.4 模型优化策略

(1)模型目标函数

(2)缓解过拟合策略

(3)参数优化策略

4.5.1 实验数据集描述及预处理

4.5.2 实验设置

4.5.3 模型性能评估标准

4.5.4 实验结果与分析

4.6 本章小结

第5章糖尿病领域知识图谱的构建

5.1 糖尿病领域知识图谱构建流程

5.2.1 模式层定义

5.2.2 数据获取

5.2.3 信息抽取

5.2.4 知识融合

5.2.5 知识存储

5.3 知识图谱分析

5.4 本章小结

第6章基于知识图谱的糖尿病知识问答系统设计与实现

6.1 系统需求分析

6.2 系统开发环境与工具

6.3 系统总体架构

6.4.1 问句预处理模块

6.4.2 问句分类模块

6.4.3 知识搜索模块

6.4.4 答案展示模块

6.5 系统页面展示

6.6 本章小结

结论与展望

本文工作总结

未来工作展望

致谢

参考文献

攻读硕士学位期间发表的论文及科研成果

展开▼

摘要

大数据时代下,信息技术的快速发展与广泛应用,推动着医学行业朝着医学信息化的方向探索发展,并成为了一种主流趋势。在医学领域中,蕴含有效信息的非结构化文本数据源源不断的产生,尤其是糖尿病这种常见的慢性疾病,每天产生的数据量更是数以万计。如何从这些海量医学文本中提取出有效信息并加以存储管理对医学信息化的发展具有重大意义。知识图谱作为一种具备语义表达、检索和推理等能力的知识管理与应用的基础设施,能够有效地解决这一问题。信息抽取作为构建知识图谱的核心部分,其抽取效果的好坏直接影响到知识图谱是否具备高质量、可扩展更新的特性。因此,本文主要研究医学领域的信息抽取方法,并将其应用于知识图谱的构建与应用中。  首先,本文设计了一种基于多特征融合的深度学习医学命名实体识别方法。针对中文医学文本数据,在经典的BiLSTM-CRF命名实体识别模型基础上,以字符为识别粒度,融合字符本身、部首、拼音、笔画及上下文短语等多种特征,其中短语特征借助多尺度CNN学习得到。该方法不仅能避免中文分词带来的传递误差,还能弥补短语信息的缺失,能够有效提升医学命名实体的识别效果。  其次,提出了一种基于深度学习的有监督医学实体关系抽取方法。该方法通过滑动窗口技术将数据转换成多维层次序列,采用ConvLSTM实现上下文的信息建模与多轮学习,利用层级注意力池化机制汇总上下文语义信息并捕获与语义关系密切关联的文本片段和短语。该方法不仅能够提升实体关系的整体分类效果,也能缓解因样本不均衡与多实例共存导致的错误分类问题。  最后,基于上述医学命名实体识别和实体关系抽取工作,采用自顶向下的方式构建以糖尿病为例的领域知识图谱,整个构建过程包含模式层定义、数据获取、信息抽取、知识融合与知识存储五部分。并基于此,设计实现了一个糖尿病知识问答系统,不仅可以验证知识图谱的实用性,也能为糖尿病患者了解糖尿病本身的知识与糖尿病的日常管理提供一定的帮助。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号