首页> 中文学位 >基于矩阵分解的无监督实体关系提取方法研究
【6h】

基于矩阵分解的无监督实体关系提取方法研究

代理获取

目录

声明

摘要

1.1研究背景和意义

1.2国内外研究现状

1.2.1无监督实体关系提取方法

1.2.2基于负采样的表示学习方法

1.2.3基于神经网络的实体关系提取模型

1.3本文主要研究内容

1.4本文组织结构

第2章基于负采样的共现矩阵分解模型

2.1词嵌入模型

2.2实体对-文本共观矩阵

2.3模型构建

2.4本章小结

第3章引入深度语义强化的层次矩阵分解模型

3.1引入语义强化的层次矩阵分解模型

3.2基于词嵌入的深度语义表达

3.3引入深度语义强化的实体关系提取模型

3.4本章小结

第4章基于深度语义强化的神经网络实体关系提取模型

4.1基于深度语义强化的实体关系提取模型

4.2深度神经网络

4.3神经网络映射

4.4基于深度语义强化的神经网络实体关系提取模型

4.5本章小结‘

第5章实验结果与分析

5.1数据集

5.2模型表现分析

5.2.1模型评价实验设置

5.2.2模型评价标准

5.2.3结果与分析

5.3实体对表达分析

5.4关系个数分析

5.5本章小结

6.1总结

6.2展望

参考文献

硕士期间发表的论文和参与的项目

致谢

展开▼

摘要

实体关系抽取是信息抽取中的重要子任务。传统有监督及半监督模型要求已有标注数据或知识库,无法在无先验知识的领域直接应用。无监督实体关系提取方法则将任务建模为聚类问题,能够只使用语料库自身信息进行实体关系抽取。然而已有方法受限于实体对文本共现矩阵的高维稀疏特性,表现有限且模型较为复杂。虽然在模型中引入了文本信息,但使用的人工构建特征集生成的离散特征向量同样高维稀疏,进一步增加了模型的复杂度,降低了引入信息对于模型的提升效果。 因此,本文基于矩阵分解构建无监督实体关系提取模型,旨在降低模型复杂度并引入新的文本语义信息,从而提高模型的训练效率、可扩展性以及表现效果。本文工作主要分为以下三个部分: 首先,本文提出了一个基于负采样的共现矩阵分解模型。模型使用表示学习方法学习实体对在关系空间中的表达,从而能够利用负采样方法降低模型学习的复杂度,更充分的利用高维稀疏共现矩阵的有限信息。 其次,本文提出了一个深度语义强化的层次矩阵分解模型。模型使用层次矩阵分解模型降低文本语义信息引入后增加的模型复杂度,并使用深度语义嵌入编码文本语义信息,从而避免了人工构建特征集的高维稀疏特性与额外噪音。 最后,本文融合了上述两个模型,并使用深度学习方法构建模型结构,提出了NURE-DSE神经网络实体关系抽取模型。模型结合了上述两个模型的优点,并使用反向传播算法自动推断模型参数,从而避免了复杂的数学推导。该模型复杂度低而结构简单,能够适应更大规模的语料库,从而具备更加广阔的应用与扩展空间。 在NYT10实体关系提取数据集上的实验结果表明,本文提出的基于深度语义强化的神经网络实体关系提取模型在实体关系提取的表现上超过了已有方法,能够有效的学习到实体对在关系空间中的表达。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号