首页> 中文学位 >基于级联神经网络的命名实体识别深度训练技术
【6h】

基于级联神经网络的命名实体识别深度训练技术

代理获取

摘要

命名实体识别是自然语言处理的基础性任务之一,广泛应用于文本挖掘、语义分析、机器翻译等领域中。在数据日趋海量化和异构化的当今社会,对命名实体识别的研究已经成为了现阶段自然语言处理中的重点项目之一。中文命名实体识别的现有方法大多依赖于先验领域知识,对研究人员的语言学知识具有较高的要求,且识别效果不佳,难以满足大规模工程化应用的需求。随着近年来深度学习技术的日渐成熟,基于人工神经网络的中文命名实体识别技术的研究已经逐渐成为当前中文命名实体识别的主要研究方向。 本文首先对传统的命名实体识别方法进行了分析和总结,并介绍了国外命名实体识别的基于人工神经网络的研究成果。随后本文在传统命名实体识别方法的基础上,融入词向量和前馈神经网络,建立了一种较为灵活的命名实体识别架构。通过对大规模未标记语料的内部表示的学习,使得系统减少甚至忽略工程化特征的影响,采用无监督的方法进行中文命名实体识别。并在无监督前馈神经网络模型的基础上,利用PCA降维的方法,从包含中文命名实体特征的多个目标词中提取出一系列的特征向量,再使用这些少量的先验知识来实现半监督的命名实体识别,从而进一步提升了模型的识别效果。实验表明,使用前馈神经网络能够极大地改善识别依赖于先验信息的问题,且识别速度快,但是识别效果仍有待提高。 随后,本文在对循环神经网络和长短期记忆神经网络进行研究后,在前面叙述的前馈神经网络的基础上采用长短期记忆神经网络代替了原有的前馈神经网络,并通过优化词向量获得方式的方法优化输入向量。实验表明新模型的识别效果得到了进一步的提升,使之能在使用无监督学习方法时取得较为满意的结果,并使其能够在处理长句子时性能相比于前馈神经网络获得较大幅的提升。 最后,本文根据上述几种模型设计了一款中文命名实体识别的简单原型系统,以便于更方便地对几种模型进行使用。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号