首页> 中文学位 >基于链接开放数据的命名实体语义相关度算法设计
【6h】

基于链接开放数据的命名实体语义相关度算法设计

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

表格索引

插图索引

第一章绪论

1 .1 本文研究课题

1 .2 链接开放数据

1 .3 本文工作

1 .4 论文布局

第二章国内外研究现状

2 .1 基于知识库的语义相关度测量算法

2 .2 基于统计的语义相关度测量方法

第三章算法描述

3 .1 链接开放数据索引构建器

3 .2 语义相关度计算

第四章实验与分析

4 .1 实验设置

4 .2 四种描述信息重合度计算策略的比较

4 .3 语义相关性测量评测

4 .4 链接开放数据数据源的选取

第五章全文总结及展望

参考文献

致谢

攻读学位期间发表的学术论文目录

展开▼

摘要

在自然语言处理和信息检索的领域中,语义相关度的测量一直扮演着非常重要的角色。目前很多工作都集中在词与词之间的语义相关度测量上面,然而命名实体与命名实体之间的语义相关度测量却很少被提及,而后者也有着非常重要的意义。比如通过测量两个文档内命名实体之间的语义相关度,可以更有效地计算两个文档之间的相关度,从而实现更准确的语义搜索。
  目前的语义相关度测量方法主要分为两种类型:基于知识库的方法和基于统计的方法。基于知识库的方法主要利用维基百科[1]、Wordnet[2]等知识库来计算词的相关度,但是它最大的缺陷在于其有限的实体覆盖度。基于统计的方法主要通过挖掘互联网的统计信息来计算语义相关度,但是由于计算统计信息时,同名的实体都被作为相同对象看待,所以对于那些低频的实体无法测量出准确的语义相关度。
  为了解决这些问题,我们提出了一种基于链接开放数据(LinkedOpen Data,L O D)的命名实体语义相关度测量算法。由于链接开放数据中包含了非常多属于不同领域的数据源,拥有数以亿计的命名实体,所以通过利用链接开放数据,实体覆盖度的问题就可以得到很好的解决。此外,在链接开放数据中,拥有相同名字的命名实体都会拥有各自独立的描述信息,所以即使低频的命名实体也能拥有自已的可区别于其他命名实体的描述信息,因此,通过利用链接开放数据,低频命名实体的语义相关度测量也变成了可能。最终实验显示,我们的方法能够获得良好效果,并保证了鲁棒性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号