基于链接开放数据的命名实体语义相关度算法设计

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

在自然语言处理和信息检索的领域中,语义相关度的测量一直扮演着非常重要的角色。目前很多工作都集中在词与词之间的语义相关度测量上面,然而命名实体与命名实体之间的语义相关度测量却很少被提及,而后者也有着非常重要的意义。比如通过测量两个文档内命名实体之间的语义相关度,可以更有效地计算两个文档之间的相关度,从而实现更准确的语义搜索。
　　目前的语义相关度测量方法主要分为两种类型:基于知识库的方法和基于统计的方法。基于知识库的方法主要利用维基百科[1]、Wordnet[2]等知识库来计算词的相关度,但是它最大的缺陷在于其有限的实体覆盖度。基于统计的方法主要通过挖掘互联网的统计信息来计算语义相关度,但是由于计算统计信息时,同名的实体都被作为相同对象看待,所以对于那些低频的实体无法测量出准确的语义相关度。
　　为了解决这些问题,我们提出了一种基于链接开放数据(LinkedOpen Data,L O D)的命名实体语义相关度测量算法。由于链接开放数据中包含了非常多属于不同领域的数据源,拥有数以亿计的命名实体,所以通过利用链接开放数据,实体覆盖度的问题就可以得到很好的解决。此外,在链接开放数据中,拥有相同名字的命名实体都会拥有各自独立的描述信息,所以即使低频的命名实体也能拥有自已的可区别于其他命名实体的描述信息,因此,通过利用链接开放数据,低频命名实体的语义相关度测量也变成了可能。最终实验显示,我们的方法能够获得良好效果,并保证了鲁棒性。

著录项

作者
周文磊;
展开▼
作者单位

上海交通大学;

展开▼
授予单位上海交通大学;
学科计算机科学与技术
授予学位硕士
导师姓名俞勇;
年度 2013
页码
总页数
原文格式 PDF
正文语种中文
中图分类文字信息处理;
关键词
命名实体; 语义相关度; 链接开放数据; 鲁棒性;

相似文献

中文文献
外文文献
专利

1. 基于多源知识和Ranking SVM的中文微博命名实体链接 [J] . 陈万礼 ,昝红英 ,吴泳钢 . 中文信息学报 . 2015,第005期
2. 一种基于概率主题模型的命名实体链接方法 [J] . 怀宝兴 ,宝腾飞 ,祝恒书 . 软件学报 . 2014,第009期
3. 基于Wikipedia链接信息的词汇语义相关性度量 [J] . 王瑞琴 . 情报学报 . 2013,第004期
4. 基于CNN和深层语义匹配的中文实体链接模型 [J] . 吴晓崇 ,段跃兴 ,张月琴 . 计算机工程与科学 . 2020,第008期
5. 基于词向量语义分类的微博实体链接方法 [J] . 冯冲 ,石戈 ,郭宇航 . 自动化学报 . 2016,第006期
6. 基于多源知识和Ranking SVM的中文微博命名实体链接 [C] . CHEN Wanli ,陈万礼 ,ZAN Hongying . 中国中文信息学会2015学术年会（CIPS2015）暨第十四届全国计算语言学学术会议（CCL2015）、第三届基于自然标注大数据的自然语言处理国际学术研讨会（NLP-NABD2015） . 2015
7. 基于链接开放数据的实体连接 [A] . 乌辰洋 . 2014

基于链接开放数据的命名实体语义相关度算法设计

目录

摘要

著录项

相似文献

相关主题

期刊订阅