首页> 中国专利> 一种基于大规模文献数据的作者姓名同一性判断方法

一种基于大规模文献数据的作者姓名同一性判断方法

摘要

本发明公开了一种基于大规模文献数据的作者姓名同一性判断方法,属于同名消歧技术领域。包括以下步骤:读取文献数据信息;分组排序,得到含有相同作者名的多个数据块;数据处理为结构化的数据;再分组,每一数据块按照文献id分组得到多个数据小块;数据小块间作者名进行同一性判断,依据作者所属的机构名,循环的在数据小块之间,两两不断取交集,若交集不为空则取并集,使交集不为空的数据小块中包含的记录数不断扩大,直到不再变化为止;最终以相同id标识的为同一作者。本发明克服了现有技术中,由于忽略了文献间内在的关联关系和大量数据造成的混杂度,无需人工标注信息,将数据经过一层层分组排序后化繁为简,提高了同名区分的效率与准确率。

著录项

  • 公开/公告号CN113688257A

    专利类型发明专利

  • 公开/公告日2021-11-23

    原文格式PDF

  • 申请/专利权人 安徽工大信息技术有限公司;

    申请/专利号CN202110954858.1

  • 申请日2021-08-19

  • 分类号G06F16/38(20190101);G06F16/35(20190101);G06F16/26(20190101);

  • 代理机构34134 安徽知问律师事务所;

  • 代理人王亚军

  • 地址 243000 安徽省马鞍山市霍里山大道北段698号马鞍山软件园2栋801室

  • 入库时间 2023-06-19 13:21:35

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号