首页> 中国专利> 中国作者所发英文文献的作者机构信息抽取方法

中国作者所发英文文献的作者机构信息抽取方法

摘要

一种中国作者所发英文文献的作者机构信息抽取方法,用于从英文文献库中抽取中国作者所在机构的中文名称信息,包括:利用网络爬虫从英文文献库中获取中国作者发表的所有相关英文论文的题录信息;从获取的题录信息中抽取出论文题目、作者机构信息和发表时间三项内容;对作者机构信息进行处理,将其对应到作者机构的标准中文名称;将抽取出的论文题目、发表时间,以及机构的标准中文名称保存到自建的数据库中,以供后续查询和统计使用。利用本发明所述的方法,在很大程度上保证了检索结果的准确性,并免去了手动查询、核对机构信息的过程。通过本发明,用户可以对机构所发表的英文文献信息进行查询和统计,具有很高的查全率和准确率。

著录项

  • 公开/公告号CN104881398B

    专利类型发明专利

  • 公开/公告日2018-03-30

    原文格式PDF

  • 申请/专利权人 北京大学;

    申请/专利号CN201410437424.4

  • 申请日2014-08-29

  • 分类号G06F17/27(20060101);G06F17/30(20060101);G06F17/28(20060101);

  • 代理机构11360 北京万象新悦知识产权代理事务所(普通合伙);

  • 代理人朱红涛

  • 地址 100871 北京市海淀区颐和园路5号

  • 入库时间 2022-08-23 10:09:37

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-03-30

    授权

    授权

  • 2015-09-30

    实质审查的生效 IPC(主分类):G06F17/27 申请日:20140829

    实质审查的生效

  • 2015-09-02

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号