首页> 中文期刊> 《标准科学》 >组织机构名称简称与全称的自动识别研究初探

组织机构名称简称与全称的自动识别研究初探

         

摘要

Excessive use of abbreviation, aliases, vulgo for organization name result in computer management system fail to calculate and analyze the information of organization, effectively integrate each separate system, and transfer the data. Uncertain name of organization will reduce the efficiency and increase costs in collecting information in the big data era. This paper analyzes the characteristics of the organization name, and proposes a more effective automotive recognition algorithm to identify the organization name as well as develops software to achieve recognition through transforming the approach of TF-IDF vector space model-based. Preliminary experiments show that the correct rate of identifying the short name in use can be up to over 70%, which will greatly reduce the labor intensity in manual processing.%组织机构名称过多使用简写、别名、俗称等造成的机构名称简称的不确定性,使各计算机管理系统不能正确统计、分析机构信息,各独立系统无法整合,无法有效传递数据,机构名称的不确定性将增加大数据时代在数据挖掘方面的效率和成本。本文分析了组织机构名称的特点,通过对基于向量空间模型的TF-IDF方法进行改造,提出了一种比较有效的组织机构名称的别名自动识别算法,并且开发实现了识别软件。初步实验表明对实际中使用的简称名称识别的正确率可以达到70%以上,这将极大地减轻人工处理的劳动强度。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号