首页> 中文期刊> 《计算机应用》 >非规范化中文地址的行政区划提取算法

非规范化中文地址的行政区划提取算法

         

摘要

Chinese addresses on the Internet are always non-normalized,which cannot be used directly in location-based services.To solve the problem,an algorithm to extract administrative divisions from non-normalized Chinese addresses was proposed.Firstly,preprocessing "road" feature word grouping for original data;using administrative division dictionary and moving window maximum matching algorithm,extract all possible administrative region data sets from Chinese address.Then,using the Chinese administrative divisions between the elements of the hierarchical relationship between the characteristics,the administrative set conditional set operation rule was established and the acquired data set was aggregated.using the administrative division of matching,a set of administrative division set rules were established to calculate the credibility of the administrative division.Finally,the credibility of the maximum amount of information the most complete Chinese address of the administrative divisions were obtained.By using the extracted from the Internet about 250 000 Chinese address data whether the use of "road" feature word packet processing and whether to carry on the credibility calculation process was verified for the availability of the algorithm,and with the current address matching technology for comparison,the accuracy rate of 93.51%.%由于互联网上中文地址的非规范化表达,导致互联网中的中文地址信息在地理位置服务中难以直接应用.针对此问题,提出一种非规范中文地址的行政区划提取算法.首先,对原始数据进行“路”特征词分组预处理;再利用行政区划字典和移动窗口最大匹配算法,从中文地址中提取所有可能的行政区划数据集;然后,利用中文地址行政区划元素之间具有层次关系的特点,建立行政区划条件集合运算规则,对获取的数据集进行集合运算;再利用行政区划匹配度建立一种行政区划集合解析规则,来计算行政区划可信度;最后,得到可信度最大信息量最完整的中文地址的行政区划.利用从互联网中提取的约25万条中文地址数据进行是否采用“路”特征词分组处理以及是否进行可信度计算处理,对算法的可用性进行了验证,并与目前的地址匹配技术进行对比,准确率达到93.51%.

著录项

  • 来源
    《计算机应用》 |2017年第3期|876-882|共7页
  • 作者

    李晓林; 黄爽; 卢涛; 李霖;

  • 作者单位

    武汉工程大学计算机科学与工程学院;

    武汉430205;

    智能机器人湖北省重点实验室(武汉工程大学);

    武汉430205;

    武汉工程大学计算机科学与工程学院;

    武汉430205;

    智能机器人湖北省重点实验室(武汉工程大学);

    武汉430205;

    武汉工程大学计算机科学与工程学院;

    武汉430205;

    智能机器人湖北省重点实验室(武汉工程大学);

    武汉430205;

    武汉大学资源与环境科学学院;

    武汉430079;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 文字信息处理;
  • 关键词

    集合运算; 行政区划; 中文地址; 移动窗口; 匹配度; 解析规则;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号