首页> 中文期刊> 《计算机工程》 >语义关系相似度计算中的数据标准化方法比较

语义关系相似度计算中的数据标准化方法比较

         

摘要

This paper researches the influence of the data standardization for semantic relation similarity calculation. It extracts lexical pattern from huge text corpus, generates the word pair-lexical pattern matrix, employs three methods to standard the original data matrix, and uses law study method to calculate the similarity between relations. Experimental result shows that without any standardization, the classification task with a statistically significant average precision score is 0.87, z-score standardization is 0.89, interval standardization is 0.95, and weighted based on entropy is 0.96.%研究数据标准化处理对语义关系相似度计算的影响.从大规模文本语料中提取词法模式,生成词对-词法模式矩阵,利用3种数据标准化方式对矩阵数据进行处理,通过规律学习方法对隐含语义关系相似度进行计算.实验结果表明,不做数据标准化、z-score标准化、范围标准化、熵加权标准化处理的分类准确率分别为0.87、0.89、0.95、0.96.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号