语义关系相似度计算中的数据标准化方法比较

王正鹏; 谢志鹏; 邱培超

首页> 中文期刊> 《计算机工程》 >语义关系相似度计算中的数据标准化方法比较

语义关系相似度计算中的数据标准化方法比较

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

This paper researches the influence of the data standardization for semantic relation similarity calculation. It extracts lexical pattern from huge text corpus, generates the word pair-lexical pattern matrix, employs three methods to standard the original data matrix, and uses law study method to calculate the similarity between relations. Experimental result shows that without any standardization, the classification task with a statistically significant average precision score is 0.87, z-score standardization is 0.89, interval standardization is 0.95, and weighted based on entropy is 0.96.%研究数据标准化处理对语义关系相似度计算的影响.从大规模文本语料中提取词法模式,生成词对-词法模式矩阵,利用3种数据标准化方式对矩阵数据进行处理,通过规律学习方法对隐含语义关系相似度进行计算.实验结果表明,不做数据标准化、z-score标准化、范围标准化、熵加权标准化处理的分类准确率分别为0.87、0.89、0.95、0.96.

著录项

来源
《计算机工程》 |2012年第10期|38-40|共3页
作者
王正鹏; 谢志鹏; 邱培超;
展开▼
作者单位

复旦大学计算机科学技术学院;

上海 201203;

复旦大学计算机科学技术学院;

上海 201203;

复旦大学计算机科学技术学院;

上海 201203;

展开▼
原文格式 PDF
正文语种 chi
中图分类程序设计、软件工程;
关键词
语义关系; 相似度; 词法模式; 词对-词法模式矩阵; 数据标准化; Web数据挖掘;

相似文献

中文文献
外文文献
专利

1. 综合评价中数据标准化方法比较研究 [J] . 刘竞妍 ,张可 ,王桂华 . 数字技术与应用 . 2018,第006期
2. 综合评价中数据标准化方法比较研究 [J] . 刘竞妍 ,张可 ,王桂华 . 数字技术与应用 . 2018,第006期
3. 语义相似度计算在语义标注中的应用 [J] . 张玉芳 ,张泓博 ,熊忠阳 . 计算机工程与应用 . 2013,第004期
4. 基于分段语义比较的语句相似度计算方法 [J] . 刘运通 ,梁燕军 . 计算机工程与设计 . 2013,第007期
5. 基于语义相似度计算的Deep Web数据库查询 [J] . 夏海峰 ,陈军华 . 微型机与应用 . 2014,第008期
6. 基于知网概念多层结构和义原复修饰关系的语义相似度计算方法 [C] . 刘江鸣 ,徐金安 ,张玉洁 . 第六届全国青年计算语言学会议 . 2012
7. 数据标准化及随机游走下的语义关系相似度计算 [A] . 王正鹏 . 2012

语义关系相似度计算中的数据标准化方法比较

摘要

著录项

相似文献

相关主题

期刊订阅