一种用于Web信息抽取的页面信息本体自动学习方法

柳佳刚; 龙军; 李泽军

首页> 中文期刊> 《计算技术与自动化》 >一种用于Web信息抽取的页面信息本体自动学习方法

一种用于Web信息抽取的页面信息本体自动学习方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

钟对基于Web页面信息本体的信息抽取中,需人工根据待抽信息项的概念和对应的实例值来建立本体的缺点,设计一个页面信息本体的自动学习方法.论文利用前期在基于DOM的页面相似路径归纳学习算法和基于PAT-tree的自动关键词识别算法上的研究成果,使用改进的TF·IDF统计方法和复合事件的关联规则算法完成概念和概念间关系的学习,建立页面信息本体,减少建立本体的人工工作量.%According to the weakness of building ontology needs manually designated concepts and instances from the basic information of web, an automatic ontology learning approach based on web information items is designed. Utilizing preresearch that an arithmetic of an inductive learning based on DOM for the similar path of information items and an approach for identifying automatic keyword based on PAT-tree, the learning for the concepts and the relation between concepts is implemented by using an approved TFIDF statistic method and an algorithm of composite event association rule, the information item ontology is built, the manual workload for building ontology is reduce

著录项

来源
《计算技术与自动化》 |2011年第1期|119-123|共5页
作者
柳佳刚; 龙军; 李泽军;
展开▼
作者单位

湖南工学院;

计算机与信息科学系;

湖南;

衡阳;

421002;

中南大学;

信息科学与工程学院;

湖南;

长沙;

410083;

湖南工学院;

计算机与信息科学系;

湖南;

衡阳;

421002;

展开▼
原文格式 PDF
正文语种 chi
中图分类文字信息处理;
关键词
本体学习; 信息抽取; PAT-tree; 关联规则;

相似文献

中文文献
外文文献
专利

1. 一种改进的基于本体的Web信息抽取 [J] . 柳佳刚 ,陈山 ,黄樱 . 计算机工程 . 2010,第004期
2. 一种适用于复合术语的本体概念学习方法 [J] . 李江华 ,时鹏 ,胡长军 . 计算机科学 . 2013,第005期
3. 一种自适应的Web信息抽取规则自动生成方法 [J] . 黄锋 ,吴华瑞 . 广西师范大学学报（自然科学版） . 2010,第001期
4. 一种基于语料库和互信息的本体学习方法 [J] . 李向阳 . 微型机与应用 . 2010,第010期
5. 一种用于信息收集的ASP页面设计方法 [J] . 纪宏伟 ,朱亚林 . 天津科技 . 2016,第003期
6. Web信息抽取中基于神经网络的规则学习方法 [C] . 明廷波 ,左志宏 ,史永刚 . 2005’全国软件与应用学术会议（NASAC） . 2005
7. 基于页面主体提取的WEB信息抽取技术研究 [A] . 于静 . 2013

一种用于Web信息抽取的页面信息本体自动学习方法

摘要

著录项

相似文献

相关主题

期刊订阅