基于Web的半结构化信息抽取方法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着Internet的迅猛发展,Web已经成为一个巨大的信息空间,为人们提供了一个极具价值的信息源.然而,因为Web固有的开放性、动态性和异构性,尤其是其上无固定模式的半结构化数据呈现日益繁荣的趋势,使得人们很难准确快速地从WWW上获取所需的信息.如何快速、准确地从浩瀚的信息资源中寻找到所需信息已经成为困扰网络用户的一大难题,也正是该文研究的核心内容.该文的主要贡南和特色有以下几个方面:1.针对Web信息分成的自由文本、结构化文本、半结构化文本,以抽取模式为中心深入研究了其上的几种具有代表性的web信息抽取方法,并对以上各种方法作出比较;2.对HTML文档规范的表式结构信息源,该文提出了利用待抽取属性在文档中位置即页头、页尾标记和左右标记来进行抽取方法.3.对HTML文档更广泛的信息源,该文提出了以HTML标记树为基础,把所要提取的信息在树层次结构中的路径作为信息抽取的

著录项

作者
李晶;
展开▼
作者单位

中国科学技术大学;

展开▼
授予单位中国科学技术大学;
学科计算机应用
授予学位硕士
导师姓名陈恩红;
年度 2003
页码
总页数
原文格式 PDF
正文语种中文
中图分类国际互联网;
关键词
信息抽取; 信息检索; 半结构化数据; 归纳学习; XML;

相似文献

中文文献
外文文献
专利

1. 基于Web的半结构化信息抽取技术研究 [J] . 张树瑜 ,杜国宁 ,朱仲英 . 系统工程与电子技术 . 2004,第005期
2. 半结构化数据的形式化描述及数据抽取方法研究 [J] . 李亚红 ,赵冬玲 . 计算机应用与软件 . 2013,第004期
3. 基于WEB新闻内容的信息抽取方法研究 [J] . 沈娜 . 江西科技学院学报 . 2015,第003期
4. 基于web的信息抽取方法研究 [J] . 王毅 . 科技与生活 . 2010,第013期
5. 基于改进HMM的半结构化文本信息抽取算法研究 [J] . 孙师尧 ,妙全兴 . 电子科技 . 2014,第010期
6. 基于Web的农业信息自动抽取方法研究 [C] . 王文生 ,谢能付 . 全国农业信息分析理论与方法学术研讨会 . 2009
7. 基于反馈学习的半结构化信息抽取方法研究 [A] . 孙玉玺 . 2016

基于Web的半结构化信息抽取方法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅