舆情搜索引擎中网页信息的采集与抽取研究

王兰成

首页> 中文期刊> 《情报学报》 >舆情搜索引擎中网页信息的采集与抽取研究

舆情搜索引擎中网页信息的采集与抽取研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

It is usually different between Internet public opinion search engine and information search. The first is tobe gathering and extracting data within the page depth to the site and effective. It puts forward many new research content and methods for information area. Web information extraction in the templates and page analysis of two ways, based on natural language processing, Ontology extraction and wrapper induction method based on the analysis have been researched. The wrapper induction based manner and in the rule generation module used an expert model has been designed. It improves the accuracy of public opinion and the quality of search engines.%网络舆情搜索引擎与通常的网络信息搜索不同,其最终结果要深入到站点和页面内部采集与抽取有效数据,给情报界提出了许多新的研究内容和方法.在对网页信息抽取的模板和页面分析两种方式、基于自然语言处理、包装器归纳和Ontology抽取方法的分析基础上,使用基于包装器归纳方式并在规则生成模块中采用专家模式,设计一种基于样本学习的新闻抽取方法,通过人工分析网页源代码制定和修改抽取规则,然后根据抽取规则进行信息自动抽取,以提高舆情搜索引擎的精度和质量.

著录项

来源
《情报学报》 |2011年第10期|1022-1027|共6页
作者
王兰成;
展开▼
作者单位

南京政治学院上海分院军事信息管理系;

上海200433;

展开▼
原文格式 PDF
正文语种 chi
中图分类
关键词
网络舆; 情抽取规则; 新闻网页; 信息抽取;

相似文献

中文文献
外文文献
专利

1. 一种基于网页信息抽取的OA期刊资源采集方法研究 [J] . 黄政 ,张学福 . 数字图书馆论坛 . 2017,第005期
2. 基于改进的隐马尔可夫模型在网页信息抽取中的研究与应用 [J] . 双哲 ,孙蕾 . 计算机应用与软件 . 2017,第002期
3. 搜索引擎中的信息抽取技术 [J] . 林炫 . 电子技术与软件工程 . 2017,第008期
4. 论垂直搜索引擎中的信息抽取技术的选用 [J] . 郭兴 ,柯鹏 ,徐媛 . 医学信息 . 2006,第012期
5. 农业垂直搜索引擎信息抽取的研究 [J] . 胡亮 ,袁芳 ,齐芸芸 . 计算机工程与设计 . 2009,第005期
6. 一种从中文网页中抽取信息的综合方法 [C] . Chen Jin ,陈劲 ,Lin Huaizhong . 第29届中国数据库学术会议 . 2012
7. 垂直搜索引擎中的网页对象抽取模型及实现技术研究 [A] . 王实 . 2009

舆情搜索引擎中网页信息的采集与抽取研究

摘要

著录项

相似文献

相关主题

期刊订阅