首页> 外文会议> >News Item Extraction for Text Mining inWeb Newspapers
【24h】

News Item Extraction for Text Mining inWeb Newspapers

机译:Web报纸中用于文本挖掘的新闻项提取

获取原文

摘要

Web newspapers provide a valuable resource for information. In order to benefit more from the available information, text mining techniques can be applied. However, because each newspaper page often covers a lot of unrelated topics, page-based data mining will not always give useful results. In order to improve on complete-page mining, we present an approach based on extracting the individual news items from the web pages and mining these separately. Automatic news item extraction is a difficult problem, and in this paper we also provide strategies solving that task. We study the quality of the news item extraction, and also provide results from clustering the extracted news items.
机译:网络报纸提供了宝贵的信息资源。为了从可用信息中受益更多,可以应用文本挖掘技术。但是,由于每个报纸的页面通常包含很多不相关的主题,因此基于页面的数据挖掘将不会总是提供有用的结果。为了改进完整页面的挖掘,我们提出了一种基于从网页中提取单个新闻项并分别对其进行挖掘的方法。新闻自动提取是一个困难的问题,在本文中,我们还提供了解决该任务的策略。我们研究了新闻项提取的质量,并提供了对提取的新闻项进行聚类的结果。

著录项

  • 来源
    《》|2005年|P.195-204|共10页
  • 会议地点
  • 作者

    Norvag; k.; Oyri; R.;

  • 作者单位
  • 会议组织
  • 原文格式 PDF
  • 正文语种
  • 中图分类 工业技术;
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号