...
首页> 外文期刊>電子情報通信学会技術研究報告 >WEB検索高度化のためのアンサンブル学習に基づく訓練事例の精錬
【24h】

WEB検索高度化のためのアンサンブル学習に基づく訓練事例の精錬

机译:基于集成学习的训练案例的细化,用于高级WEB搜索

获取原文
获取原文并翻译 | 示例
           

摘要

WEBの専門検索エンジンを簡便に構築するための手法として,小山らは“検索隠し味”と呼ばれる検索質問へ拡張語を付加する方法を提案している.この検索億し味を生成するには決定木学習が必要となるが,その決定木学習用の良質な学習データの準備には大きな労力を必要とする.本研究では,バギングと呼ばれるアンサンブル学習法を用いて,決定木の学習のための良質な学習データを自動生成する手法について実証的な考察を行う.検証実験を通して,先行研究よりも安定的に良質な学習用データを生成できる可能性が高いことを示す.%The Keyword Spices, proposed Oyama et al., is a sort of a query-expansion technology, which adds pre-computed additional words to a given query in order to perform an effective domain-specific WEB search. The Keyword Spice technology can achieve a significant performance, but needs a great deal of high-quality training data for learning a decision tree, from which adequate additional words to a query are generated. In this paper, we study an ensemble learning method, especially so-called a bagging, for decision trees used to refine noisy training data for synthesizing good keyword spice words. Throughout experimental evaluations, we show that a bagging method has a high possibility for stabilizing the effects for refining noisy data.
机译:作为一种轻松构建用于WEB的专用搜索引擎的方法,Koyama等人提出了一种在搜索问题中添加扩展词的方法,该问题称为“搜索隐藏的趣味”。尽管需要决策树学习,但为决策树学习准备高质量的学习数据需要花费大量的精力,在本研究中,我们使用称为袋装的整体学习方法来学习决策树。从经验上考虑了一种自动生成高质量学习数据的方法,验证实验表明,与以前的研究相比,它更有可能更稳定地生成高质量学习数据。提出的Oyama等人提出了一种查询扩展技术,该技术会在给定查询中添加预先计算的其他单词,以执行有效的特定于域的WEB搜索。关键字Spice技术可以实现显着的性能,但是需要大量高质量的训练数据来学习决策树,并从中生成足够多的附加词。在本文中,我们研究了用于决策树的集成学习方法,特别是所谓的装袋法,用于精炼嘈杂的训练数据,以合成好的关键词香料词。通过实验评估,我们表明,套袋方法具有稳定提炼嘈杂数据效果的可能性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号