首页> 中文会议>中国中文信息学会二十五周年学术会议 >信息检索中基于MLS的语言模型准确性分析

信息检索中基于MLS的语言模型准确性分析

摘要

基于语言模型的信息检索技术是一种具有理论优势的信息检索框架,这种技术所面临的一大问题是如何为严重数据稀疏的小文档建立语言模型.许多经验性的平滑技术看似严重地偏离观测数据,似乎背离了建模的准确性原则,但却带来了良好的性能.信息检索中一直以来没有一个合适的关于概率建模的理论框架,来对比和分析语言建模过程中准确性.本文通过引入最大似然集(MLS)估计这一针对小样本数据的概率估计方法,在其概率解释的理论框架下,通过实验对比,揭示了语言模型在信息检索任务中是用来表达语义的模型,其准确性不等价于字符概率估计的准确性.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号