首页> 中文会议>中国中文信息学会二十五周年学术会议 >互联网挖掘和搜索的研究进展

互联网挖掘和搜索的研究进展

摘要

随着互联网(World Wide Web,简称Web)的发展,我们处在一个搜索无处不在的时代.据不完全统计,在互联网和企业内部,以网页、邮件、格式化文档、音视频文件为主的非结构化数据占其全部数据的80%以上.以搜索引擎为代表的互联网公众信息服务正成为新一轮网络圈地运动的生力军,以垂直搜索、企业内部搜索、桌面搜索、文本信息挖掘与融合等为代表的个性化检索技术已经成为企业智能和内容管理不可或缺的重要组成部分.Web为全世界人民开辟了一个共同的天地,人们在这个虚拟的世界中,以一种全新的方式进行交流,传统的信息检索技术由于Web的出现面临着巨大的挑战,因此Web搜索和挖掘近几年成为信息检索领域研究的热点.在研究领域,多学科交叉的趋势越发明显.以机器学习、数据挖掘为代表的统计学习方法和计算语言学相关的计算模型与知识库已经逐步与信息检索相融合.在基于语言模型的信息检索理论中(Language Modeling IR),一些原本用于自然语言处理领域的方法,如最大熵、隐马尔可夫模型、马尔可夫随机场(Markov Random Field)模型等等纷纷用于信息检索.在网络社区搜索以及个性化信息服务领域,P2P计算、用户行为挖掘、复杂网络模型等相关的理论技术开始被研究人员应用于检索领域.同时,融合本体知识、浅层语言分析和个性化计算等相关的检索技术开始被服务器和桌面平台、网络服务平台以及网格平台领域的内容关联、资源定位等关键技术研究所关注,本文主要介绍互联网挖掘和搜索的研究进展。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号