摘要:随着信息技术的迅速发展,目前的数据库系统可以高效地实现数据的录入、查询、统计等功能,但无法发现数据中存在的关系和规则,无法根据现有的数据预测未来的发展趋势。缺乏挖掘数据背后隐藏的知识手段,导致了“数据爆炸但知识贫乏”的现象。因此,迫切需要有新一代的技术和工具来对海量数据进行分析,从中及时发现有用的知识,提高信息利用率。因特网在目前做为一个分布式的、全球的、巨大的信息服务中心,每时每刻都有海量数据产生,这无疑对数据挖掘这门新兴的学科提出了巨大的挑战。web不仅由页面组成,而且还包含了由一个页面指向另一个页面的链接结构和用户使用记录,而大量的这些Web内容、链接结构和用户使用记录隐含了人们使用Web页面的行为习惯、页面质量、用户类别等大量重要信息,本文就Web挖掘技术的Web内容挖掘、Web结构挖掘、Web使用记录挖掘等进行了深入、详细的探讨。