版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者单位:长春理工大学
学位级别:硕士
导师姓名:尹大力
授予年度:2004年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)]
主 题:数据挖掘 知识发现 Web挖掘 Web使用挖掘 关联规则
摘 要:Internet是一个庞大的、全球性的信息服务中心,它提供了各种各样的信息服务。但随着WEB上数据的爆炸式的增长,数据信息的有用性变的越来越重要了。Web挖掘技术正是基于这一背景提出来的。 本文介绍了数据挖掘的基本知识,讨论了WEB挖掘和WEB挖掘的分类。根据挖掘的内容,WEB挖掘可分为三种,WEB使用挖掘,WEB内容挖掘,WEB结构挖掘。WEB使用挖掘是本文主要的研究方向。WEB使用挖掘就是利用数据挖掘技术从WEB日志数据中挖掘用户访问网站的行为模式。本文重点分析和研究了Web使用挖掘中数据预处理和事务识别算法的应用和改进,并通过实验加以证明。还将关联规则技术应用到了Web日志挖掘中,提出了一种频繁路径的挖掘算法,用以发现网站用户的访问模式。