《数据挖掘技术与应用》系统详细地阐述了数据挖掘产生的背景、技术、多种相关方法及具体应用,主要内容包括数据挖掘概述,数据采集、集成与预处理技术,多维数据分析与组织,预测模型研究与应用,关联规则模型及应用,聚类分析方法与应用,粗糙集方法与应用,遗传算法与应用,基于模糊理论的模型与应用,灰色系统理论与方法,基于数据挖掘的知识推理。
《数据挖掘技术与应用》可作为管理科学与工程、信息科学与技术、应用数学等相关专业高年级本科生和研究生的数据仓库、数据挖掘及知识管理等相关课程的教材或参考资料,同时本书有助于相关的专业研究人员提升数据挖掘的枝巧和开拓新的研究方向。
随着计算机应用技术和网络技术的普及,全社会的信息化程度不断提高,新的管理模式不断涌现,对信息系统的依赖程度越来越高。信息管理工程研究者和管理者面临严峻挑战:如何从海量、分散、复杂类型的数据海洋中,迅速找出有价值的和潜在有用的信息与知识?如何实现对多维数据的集中组织、分析与管理?数据仓库与数据挖掘可以为上述问题提供有效的解决方案。数据挖掘理论及方法研究与创新已经成为信息科学与管理工程领域最重要的研究方向之一。
笔者在数据仓库技术与数据挖掘模型方面潜心研究数十年。尤其近年来,通过国家自然科学基金,教育部、科技部和交通运输部,省市多个科研项目的资助,深入研究了数据挖掘的理论、技术与方法,获得多项科研成果。特别是面向交通运输、物流管理等特色领域,开展基于数据仓库与数据挖掘的创新性研究,取得了良好的社会效益与经济效益。
撰写本书的目的在于: 利用数据仓库技术将异构的、多维的、具有复杂类型的多源数据整合到一个公共平台上进行统一组织与管理,在此基础上,采用多种数据挖掘方法与模型,实现从底层信息管理到高层知识管理全过程的信息深加工、挖掘与增值。
本书采用逐步演算和编程运行相结合的方式,力争使广大读者通过本书的学习能够快速掌握数据挖掘模型的理论、技术、方法及应用。全书共分为11章,包括数据挖掘概述,数据采集、集成与预处理技术,多维数据分析与组织,预测模型研究与应用,关联规则模型及应用,聚类分析方法与应用,粗糙集方法与应用,遗传算法与应用,基于模糊理论的模型与应用,灰色系统理论与方法,基于数据挖掘的知识推理。
本书主要由陈燕编写,屈莉莉、杨明、张琳、乔月英、吉飞、赵路、程澄、于莹莹、林博辞等参与完成部分章节中具体数据挖掘方法的应用算例和全书的校对工作。
本书旨在涵盖典型和有代表性的数据挖掘算法,但由于数据挖掘方法多种多样,还有许多数据挖掘模型需要进一步探讨。在编写过程中,笔者查阅了国内外大量文献资料,谨向书中提到的和参考文献中列出的学者表示感谢。如果由于我们工作的疏忽,致使本书中某处内容所参考的文献没有列出,在此向所涉及的作者深表歉意。同时,由于时间仓促和编者能力有限,书中难免存在一些不当之处,敬请广大读者批评指正。
陈 燕2010年4月
第1章 数据挖掘概述
1.1 数据仓库和数据挖掘定义与解释
1.1.1 数据仓库的定义与解释
1.1.2 数据挖掘的定义与解释
1.2 数据仓库系统的相关技术
1.2.1 数据仓库系统相关技术之间的关系
1.2.2 数据仓库系统模式
1.3 数据仓库系统中多维数据组织的形式化定义与描述
1.4 数据挖掘方法与研究体系
1.4.1 数据挖掘系统的发展与结构
1.4.2 数据挖掘的相关技术与工具
1.4.3 数据挖掘应用及发展
1.5 小结
思考题
第2章 数据采集、集成与预处理技术
2.1 数据采集的对象
2.2 数据集成技术与方法
2.2.1 3G与M1S的集成模式
2.2.2 异构数据集成的设计与实现
2.3 数据预处理技术与方法
2.3.1 数据清理的方法
2.3.2 数据融合的方法
2.3.3 数据变换的方法
2.3.4 数据归约的方法
2.4 基于样本数据划分的通用数据挖掘模型系统
2.5 中间件技术
2.5.1 中间件技术的定义与作用
2.5.2 中间件技术在数据仓库系统中数据采集的应用
2.6 小结
思考题
第3章 多维数据分析与组织
3.1 多维数据分析概述
3.1.1 联机分析处理的定义和特点
……
第4章 预测模型研究与应用
第5章 关联规则模型及应用
第6章 聚类分析方法与应用
第7章 粗糙集方法与应用
第8章 遗传算法与应用
第9章 基于模糊理论的模型与应用
第10章 灰色系统理论与方法
第11章 基于数据挖掘的知识推理
参考文献