亚当·穆罕默德·阿里·法德拉拉
数据挖掘是在数据中识别有效、新颖、有用和可理解的模式的过程,并从海量数据中提取或发现有用的数据模式或知识摘要,也称为数据库中的 KDD 知识发现。KDD 过程包括数据清理、数据挖掘、数据选择、转换、数据集成、模式评估和知识呈现。数据量从 TB 级到 PB 级呈爆炸式增长。多学科的融合包括机器学习、统计学、人工智能、可视化、高性能计算、数据库技术、算法、模式识别,其应用包括生物和医学数据分析:分类、聚类分析和微阵列数据分析、网络挖掘