数据挖掘(英语:Data mining),又译为资料探勘、数据采矿。它是数据库知识发现(英语:Knowledge-Discovery in Databases,简称:KDD)中的一个步骤。数据挖掘一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性(属于Association rule learning)的信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。
在ICDM2005前夕,美国的吴信东教授等人让世界上这个方向的顶级专家列出了他们各自认为数据挖掘研究领域的10大挑战性问题,然后他们总结这些专家的意见,得出了数据挖掘10大挑战性问题:
1.Developing a Unifying Theory of Data Mining
2.Scaling Up for High Dimensional Data/High Speed Streams
3.Mining Sequence Data and Time Series Data
4.Mining Complex Knowledge from Complex Data
5.Data Mining in a Network Setting
6.Distributed Data Mining and Mining Multi-agent Data
7.Data Mining for Biological and Environmental Problems
8.Data-Mining-Process Related Problems
9.Security, Privacy and Data Integrity
10.Dealing with Non-static, Unbalanced and Cost-sensitive Data