Data Mining („Datenschürfen“) bezeichnet den Vorgang des Extrahierens von implizit vorhandener, aber noch unbekannter Information aus einem Datenbestand, den Rohdaten. Es geht dabei um die systematische Anwendung von Methoden auf einen Datenbestand mit dem Ziel, darin verborgene Information zu entdecken. Man könnte diesen Prozess daher auch mit Wissensentdeckung (Knowledge Discovery) übersetzen. Das maschinelle Lernen stellt ein umfassendes Arsenal an Werkzeugen und Techniken zur Verfügung. Oft werden auch mathematisch-statistische Methoden eingesetzt, z.B. lineare and nicht-lineare Regressionstechniken. Andere nicht-statistische Methoden sind etwa Entscheidungsbäume oder neuronale Netze.
Notwendige Voraussetzung für das Data Mining sind repräsentative Daten und deren geeignete Aufbereitung. Hier ist große Sorgfalt erforderlich; unzureichende Datenbestände können leicht zu fehlerhaften Schlüssen führen.
Es geht beim Data Mining also um die Transformation von Daten in nutzbare Information bzw. in Wissen. Mit Verfahren des Data Mining lassen sich geschäftsrelevante Muster, Auffälligkeiten und Regeln in Massendaten entdecken. Die Anwendungsmöglichkeiten sind äußerst vielfältig. Z.B. lassen sich
Im letztgenannten Beispiel mögen diese Bauteile für sich gesehen alle Vorgaben erfüllen, können aber in bestimmtem Konfigurationen dennoch zu Problemen führen. Data-Mining-Verfahren können hier erfolgversprechend eingesetzt werden, um die kritischen Parameter zu identifizieren.