Einführung in Data Mining

In diesem Artikel erfahren Sie mehr über die Einführung in Data Mining, da Menschen seit Jahrhunderten aus der Erde schürfen, um alle möglichen wertvollen Materialien zu erhalten. Manchmal werden beim Bergbau Dinge aus dem Boden entdeckt, von denen niemand erwartet hatte, dass sie überhaupt gefunden werden. Zum Beispiel wurde 1898 bei der Ausgrabung eines Grabes, um Mumien in Saqqara, Ägypten, zu finden, ein hölzernes Artefakt gefunden, das genau einem Flugzeug ähnelte. Es wurde vor etwa 2200 Jahren auf 200 v. Chr. Datiert! Aber welche möglichen Informationen könnten wir aus einer großen Menge von Daten erhalten? Und selbst wenn wir mit dem Mining beginnen, besteht die Möglichkeit, dass der Datensatz unerwartete Ergebnisse liefert? Lassen Sie uns vorher genauer auf Data Mining eingehen.

Was ist Data Mining?

  • Es ist im Grunde die Extraktion von lebenswichtigen Informationen / Wissen aus einer großen Menge von Daten.
  • Stellen Sie sich Daten als großen Untergrund vor. Wir wissen nicht, was sich darin befindet, wir wissen nicht, ob sich etwas Nützliches unter den Felsen befindet.
  • In dieser Einführung in Data Mining suchen wir nach verborgenen Informationen, aber ohne eine Vorstellung davon zu haben, welche Art von Informationen wir finden möchten und was wir beabsichtigen, sie einmal zu verwenden, finden wir sie.
  • Genau wie beim traditionellen Concept-Mining gibt es auch beim Data-Mining verschiedene Techniken und Tools, die sich je nach dem Datentyp, den wir abbauen, unterscheiden. Wir haben also anhand dieses Themas der Einführung in Data-Mining klargestellt, was Data-Mining ist.

Beispiel für Data Mining

Wir haben im obigen Abschnitt die Einführung in Data Mining kennengelernt und fahren nun mit den unten aufgeführten Beispielen für Data Mining fort:

  • Es gibt also einen Mobilfunkbetreiber. Sie wenden sich an einen Data Miner, um die Anruflisten des Betreibers zu durchsuchen. Der Data Miner erhält keine spezifischen Ziele.
  • Es wird ein quantitatives Ziel angegeben, mindestens zwei neue Muster in einem Monat zu finden.
  • Als der Data Miner anfängt, sich mit den Daten zu befassen, stellt er fest, dass am Mittwoch weniger Auslandsgespräche geführt werden als an anderen Tagen.
  • Diese Informationen werden an die Geschäftsleitung weitergegeben und sie haben den Plan, die Gebühren für Auslandsgespräche mittwochs zu senken und eine Kampagne zu starten.
  • Anrufraten steigen, Kunden freuen sich über niedrigen Anrufpreis, mehr Kunden melden sich an und das Unternehmen verdient mehr Geld! Win-Win-Situation!

Lassen Sie uns nun anhand des obigen Beispiels einen Blick auf die verschiedenen Schritte beim Data Mining werfen.

Schritte beim Data Mining

Wir haben im obigen Abschnitt etwas über die Einführung in Data Mining gelernt und fahren nun mit den Schritten fort, die mit Data Mining verbunden sind.

  • Geschäftsverständnis

In dieser Einführung in Data Mining werden alle Aspekte der Geschäftsziele und -anforderungen erläutert. Die aktuelle Situation wird bewertet, indem die Ressourcen, Annahmen und andere wichtige Faktoren ermittelt werden. Dementsprechend sollte eine gute Einführung in den Data Mining-Plan erstellt werden, um sowohl geschäftliche als auch Data Mining-Ziele zu erreichen.

  • Datenverständnis

Zunächst werden die Daten aus allen verfügbaren Quellen gesammelt. Dann wählen wir den besten Datensatz aus, aus dem wir die Daten extrahieren können, die vorteilhafter sein könnten.

  • Datenaufbereitung

Sobald der Datensatz identifiziert ist, wird er ausgewählt, bereinigt, erstellt und in der gewünschten Form formatiert.

  • Datenmodellierung

Hierbei handelt es sich um einen Prozess zum Umgestalten der angegebenen Daten gemäß den Anforderungen des Benutzers. Auf der Grundlage des vorbereiteten Datensatzes könnten ein oder mehrere Modelle erstellt werden. Schließlich müssen die Modelle sorgfältig unter Einbeziehung der Beteiligten bewertet werden, um sicherzustellen, dass die erstellten Modelle den Geschäftsinitiativen entsprechen.

  • Auswertung

Dies ist einer der wichtigsten Prozesse im Data Mining. Es umfasst das Durchlaufen aller Aspekte des Prozesses, um mögliche Fehler oder Datenlecks im Prozess festzustellen. Aufgrund der neu entdeckten Muster können sich auch neue Geschäftsanforderungen ergeben.

  • Einsatz

Es bedeutet, das Wissen einfach so zu präsentieren, dass die Stakeholder es nutzen können, wenn sie es wollen. In unserem obigen Beispiel wurde festgestellt, dass die Anzahl der Auslandsgespräche am Mittwoch geringer war. Daher wurden diese Informationen den Interessenträgern präsentiert, die diese Informationen wiederum zu ihrem Vorteil und zur Steigerung ihres Gewinns verwendeten.

Im Data Mining verwendete Techniken

Im obigen Abschnitt haben wir die Einführung in Data Mining kennengelernt. Nun werden die im Data Mining verwendeten Techniken wie folgt beschrieben:

  • Clusteranalyse

Mithilfe der Clusteranalyse können Sie eine bestimmte Benutzergruppe anhand der in einer Datenbank vorhandenen Funktionen identifizieren. Diese Funktionen können Alter, geografische Lage, Bildungsniveau usw. umfassen.

  • Anomalieerkennung

Es wird verwendet, um festzustellen, wann sich etwas merklich vom regulären Muster unterscheidet. Es wird verwendet, um Datenbankinkonsistenzen oder -anomalien an der Quelle zu beseitigen.

  • Regressionsanalyse

Diese Technik wird verwendet, um Vorhersagen auf der Grundlage von Beziehungen innerhalb des Datensatzes zu treffen. Zum Beispiel kann man die Lagerbestandsrate eines bestimmten Produkts vorhersagen, indem man die Vergangenheit analysiert und auch die verschiedenen Faktoren berücksichtigt, die die Lagerbestandsrate bestimmen. Oder, wie unten gezeigt, wenn wir die Daten der Größe und des Gewichts verschiedener Personen haben, dann könnten wir bei jeder Größe oder jedem Gewicht den anderen Wert bestimmen.

  • Einstufung

Dies befasst sich mit den Dingen, die Etiketten auf sich haben. Beachten Sie, dass die Dinge bei der Clustererkennung keine Beschriftung hatten und dass wir mithilfe von Data Mining Beschriftungen erstellen und Cluster formen mussten. Bei der Klassifizierung sind jedoch Informationen vorhanden, die mithilfe eines Algorithmus einfach klassifiziert werden können. Ein Beispiel sind E-Mail-Spamfilter. Der Spam-Filter enthält sowohl relevante als auch Spam-Nachrichten (Trainingsdaten). Die Unterschiede zwischen beiden werden erkannt, sodass zukünftige E-Mails korrekt klassifiziert werden können.

  • Assoziatives Lernen

Es wird verwendet, um zu analysieren, welche Dinge zusammen auftreten, entweder paarweise oder in größeren Gruppen. Zum Beispiel Menschen, die dazu neigen, Zitronen zu kaufen, kaufen auch Orangen, Menschen, die dazu neigen, Brot zu kaufen, kaufen auch Milch und so weiter. So werden die Einkäufe aller Kunden analysiert und die Dinge, die zusammen auftreten, nahe beieinander platziert, um den Umsatz zu steigern. So wird Milch in die Nähe von Brot gelegt, Zitronen neben Orangen und so weiter.

Ist Data Mining ethisch?

Ich plane einen Wochenendausflug nach Goa mit einem Freund. Ich suche im Internet nach guten Orten, die ich in Goa besuchen kann. Das nächste Mal, wenn ich das Internet öffne, finde ich Anzeigen über verschiedene Hotels in Goa, um dort zu übernachten.

  • Gute Sache?

Ja, das Internet hat mir geholfen, meine Reise zu vereinfachen. Wenn ich mich für einen Besuch in Goa entscheide, müsste ich irgendwo schlafen und eine Anzeige, die mir ein Hotel zeigt, ist viel nützlicher als eine Anzeige, die mir zufällige Kleidung zum Kaufen zeigt.

  • Schlechte Sache?

Ja! Warum sollte ein Data-Mining-Unternehmen, das ich noch nie gehört habe, wissen, wohin ich in den Urlaub fahre? Was ist, wenn ich niemandem von dieser Reise erzählt habe, aber hier weiß das Internet plötzlich, dass ich dorthin gehe. Die Wahrheit ist, dass das Geschäftsmodell des Data Mining-Unternehmens davon abhängt. Sie sammeln diese Daten über Cookies und Skripte und verkaufen sie dann an Werbekunden, die ihrerseits versuchen, mir etwas anderes zu verkaufen (in diesem Fall ein Hotelzimmer).

Es kann also gut oder schlecht sein, je nachdem, wie wir es betrachten. Außerdem könnten wir in dem obigen Fall die Cookies immer ausschalten oder inkognito gehen. Eines ist jedoch sicher. Data Mining ist hier, um zu bleiben.

Empfohlene Artikel

Dies war ein Leitfaden für die Einführung in Data Mining. Hier diskutieren wir die Bedeutung, Techniken und Schritte der Einführung in Data Mining anhand eines Beispiels, um sie besser zu verstehen. Sie können auch folgende Artikel lesen, um mehr zu erfahren -

  1. Fragen im Vorstellungsgespräch bei Data Mining
  2. Predictive Analytics gegen Data Mining
  3. Einführung in Data Science
  4. Was ist eine Regressionsanalyse?

Kategorie: