Unterschied zwischen Data Science und Data Mining
Beim Data Mining geht es darum, die Trends in einem Datensatz zu finden. Und diese Trends nutzen, um zukünftige Muster zu identifizieren. Dies ist ein wichtiger Schritt im Knowledge Discovery-Prozess. Dabei werden häufig die zahlreichen historischen Daten analysiert, die zuvor ignoriert wurden. Data Science ist ein Studienbereich, der alles von Big Data Analytics, Data Mining, Predictive Modeling, Datenvisualisierung, Mathematik und Statistik umfasst. Data Science wurde als viertes Paradigma der Wissenschaft bezeichnet. (Die anderen drei sind theoretisch, empirisch und rechnerisch). Academia betreibt häufig exklusive Forschung in Data Science.
Historische Perspektive
Bevor wir zu den technischen Beschreibungen übergehen, werfen wir einen Blick auf die Entwicklung der Begriffe. Eine historische Untersuchung wird klären, wie die Begriffe derzeit verwendet werden.
- Das Wort "Data Science" wurde in den 1960er Jahren verwendet, aber damals wurde es als Alternative zu "Computer Science" verwendet. Gegenwärtig hat es eine ganz andere Bedeutung.
- Im Jahr 2008 nannten sich DJ Patil und Jeff Hammerbacher als erste Personen "Data Scientists", um ihre Rolle bei LinkedIn bzw. Facebook zu beschreiben.
- Im Jahr 2012 wurde Data Scientist in einem Artikel der Harvard Business Review als der „sexyste Job des 21. Jahrhunderts“ bezeichnet.
- Der Begriff Data Mining hat sich parallel entwickelt. In den 90er-Jahren setzte sich die Verbreitung in den Datenbank-Communities fort.
- Data Mining verdankt seinen Ursprung KDD (Knowledge Discovery in Databases). KDD ist ein Prozess zum Finden von Wissen aus Informationen, die in Datenbanken vorhanden sind. Und Data Mining ist ein wichtiger Teilprozess in KDD.
- Data Mining wird häufig gemeinsam mit KDD synonym verwendet.
Obwohl diese Namen unabhängig voneinander in Erscheinung getreten sind, ergänzen sie sich häufig, da sie doch in engem Zusammenhang mit der Datenanalyse stehen.
Head-to-Head-Vergleich zwischen Data Science und Data Mining (Infografiken)
Nachfolgend finden Sie die Top-9-Vergleiche zwischen Data Science und Data Mining
Anwendungsbeispiel
Stellen Sie sich ein Szenario vor, in dem Sie ein bedeutender Einzelhändler in Indien sind. Sie haben 50 Geschäfte in 10 großen Städten in Indien und sind seit 10 Jahren in Betrieb.
Angenommen, Sie möchten die Daten der letzten 8 Jahre untersuchen, um die Anzahl der Verkäufe von Süßigkeiten während der Festtage in 3 Städten zu ermitteln. Wenn dies Ihr Ziel ist, würde ich Ihnen empfehlen, eine Person mit Data Mining-Kenntnissen einzustellen. Ein Data Miner würde wahrscheinlich historische Informationen durchsuchen, die in Legacy-Systemen gespeichert sind, und Algorithmen verwenden, um Trends zu extrahieren.
Stellen Sie sich einen anderen Fall vor, in dem Sie wissen möchten, welche Süßigkeiten positivere Bewertungen erhalten haben. In diesem Fall sind Ihre Datenquellen möglicherweise nicht auf Datenbanken beschränkt, sondern können sich auf soziale Websites oder Kundenfeedbacknachrichten erstrecken. In diesem Fall würde ich Ihnen vorschlagen, einen Data Scientist einzustellen. Eine Person, die als Data Scientist angestellt ist, ist besser geeignet, Algorithmen anzuwenden und diese sozio-rechnerische Analyse durchzuführen.
Hauptunterschiede zwischen Data Science und Data Mining
Nachfolgend ist der Unterschied zwischen Data Science und Data Mining aufgeführt
- Data Mining ist eine Aktivität, die Teil eines umfassenderen Knowledge Discovery in Databases (KDD) -Prozesses ist, während Data Science genau wie Applied Mathematics oder Computer Science ein Studienbereich ist.
- Häufig wird Data Science in einem weiten Sinne betrachtet, während Data Mining als Nische betrachtet wird.
- Einige Aktivitäten im Rahmen von Data Mining wie statistische Analysen, Schreiben von Datenflüssen und Mustererkennung können sich mit Data Science überschneiden. Daher wird Data Mining zu einer Teilmenge von Data Science.
- Maschinelles Lernen in Data Mining wird bei der Mustererkennung häufiger verwendet, während es in Data Science allgemeiner eingesetzt wird.
Hinweis
- Data Science und Data Mining sollten nicht mit Big Data Analytics verwechselt werden, und sowohl Miner als auch Wissenschaftler können an großen Datasets arbeiten.
Data Science vs. Data Mining Vergleichstabelle
Vergleichsbasis | Data Mining | Data Science |
Was ist es? | Eine Technik | Ein Gebiet |
Fokus | Geschäftsprozess | Wissenschaftliche Studie |
Tor | Machen Sie Daten nutzbarer | Erstellen datenzentrierter Produkte für eine Organisation |
Ausgabe | Muster | Abwechslungsreich |
Zweck | Trends finden bisher nicht bekannt | Soziale Analyse, Erstellung von Vorhersagemodellen, Aufdecken unbekannter Fakten und mehr |
Berufliche Perspektive | Jemand mit Kenntnissen in der Navigation über Daten und statistischem Verständnis kann Data Mining durchführen | Eine Person muss Maschinelles Lernen, Programmieren und Informationstechniken verstehen und über das Fachwissen verfügen, um Datenwissenschaftler zu werden |
Umfang | Data Mining kann eine Teilmenge von Data Science sein, da Mining-Aktivitäten Teil der Data Science-Pipeline sind | Multidisziplinär - Data Science umfasst Datenvisualisierungen, Computergestützte Sozialwissenschaften, Statistik, Data Mining, Verarbeitung natürlicher Sprachen usw. |
Befasst sich mit (der Art der Daten) | Meist strukturiert | Alle Arten von Daten - strukturiert, halbstrukturiert und unstrukturiert |
Andere weniger beliebte Namen | Datenarchäologie, Information Harvesting, Information Discovery, Wissensextraktion | Datengetriebene Wissenschaft |
Fazit - Data Science vs. Data Mining
Also los geht's! Ich bin mir sicher, dass Sie sich jetzt besser darüber im Klaren sind, worin die Hauptunterschiede zwischen den beiden bestehen und in welchem Kontext die beiden genutzt werden sollten. Eine Sache, an die Sie denken sollten, ist, dass es keine formalen und präzisen Definitionen von Data Science und Data Mining gibt. In Wissenschaft und Industrie wird immer noch diskutiert, was eine genaue Definition ausmacht. In Bezug auf die allgemeinen Unterschiede und Beschreibungen der beiden Begriffe, die wir in diesem Artikel untersucht haben, sind jedoch alle auf derselben Seite.
Empfohlener Artikel
Dies war ein Leitfaden für Data Science vs. Data Mining, deren Bedeutung, Kopf-an-Kopf-Vergleich, Hauptunterschiede, Vergleichstabelle und Schlussfolgerung. Sie können sich auch die folgenden Artikel ansehen, um mehr zu erfahren -
- Data Science und seine wachsende Bedeutung
- 7 Wichtige Data Mining-Techniken für optimale Ergebnisse
- Predictive Analytics vs Data Science - Lernen Sie die 8 nützlichen Vergleiche
- 8 Wichtige Data Mining-Techniken für den Geschäftserfolg