9 Großartiger Unterschied zwischen Data Science und Data Mining

Inhaltsverzeichnis:

Anonim

Unterschied zwischen Data Science und Data Mining

Beim Data Mining geht es darum, die Trends in einem Datensatz zu finden. Und diese Trends nutzen, um zukünftige Muster zu identifizieren. Dies ist ein wichtiger Schritt im Knowledge Discovery-Prozess. Dabei werden häufig die zahlreichen historischen Daten analysiert, die zuvor ignoriert wurden. Data Science ist ein Studienbereich, der alles von Big Data Analytics, Data Mining, Predictive Modeling, Datenvisualisierung, Mathematik und Statistik umfasst. Data Science wurde als viertes Paradigma der Wissenschaft bezeichnet. (Die anderen drei sind theoretisch, empirisch und rechnerisch). Academia betreibt häufig exklusive Forschung in Data Science.

Historische Perspektive

Bevor wir zu den technischen Beschreibungen übergehen, werfen wir einen Blick auf die Entwicklung der Begriffe. Eine historische Untersuchung wird klären, wie die Begriffe derzeit verwendet werden.

  • Das Wort "Data Science" wurde in den 1960er Jahren verwendet, aber damals wurde es als Alternative zu "Computer Science" verwendet. Gegenwärtig hat es eine ganz andere Bedeutung.
  • Im Jahr 2008 nannten sich DJ Patil und Jeff Hammerbacher als erste Personen "Data Scientists", um ihre Rolle bei LinkedIn bzw. Facebook zu beschreiben.
  • Im Jahr 2012 wurde Data Scientist in einem Artikel der Harvard Business Review als der „sexyste Job des 21. Jahrhunderts“ bezeichnet.
  • Der Begriff Data Mining hat sich parallel entwickelt. In den 90er-Jahren setzte sich die Verbreitung in den Datenbank-Communities fort.
  • Data Mining verdankt seinen Ursprung KDD (Knowledge Discovery in Databases). KDD ist ein Prozess zum Finden von Wissen aus Informationen, die in Datenbanken vorhanden sind. Und Data Mining ist ein wichtiger Teilprozess in KDD.
  • Data Mining wird häufig gemeinsam mit KDD synonym verwendet.

Obwohl diese Namen unabhängig voneinander in Erscheinung getreten sind, ergänzen sie sich häufig, da sie doch in engem Zusammenhang mit der Datenanalyse stehen.

Head-to-Head-Vergleich zwischen Data Science und Data Mining (Infografiken)

Nachfolgend finden Sie die Top-9-Vergleiche zwischen Data Science und Data Mining

Anwendungsbeispiel

Stellen Sie sich ein Szenario vor, in dem Sie ein bedeutender Einzelhändler in Indien sind. Sie haben 50 Geschäfte in 10 großen Städten in Indien und sind seit 10 Jahren in Betrieb.

Angenommen, Sie möchten die Daten der letzten 8 Jahre untersuchen, um die Anzahl der Verkäufe von Süßigkeiten während der Festtage in 3 Städten zu ermitteln. Wenn dies Ihr Ziel ist, würde ich Ihnen empfehlen, eine Person mit Data Mining-Kenntnissen einzustellen. Ein Data Miner würde wahrscheinlich historische Informationen durchsuchen, die in Legacy-Systemen gespeichert sind, und Algorithmen verwenden, um Trends zu extrahieren.

Stellen Sie sich einen anderen Fall vor, in dem Sie wissen möchten, welche Süßigkeiten positivere Bewertungen erhalten haben. In diesem Fall sind Ihre Datenquellen möglicherweise nicht auf Datenbanken beschränkt, sondern können sich auf soziale Websites oder Kundenfeedbacknachrichten erstrecken. In diesem Fall würde ich Ihnen vorschlagen, einen Data Scientist einzustellen. Eine Person, die als Data Scientist angestellt ist, ist besser geeignet, Algorithmen anzuwenden und diese sozio-rechnerische Analyse durchzuführen.

Hauptunterschiede zwischen Data Science und Data Mining

Nachfolgend ist der Unterschied zwischen Data Science und Data Mining aufgeführt

  • Data Mining ist eine Aktivität, die Teil eines umfassenderen Knowledge Discovery in Databases (KDD) -Prozesses ist, während Data Science genau wie Applied Mathematics oder Computer Science ein Studienbereich ist.
  • Häufig wird Data Science in einem weiten Sinne betrachtet, während Data Mining als Nische betrachtet wird.
  • Einige Aktivitäten im Rahmen von Data Mining wie statistische Analysen, Schreiben von Datenflüssen und Mustererkennung können sich mit Data Science überschneiden. Daher wird Data Mining zu einer Teilmenge von Data Science.
  • Maschinelles Lernen in Data Mining wird bei der Mustererkennung häufiger verwendet, während es in Data Science allgemeiner eingesetzt wird.

Hinweis

  • Data Science und Data Mining sollten nicht mit Big Data Analytics verwechselt werden, und sowohl Miner als auch Wissenschaftler können an großen Datasets arbeiten.

Data Science vs. Data Mining Vergleichstabelle

VergleichsbasisData MiningData Science
Was ist es?Eine TechnikEin Gebiet
FokusGeschäftsprozessWissenschaftliche Studie
TorMachen Sie Daten nutzbarerErstellen datenzentrierter Produkte für eine Organisation
AusgabeMusterAbwechslungsreich
ZweckTrends finden bisher nicht bekanntSoziale Analyse, Erstellung von Vorhersagemodellen, Aufdecken unbekannter Fakten und mehr
Berufliche PerspektiveJemand mit Kenntnissen in der Navigation über Daten und statistischem Verständnis kann Data Mining durchführenEine Person muss Maschinelles Lernen, Programmieren und Informationstechniken verstehen und über das Fachwissen verfügen, um Datenwissenschaftler zu werden
UmfangData Mining kann eine Teilmenge von Data Science sein, da Mining-Aktivitäten Teil der Data Science-Pipeline sindMultidisziplinär - Data Science umfasst Datenvisualisierungen, Computergestützte Sozialwissenschaften, Statistik, Data Mining, Verarbeitung natürlicher Sprachen usw.
Befasst sich mit (der Art der Daten)Meist strukturiertAlle Arten von Daten - strukturiert, halbstrukturiert und unstrukturiert
Andere weniger beliebte NamenDatenarchäologie, Information Harvesting, Information Discovery, WissensextraktionDatengetriebene Wissenschaft

Fazit - Data Science vs. Data Mining

Also los geht's! Ich bin mir sicher, dass Sie sich jetzt besser darüber im Klaren sind, worin die Hauptunterschiede zwischen den beiden bestehen und in welchem ​​Kontext die beiden genutzt werden sollten. Eine Sache, an die Sie denken sollten, ist, dass es keine formalen und präzisen Definitionen von Data Science und Data Mining gibt. In Wissenschaft und Industrie wird immer noch diskutiert, was eine genaue Definition ausmacht. In Bezug auf die allgemeinen Unterschiede und Beschreibungen der beiden Begriffe, die wir in diesem Artikel untersucht haben, sind jedoch alle auf derselben Seite.

Empfohlener Artikel

Dies war ein Leitfaden für Data Science vs. Data Mining, deren Bedeutung, Kopf-an-Kopf-Vergleich, Hauptunterschiede, Vergleichstabelle und Schlussfolgerung. Sie können sich auch die folgenden Artikel ansehen, um mehr zu erfahren -

  1. Data Science und seine wachsende Bedeutung
  2. 7 Wichtige Data Mining-Techniken für optimale Ergebnisse
  3. Predictive Analytics vs Data Science - Lernen Sie die 8 nützlichen Vergleiche
  4. 8 Wichtige Data Mining-Techniken für den Geschäftserfolg