Einführung in Arten der Datenvisualisierung

In der modernen Big-Data-Arena mit mehr als 2, 5 Billionen Bytes (1 Billion Bytes = 10 18 Bytes!) Daten, die jeden Tag erstellt werden (laut socialmediatoday.com), muss die Datenmenge nicht mehr gespeichert werden. Selbstverständlich sind diese Daten dicht und daher nicht so benutzerlesbar und ständig unkonzentriert. Um das Paradigma für ein leichtes Verständnis des Umfangs der Daten zu ändern und nützliche Vorteile für das Unternehmen zu erzielen, müssen die Daten intuitiver dargestellt werden und erfordern daher geeignete Diagramme, um sie zu visualisieren. Es gibt Tools und Methoden, mit denen die Daten effektiv dargestellt werden können. Die Effektivität hängt jedoch hauptsächlich von der Art der Daten und den Anforderungen ab, die aus den Daten herausgearbeitet werden müssen.

Was ist Datenvisualisierung?

Die Datenvisualisierung ist eine Methode, mit der die Daten im Rohformat dargestellt werden, um deren Bedeutung herauszustellen. Mit dem Aufkommen von Big Data ist es unerlässlich geworden, eine aussagekräftige Methode zur Präsentation der Daten zu entwickeln, damit die Datenmenge nicht zu groß wird. Der Teil der Darstellung der Daten kann für verschiedene Zwecke verwendet werden, z. B. zum Auffinden von Trends / Gemeinsamkeiten / Mustern in Daten, zum Erstellen von Modellen für maschinelles Lernen oder für eine einfache Operation wie die Aggregation.

Verschiedene Arten der Datenvisualisierung

Die Datenvisualisierung ist grob in 6 verschiedene Typen unterteilt. Obwohl der Bereich der Datenvisualisierung stetig wächst, ist es keine Überraschung, wenn die Anzahl der Kategorien zunimmt.

Zeitlich: Daten für diese Art der Visualisierung sollten beide Bedingungen erfüllen: Die dargestellten Daten sollten linear und eindimensional sein. Diese Arten der Visualisierung werden durch Linien dargestellt, die sich möglicherweise überlappen und einen gemeinsamen Start- und Zieldatenpunkt haben.
StreudiagrammeVerwendet Punkte, um einen Datenpunkt darzustellen. Das in der heutigen Welt am häufigsten verwendete Verfahren für maschinelles Lernen bei der explorativen Datenanalyse.
KuchendiagrammDiese Art der Visualisierung umfasst kreisförmige Grafiken, bei denen die Bogenlänge die Größe angibt.
PolardiagrammWie das Kreisdiagramm ist auch das Diagramm der polaren Fläche ein kreisförmiger Plot, mit Ausnahme der Sektorwinkel, deren Länge gleich ist und deren Abstand vom Mittelpunkt die Größe angibt.
LiniendiagrammeWie das Streudiagramm werden die Daten durch Punkte dargestellt, außer durch Linien, um die Kontinuität aufrechtzuerhalten.
ZeitleistenAuf diese Weise wird eine Liste von Datenpunkten in chronologischer Reihenfolge der Zeit angezeigt.
ZeitreihenfolgenIn Zeitreihen stellen wir die Größe von Daten in einem 2D-Diagramm in chronologischer Reihenfolge des Zeitstempels in Daten dar.
Hierarchisch: Diese Arten von Visualisierungen stellen geordnete Gruppen innerhalb einer größeren Gruppe dar. In einfacher Sprache ist die Hauptintuition hinter diesen Visualisierungen, dass die Cluster angezeigt werden können, wenn der Fluss der Cluster von einem einzelnen Punkt aus startet.
Baum diagrammIn einem Baumdiagramm wird der hierarchische Ablauf in Form eines Baums dargestellt, wie der Name schon sagt. Einige Begriffe für diese Darstellung sind:

- Wurzelknoten: Ursprungspunkt.

- Untergeordneter Knoten: Hat einen übergeordneten Knoten

- Blattknoten: Kein Kindknoten mehr.

Ringdiagramme / Sunburst-DiagrammDie Baumdarstellung im Baumdiagramm wird in eine radiale Basis umgewandelt. Dieser Typ hilft bei der Darstellung des Baums in einer kurzen Größe. Der innerste Kreis ist der Wurzelknoten. Der Bereich des untergeordneten Knotens gibt den Prozentsatz der Daten an.
TreeMapDer Baum wird in Form von eng gepackten Rechtecken dargestellt. Der Bereich kennzeichnet die enthaltene Menge.
Kreis-VerpackungÄhnlich wie bei einer Baumkarte wird anstelle von Rechtecken eine runde Packung verwendet.
Netzwerk: Die Visualisierung dieses Typs verbindet Datensätze mit Datensätzen. Diese Visualisierungen zeigen, wie diese Datensätze innerhalb eines Netzwerks zueinander in Beziehung stehen.
MatrixdiagrammeDiese Art der Visualisierung wird häufig verwendet, um die Verbindung zwischen verschiedenen Variablen in sich selbst zu finden. Zum Beispiel Korrelationsdiagramm
SchwemmlanddiagrammeDies ist eine Art Flussdiagramm, in dem die Änderungen im Fluss des Netzwerks in Intervallen dargestellt werden, wie vom Benutzer gewünscht.

WortwolkeDies wird normalerweise zur Darstellung von Textdaten verwendet. Die Wörter sind eng gepackt und die Größe des Textes gibt die Häufigkeit des Wortes an.

Node-Link-DiagrammeHier werden die Knoten als Punkte dargestellt und die Verbindung zwischen den Knoten dargestellt.
Multidimensional: Im Gegensatz zur zeitlichen Darstellung können diese Typen mehrere Dimensionen haben. In diesem Beispiel können zwei oder mehr Features verwendet werden, um eine 3D-Visualisierung durch gleichzeitige Ebenen zu erstellen. Auf diese Weise kann der Benutzer wichtige Erkenntnisse präsentieren, indem er viele nicht nützliche Daten aufteilt.
StreudiagrammeIn mehrdimensionalen Daten wählen wir 2 beliebige Features aus und zeichnen sie dann in einem 2D-Streudiagramm auf. Auf diese Weise hätten wir n C 2 = n (n - 1) / 2 Graphen.
Gestapelte BalkendiagrammeDie Darstellungssegmentleisten übereinander. Es kann sich entweder um ein Balkendiagramm mit 100% Stapelung handeln, bei dem die Trennung in% dargestellt wird, oder um ein einfaches Balkendiagramm mit Stapelung, das die tatsächliche Größe angibt
Paralleles KoordinatendiagrammIn dieser Darstellung wird ein Hintergrund gezeichnet und es werden n parallele Linien gezeichnet (für n-dimensionale Daten).
Geospatial: Diese Visualisierungen beziehen sich auf den tatsächlichen physischen Standort, indem sie mit Karten überkreuzt werden (es kann sich um eine geospatiale oder räumliche Karte handeln). Die Intuition hinter diesen Visualisierungen ist es, eine ganzheitliche Sicht auf die Leistung zu schaffen.
FlusskarteDie Bewegung von Informationen oder Objekten von einem Ort zu einem anderen wird dort dargestellt, wo die Größe des Pfeils die Menge angibt.
Choropleth KarteDie Geodatenkarte wird anhand einer bestimmten Datenvariablen eingefärbt.
KartogrammDiese Art der Darstellung verwendet die thematische Variable für die Zuordnung. Diese Karten verzerren die Realität, um Informationen zu präsentieren. Dies bedeutet, dass die Karten für eine bestimmte Variable übertrieben sind. Das linke Bild ist beispielsweise eine räumliche Karte, die zu einer Bienenstockstruktur verzerrt ist.

WärmekarteDiese sind Choropleth im Geospatial-Genre sehr ähnlich, können aber auch in Gebieten außerhalb des Geospatial-Genres verwendet werden.
Sonstiges: Diese Visualisierungen können nicht in einer besonders großen Gruppe verallgemeinert werden. Anstatt also kleinere Gruppen für den einzelnen Typ zu bilden, gruppieren wir ihn in verschiedene. Einige Beispiele sind unten:
Open-High-Low-Close-DiagrammDiese Art von Grafiken wird normalerweise für die Darstellung des Aktienkurses verwendet. Der zunehmende Trend wird als bullisch und abnehmend als bärisch bezeichnet.
Kagi-ChartIn der Regel wird die Nachfrage nach einem Vermögenswert anhand dieser Grafik dargestellt.

Fazit

Aus den obigen Arten der Visualisierung geht hervor, dass es im Großen und Ganzen 6 Arten von Gruppen gibt. Die obige Liste ist keine vollständige Liste, aber nur wenige, die weit verbreitet sind. In den kommenden Zeiten, wenn neue Typen in die Liste aufgenommen werden, werden die Gruppen möglicherweise größer. Das war's für Visualisierungstypen. Wir werden weiter untersuchen, welche Parameter bei der Festlegung der Art der Visualisierung zu beachten sind.

Empfohlene Artikel

Dies ist eine Anleitung zur Art der Datenvisualisierung. Hier diskutieren wir die Einführung und verschiedene Arten der Datenvisualisierung. Sie können auch unsere anderen Artikelvorschläge durchgehen, um mehr zu erfahren.

  1. Arten von Datenanalysetechniken
  2. Talend Datenintegration
  3. Datenanalyse-Tools
  4. Data Science Tools
  5. Talend-Werkzeuge
  6. Was ist Datenintegration?
  7. Streudiagramme in Matlab
  8. Wie das Balkendiagramm in Matlab verwendet wird (Beispiele)

Kategorie: