Prognosen zum Kundenverhalten (3)


26.03.2019, Lesezeit: ~4min

Die Visualisierung von Daten ist wie das Malen eines aussagekräftigen Bildes, dessen Farben aus einem wohl überlegten und gut durchdachten Gemisch aus Nullen und Einsen besteht. Noch nicht einmal „getrocknet“, sorgt dieses Bild meist für ein Aha-Erlebnis beim Betrachter/bei der Betrachterin. Und genau das ist unser Ziel!

Welche theoretischen und analytischen Überlegungen hinter jeder dieser visuellen Aufbereitung stecken, haben wir Ihnen anhand eines Projektbeispiels in unseren ersten beiden Beiträgen der Blog-Reihe „Prognosen zum Kundenverhalten“ bereits im Detail aufgezeigt. In diesem Beitrag wollen wir Ihnen einen Einblick in die Visualisierung liefern und hantieren dabei mit einem vielfältigen und umfangreichen Tool: der Visualisierungs-Software Tableau.

In unserem Beispiel des Lebensmittel-Online-Webshops errechneten wir mithilfe der Methode der logistischen Regression die Wahrscheinlichkeit, ob ein Kunde/eine Kundin durch ihr Kaufverhalten kategorisch eher zu „Fleisch“ greift oder doch lieber „Vegan“ einkauft. Gesagt getan! Die Klassifizierung lag aufgrund der gewonnenen Merkmale auf dem Tisch und die Verantwortlichen des Online-Webshop-Auftritts hegten nur noch einen Wunsch: Diese Erkenntnis aussagekräftig dem Management Board zu präsentieren!

An dieser Stelle sollte eine Visualisierung infrage kommen, die diese wissenschaftlich anmutenden Daten klar und einfach darstellen sollte. Doch: Welche Visualisierung war nun die richtige? Wie sollten wir die gewonnenen Erkenntnisse verpacken, damit sie zu einem echten Aha-Erlebnis in der Chefetage führen?

Wie in vielen anderen Bereichen ereilt einem auch beim Visualisieren die Qual der Wahl, der man am besten mit einigen Fragen entgegnen kann:

  • Was wollen/können uns die Daten überhaupt sagen?
  • Gibt es zeitliche Änderungen, die wir aufzeigen sollten?
  • Soll es eine Liste mit Rangfolge geben?
  • Oder kommt es vielleicht zu einer Korrelation zwischen zwei Variablen, die wir nicht außer Acht lassen sollten?

Kaum hatten wir diese Fragen beantwortet, wurden auch die Optionen in unserem Projektbeispiel klarer. Für uns kam nur ein Diagramm infrage, das unseren Ansprüchen gerecht werden konnte: ein Sankey Diagramm!

Darin konnten wir zeigen, was wir zeigen wollten: zum einen die gewonnenen Merkmale, die zu einer Kategorisierung von „Fleisch“ oder „Vegan“ führten, und zum anderen ihr Zusammenhang mit der jeweiligen Klassifizierung.

Was kann dieses Diagramm? Das Sankey Diagramm kann auf Tableau mit einem gewissen Mehraufwand erstellt werden und liefert in der Tat sehr aussagekräftige Visualisierungen. Sogar Strömungen jeglicher Art können darin visualisiert werden, bei denen die Breite jeder Strömung von ihrer Menge abhängt. Das Diagramm bietet einen vollständigen Überblick über das zu visualisierende System aus der Vogelperspektive. Weiters ermöglicht es, die Beziehung zwischen bestimmten Merkmalen und Kategorisierungen für den Betrachter/die Betrachterin zeitgleich zu präsentieren.

Welche Schritte wir nun in unserem Beispiel durchführen mussten, um zu dieser Aussagekraft zu gelangen, würde den Rahmen dieses Beitrags sprengen. Was wir Ihnen jedoch auf keinen Fall vorenthalten möchten, das sind die wichtigsten Wegweiser, die uns schlussendlich doch zum „fertigen Bild“ führten.

Wesentlich ist, dass unsere Basisdaten aus dem bereits hergeleiteten Dataset, das wir bereits aus dem zweiten Beitrag unserer Blog-Reihe kennen, bestanden. Polygonale (oder Vieleck) Daten waren eine wunderbare Ergänzung und Erweiterung. Um schöne und aussagekräftige Kurven zu erhalten, erstellten wir anhand des zu berechnenden Feldes ein so genanntes Sigmoid (oder Schwanenhals).

Die Größe, die Reihenfolge, den Start und das Ende der Sigmoid-Flüsse bescherten uns einige Tabellenberechnungen, die wir mit allen anderen Bestandteilen schließlich in einem Dashboard zusammenführen konnten. Und fertig war das Bild in Form des Sankey Diagramms!

In unserem Fall könnte ein Aha-Erlebnis lauten: Der Kauf von Erdäpfeln stellt also in 65,20% der Fälle einen Indikator für Käufer/Käuferinnen dar, die vorwiegend in der Kategorie „Fleisch“ zu finden sind.

  • Teilen:

Wir hoffen, dass wir mit unseren Ausführungen einen kleinen Einblick in die Welt der verbildlichten Daten geben konnten und freuen uns auf viele weitere Visualisierungen, die hoffentlich auch bald in Ihrem Unternehmen für Aha-Erlebnisse sorgen werden!

Freuen Sie sich auf den nächsten Beitrag in unserer Blog-Reihe, worin das BI-Marketing-Team seine Sichtweise auf dieses Projekt wiedergeben wird und dabei einen wesentlichen Faktor in den Mittelpunkt stellt: den Nutzen für den Kunden/die Kundin! Viel Spaß damit!


Sebastian Pisarski
Data Visualisation

we keep you informed

Mit unserem Blog-Newsletter informieren wir Sie regelmäßig über Spannendes, Ungewöhnliches, Neues & Kommendes aus der IT-Welt.

We keep you informed

Mit unserem Blog-Newsletter informieren wir Sie regelmäßig über Spannendes, Ungewöhnliches, Neues & Kommendes aus der IT-Welt.

Kontakt