Explorative Datenanalyse

Die explorative Datenanalyse (EDA) hilft Ihnen, aus Ihren Daten wichtige Informationen zu ziehen. Sie verwandeln dadurch anscheinend unnütze Daten in wichtige Informationen. Muster und Zusammenhänge, welche Sie nicht erkannt haben, kommen ans Tageslicht.

Als Beispiel für eine EDA nehmen wir hier Verkaufsdaten.

Diese können Informationen verbergen, welche wichtige sind. Dies ist vor allem dann der Fall, wenn man die Zusammenhänge nicht ohne weiteres erkennt.

Wir machen diese Zusammenhänge sichtbar, indem wir modernste Statistikmethoden anwenden, um wichtige Zusammenhänge abzubilden.

Diese Informationen lassen sich ohne eine explorative Datenanalyse nicht ans Tageslicht bringen.

Beispiele hierfür können sein:

  • Trend und Saisonalität
  • Zusammenhänge zwischen Marketingausgaben und Verkaufssteigerungen
  • Bestellmuster der Kunden welche notwendig sind für die Absatz- und Produktionsplanung
  • Churn Rate – Welche Kunden Kündigen bzw. Anzahl der neuen Kunden
  • Net Promoter Score
  • Änderungsraten in Verkaufsgebieten
  • Auswirkungen von Wetter besser verstehen

Oft ist es sinnvoll die Verkaufsdaten von Produkten über mehrere Jahre abzubilden, um interessante Muster zu erkennen.

Anbei zeigen wir Möglichkeiten wie man Verkaufsdaten graphisch  darstellen kann:

Durch Anwendung der explorative Datenanalyse lassen sich weiter interessant und oft wichtige Erkenntnisse aus den Daten ziehen.

Im folgenden Beispiel verwenden wir Methoden aus der Statistik um die Daten zu untersuchen.

Im nächsten Beispiel werden die Zeitreihen auf Saisonalität untersucht.

In dieser Graphiken sehen Sie, wie aus der Zeitreihe ein Forecast (Vorhersage) für die nächsten 4 Monate erstellt wurde.

Im nächsten Beispiel möchten wir den Einfluss von Temperatur auf die Verkäufe näher untersuchen. 

Wir versuchen als erstes einen Zusammenhang graphisch zu untersuchen. Dafür vergleichen wir die monatliche Durchschnittstemperatur mit den monatlichen Verkäufen.

Anhand der graphischen Darstellung lässt sich sehr schwer ein Zusammenhang darstellen. 

Wir versuch noch anhand einer weiteren graphischen  Auswertung auf eine Lösung zu kommen. Wir vergleichen hierzu die monatlichen Verkäufe mit der monatlichen Temperatur.

Dazu wird ein Streudiagramm verwendet auf diesen x-Achse sich die monatliche Durchschnittstemperatur befindet und auf der y-Achse befinden sich die Verkäufe des jeweiligen Monats.

Ein geschultes Auge würde sagen das hier ein sehr schwache Korrelation vorliegt. Allerdings lässt sich ableiten das sehr niedrige Temperaturen einen Einfluss haben und die Verkaufszahlen eher nach unten ziehen.

Um die Frage nach der stärke der Korrelation endgültig zu beantworten verwenden wir ein Korrelationsdiagramm.

Es gibt eine sehr schwache Korrelation von 0.273. Die Temperatur kann daher erst einmal vernachlässigt werden. Allerdings sollte man auf extrem kalte Temperaturen achten. Im Streudiagramm weiter oben ist ein Einfluss zu erkennen.