Datenqualität

Die vorliegende Datenqualität der Stammdaten ist  entscheidend für das richtige funktionieren eines ERP Systems. Nicht umsonst hat sich der Begriff SISO (Sh** In, Sh** Out)  etabliert.

Wir bieten Ihnen mehrere Möglichkeiten die Datenqualität Ihre Stammdaten (oder aller anderen Daten) zu analysieren.

Wir erstellen einen Datenqualitätsindex, der Ihnen zeigt, in welchen Bereichen Sie nachbessern müssen, um das richtige funktionieren Ihres ERP System zu gewährleisten. 

Für das funktionieren des Stammdatenmanagements, ist es notwendig zu wissen, welcher Anteil der zu pflegenden Daten fehlerhaft ist oder fehlt.

Wir können große Datenmengen untersuchen und feststellen, wie gut bzw. schlecht Ihre Datenqualität ist.

Anbei folgt ein Beispiel, bei dem  Lieferanten Stammdaten untersucht werden.

Die Ergebnisse sind in einer graphischen Übersicht (Kombinationsmatrix) zusammengefasst.

Bitte klicken Sie auf die Bilder für eine höhere Auflösung:

Durch die Auswertung werden schnell Bereich identifiziert, bei denen die Datenpflege bzw. der Datenqualitätsindex zu gering ist um einen einwandfreien Ablauf innerhalb eines ERP Systems zu gewährleisten.

Anbei folgen noch weitere Möglichkeiten, wie wir Ihre Daten analysieren können, um fehlende oder falsche Dateneinträge zu finden:

Im oben gezeigten Beispiel sind nur 93.8 % der Lieferbedingungen (Delivery) gepflegt und nur 58.53 % der Zahlungsbedingungen (Payment)!  

Insgesamt Sind im analysierten Datensatz 61,9 % der Daten gepflegt bzw. vorhanden (Present) und 38.1 % der Daten fehlen (Missing) bzw. sind ungepflegt. 

Hier erkennt man schnell, dass man im Bereich der Lieferanten Stammdaten nachbessern muss. 

Eine weitere Möglichkeit ist das visuell Darstellen von den fehlenden Werten, aber auch ein gleichzeitiges darstellen der Datentypen:

 

Für die nächsten Beispiele wechseln wir zum tao Datensatz. Details zum Datensatz finden Sie hier: http://www.pmel.noaa.gov/tao/

Es folgt eine visuelle Auswertungen des Datensatzes:

Bei dieser Graphik handelt es sich um ein Matrixplot. Alle roten Blöcke sind fehlende Daten. In den Graustufen befinden sich weitere interessante Details. Je dunkler die Farben, desto höher sind die Werte der Zahlen. Je mehr grau oder schwarze Balken es gibt, desto mehr Daten in den jeweiligen Kategorien gibt es. 

Die nächste Graphik ist ein Marginplot. Hier lassen sich Abhängig zwischen verschiedenen Variablen abbilden. Das es aber in diesem Artikel um Datenqualität geht, sind hier auch Informationen eingebaut, welche es erlauben die fehlenden Werte zu erkennen.

In der Graphik wird die Lufttemperatur in Abhängig von der Oberflächentemperatur des Meeres abgebildet. Alle roten Punkte und Boxplots welche sich am Rand der Graphik befinden, sind fehlende Werte. Die fehlenden Werte werden extra abgebildet und können im Detail analysiert werden.

Als letztes folgt eine graphisch interessante Abbildung:

Es handelt sich bei dieser Graphik um eine
parallele Koordinatendarstellung welche die fehlenden Daten rot markiert.

Visualisierung von Vertriebsdaten

Wir möchten Ihnen hier einige Möglichkeiten vorstellen, Vertriebsdaten visuell darzustellen.

Wir haben hier verschiedene visuelle Darstellungsformen gewählt, die zum teil auch interaktiv verändert werden können.

Um die Verkäufe pro Land besser darstellen zu können (die Proportionen), haben wir uns gegen ein Kuchendiagramm entschieden! Wir setzen dafür ein Waffeldiagramm ein, da sich Proportionen damit im allgemeinen besser abbilden lassen.

Ein Auszug des Waffeldiagramm finden Sie hier:

Beispiel Waffeldiagramm

Im Dashboard finden Sie interessante Tools zur Analyse von Zeitreihen.

Diese sind:

-Seasonal Plot

Zu Darstellung der saisonalen Schwankungen innerhalb Ihrer Verkaufsdaten

-Subseries Seasonal Plot

Darstellung der saisonalen Schwankungen von Monat zu Monat und Jahr zu Jahr.

-Graphische Darstellung des Forecast

Das gesamte Dashboard als html Datei finden Sie hier:

How Data Visualization Will Show You Your Inventory Pain Points

Maybe you have encountered a similar problem: You know you have to drastically improve your cash flow position to stay competitive. To do this, the biggest improvement will be to get rid of the capital invested in your inventories.

Data science tools offer a wide range of data visualization possibilities. These visualization tools will show you, with very little effort, where your biggest leverage is, for improving your inventory situation.

Here, we will introduce a visualization which is made by using the data science software R with the libraries tableplot and ggridges (basically an extension of ggplot).

First, we will show an example of how a tableplot can help identify inventories, that have a very high monetary value and at the same time, very large on hand quantities. Concentrating on large on hand quantities can help you save storage cost.

A tableplot is basically a visualization of large datasets. Each column represents a variable and each row bin is an aggregate of a certain number of records.

To be able to use a tableplot for inventory management, we are using three variables:

  • On Hand Inventory Levels – in our example: „Months_Inventory“
  • The Monetary Value of the Inventory – in our example: „Value_Inventory“
  • The Amount of Inventory – in our example : „Stock_On_Hand“

After tidying the data and running the necessary code, you will be presented with the following visualization:

You will be provided of an immediate picture, which shows you where you have the greatest leverage to improve you inventory cost.

Here, you can „pick“ the area that you would like to improve the most. By concentrating on inventories that have a high value of „Stock_On_Hand“ you would be able to optimize the storage space used by your inventories. Starting improvements where you have a high „Value_Inventory“ number, should give you quick improvements in the areas of cash flow and liquidity.

You will also have the possibility of further drilling down on your data to get more details and understanding of your inventory situation.

Another great way of finding extreme inventory values, is by using boxplots. Below is an example with the same data, but this time in boxplots:

Boxplots are a great way of finding extreme values (outliers) and to understand the distribution of your data within defined groups.

By adding the actual data points to the boxplot, you will get a better understanding of how boxplots show distribution:

Yet another possibility of analyzing, where you will have the biggest impact by lowering your inventory leveles, is by using density ridges:

Please not, that the distribution of the inventory values was very high, so a log scale was necessary to show the distribution.

By using data visualization, you will be able to easily identify where your biggest leverage is, for improving your inventory levels.