{"id":61,"date":"2018-07-22T17:47:05","date_gmt":"2018-07-22T17:47:05","guid":{"rendered":"http:\/\/inphronesys.com\/?page_id=61"},"modified":"2024-04-12T13:38:54","modified_gmt":"2024-04-12T13:38:54","slug":"datenqualitaetsanalyse","status":"publish","type":"page","link":"https:\/\/inphronesys.com\/?page_id=61","title":{"rendered":"Datenqualit\u00e4t"},"content":{"rendered":"\n<p>Die Datenqualit\u00e4t der Stammdaten ist\u00a0 entscheidend f\u00fcr das richtige funktionieren eines ERP Systems. Nicht umsonst hat sich der Begriff SISO (Sh** In, Sh** Out)\u00a0 etabliert.<\/p>\n\n\n\n<p>Es gibt mit R mehrere M\u00f6glichkeiten die Datenqualit\u00e4t von Stammdaten (oder aller anderen Daten) zu analysieren.<\/p>\n\n\n\n<p>Wir erstellen einen Datenqualit\u00e4tsindex, der zeigt, in welchen Bereichen man nachbessern muss, um das richtige funktionieren eines ERP System zu gew\u00e4hrleisten.\u00a0<\/p>\n\n\n\n<p>F\u00fcr das funktionieren des Stammdatenmanagements, ist es notwendig zu wissen, welcher Anteil der zu pflegenden Daten fehlerhaft ist oder fehlt.<\/p>\n\n\n\n<p>Anbei folgt ein Beispiel, bei dem&nbsp; Lieferanten Stammdaten untersucht werden.<\/p>\n\n\n\n<p>Die Ergebnisse sind in einer graphischen \u00dcbersicht (Kombinationsmatrix) zusammengefasst.<\/p>\n\n\n\n<p>Bitte klicken Sie auf die Bilder f\u00fcr eine h\u00f6here Aufl\u00f6sung:<\/p>\n\n\n\n<figure class=\"wp-block-image\"><a href=\"https:\/\/inphronesys.com\/wp-content\/uploads\/2018\/07\/Datenqualit\u00e4t.png\"><img loading=\"lazy\" decoding=\"async\" width=\"300\" height=\"233\" src=\"https:\/\/inphronesys.com\/wp-content\/uploads\/2018\/07\/Datenqualit\u00e4t-300x233.png\" alt=\"\" class=\"wp-image-64\" srcset=\"https:\/\/inphronesys.com\/wp-content\/uploads\/2018\/07\/Datenqualit\u00e4t-300x233.png 300w, https:\/\/inphronesys.com\/wp-content\/uploads\/2018\/07\/Datenqualit\u00e4t-768x597.png 768w, https:\/\/inphronesys.com\/wp-content\/uploads\/2018\/07\/Datenqualit\u00e4t-1024x796.png 1024w, https:\/\/inphronesys.com\/wp-content\/uploads\/2018\/07\/Datenqualit\u00e4t.png 1800w\" sizes=\"auto, (max-width: 300px) 100vw, 300px\" \/><\/a><\/figure>\n\n\n\n<p>Durch die Auswertung werden schnell Bereich identifiziert, bei denen die Datenpflege bzw. der Datenqualit\u00e4tsindex zu gering ist um einen einwandfreien Ablauf innerhalb eines ERP Systems zu gew\u00e4hrleisten.<\/p>\n\n\n\n<p>Anbei folgen noch weitere M\u00f6glichkeiten, wie man Daten analysieren kann, um fehlende oder falsche Dateneintr\u00e4ge zu finden:<\/p>\n\n\n\n<figure class=\"wp-block-image\"><a href=\"https:\/\/inphronesys.com\/wp-content\/uploads\/2019\/08\/visdat_missing.png\"><img loading=\"lazy\" decoding=\"async\" width=\"1156\" height=\"550\" src=\"https:\/\/inphronesys.com\/wp-content\/uploads\/2019\/08\/visdat_missing.png\" alt=\"\" class=\"wp-image-355\" srcset=\"https:\/\/inphronesys.com\/wp-content\/uploads\/2019\/08\/visdat_missing.png 1156w, https:\/\/inphronesys.com\/wp-content\/uploads\/2019\/08\/visdat_missing-300x143.png 300w, https:\/\/inphronesys.com\/wp-content\/uploads\/2019\/08\/visdat_missing-768x365.png 768w, https:\/\/inphronesys.com\/wp-content\/uploads\/2019\/08\/visdat_missing-1024x487.png 1024w\" sizes=\"auto, (max-width: 1156px) 100vw, 1156px\" \/><\/a><\/figure>\n\n\n\n<p>Im oben gezeigten Beispiel sind nur 93.8 % der Lieferbedingungen (Delivery) gepflegt und nur 58.53 % der Zahlungsbedingungen (Payment)!&nbsp;&nbsp;<\/p>\n\n\n\n<p>Insgesamt Sind im analysierten Datensatz 61,9 % der Daten gepflegt bzw. vorhanden (Present) und 38.1 % der Daten fehlen (Missing) bzw. sind ungepflegt.&nbsp;<\/p>\n\n\n\n<p>Hier erkennt man schnell, dass man im Bereich der Lieferanten Stammdaten nachbessern muss.&nbsp;<\/p>\n\n\n\n<p>Eine weitere M\u00f6glichkeit ist das visuell Darstellen von den fehlenden Werten, aber auch ein gleichzeitiges darstellen der Datentypen:<\/p>\n\n\n\n<figure class=\"wp-block-image\"><a href=\"https:\/\/inphronesys.com\/wp-content\/uploads\/2019\/08\/visdat_Type.png\"><img loading=\"lazy\" decoding=\"async\" width=\"1156\" height=\"550\" src=\"https:\/\/inphronesys.com\/wp-content\/uploads\/2019\/08\/visdat_Type.png\" alt=\"\" class=\"wp-image-357\" srcset=\"https:\/\/inphronesys.com\/wp-content\/uploads\/2019\/08\/visdat_Type.png 1156w, https:\/\/inphronesys.com\/wp-content\/uploads\/2019\/08\/visdat_Type-300x143.png 300w, https:\/\/inphronesys.com\/wp-content\/uploads\/2019\/08\/visdat_Type-768x365.png 768w, https:\/\/inphronesys.com\/wp-content\/uploads\/2019\/08\/visdat_Type-1024x487.png 1024w\" sizes=\"auto, (max-width: 1156px) 100vw, 1156px\" \/><\/a><\/figure>\n\n\n\n<p>F\u00fcr die n\u00e4chsten Beispiele wechseln wir zum tao Datensatz. Details zum Datensatz finden Sie hier: <a href=\"http:\/\/www.pmel.noaa.gov\/tao\/\">http:\/\/www.pmel.noaa.gov\/tao\/<\/a><\/p>\n\n\n\n<p>Es folgt eine visuelle Auswertungen des Datensatzes:<\/p>\n\n\n\n<figure class=\"wp-block-image\"><a href=\"https:\/\/inphronesys.com\/wp-content\/uploads\/2019\/08\/Matrixplot_AirQuality.png\"><img loading=\"lazy\" decoding=\"async\" width=\"1156\" height=\"550\" src=\"https:\/\/inphronesys.com\/wp-content\/uploads\/2019\/08\/Matrixplot_AirQuality.png\" alt=\"\" class=\"wp-image-359\" srcset=\"https:\/\/inphronesys.com\/wp-content\/uploads\/2019\/08\/Matrixplot_AirQuality.png 1156w, https:\/\/inphronesys.com\/wp-content\/uploads\/2019\/08\/Matrixplot_AirQuality-300x143.png 300w, https:\/\/inphronesys.com\/wp-content\/uploads\/2019\/08\/Matrixplot_AirQuality-768x365.png 768w, https:\/\/inphronesys.com\/wp-content\/uploads\/2019\/08\/Matrixplot_AirQuality-1024x487.png 1024w\" sizes=\"auto, (max-width: 1156px) 100vw, 1156px\" \/><\/a><\/figure>\n\n\n\n<p>Bei dieser Graphik handelt es sich um ein Matrixplot. Alle roten Bl\u00f6cke sind fehlende Daten. In den Graustufen befinden sich weitere interessante Details. Je dunkler die Farben, desto h\u00f6her sind die Werte der Zahlen. Je mehr grau oder schwarze Balken es gibt, desto mehr Daten in den jeweiligen Kategorien gibt es.&nbsp;<\/p>\n\n\n\n<p>Die n\u00e4chste Graphik ist ein Marginplot. Hier lassen sich Abh\u00e4ngig zwischen verschiedenen Variablen abbilden. Das es aber in diesem Artikel um Datenqualit\u00e4t geht, sind hier auch Informationen eingebaut, welche es erlauben die fehlenden Werte zu erkennen.<\/p>\n\n\n\n<figure class=\"wp-block-image\"><a href=\"https:\/\/inphronesys.com\/wp-content\/uploads\/2019\/08\/marginplot.png\"><img loading=\"lazy\" decoding=\"async\" width=\"1156\" height=\"550\" src=\"https:\/\/inphronesys.com\/wp-content\/uploads\/2019\/08\/marginplot.png\" alt=\"\" class=\"wp-image-360\" srcset=\"https:\/\/inphronesys.com\/wp-content\/uploads\/2019\/08\/marginplot.png 1156w, https:\/\/inphronesys.com\/wp-content\/uploads\/2019\/08\/marginplot-300x143.png 300w, https:\/\/inphronesys.com\/wp-content\/uploads\/2019\/08\/marginplot-768x365.png 768w, https:\/\/inphronesys.com\/wp-content\/uploads\/2019\/08\/marginplot-1024x487.png 1024w\" sizes=\"auto, (max-width: 1156px) 100vw, 1156px\" \/><\/a><\/figure>\n\n\n\n<p>In der Graphik wird die Lufttemperatur in Abh\u00e4ngig von der Oberfl\u00e4chentemperatur des Meeres abgebildet. Alle roten Punkte und Boxplots welche sich am Rand der Graphik befinden, sind fehlende Werte. Die fehlenden Werte werden extra abgebildet und k\u00f6nnen im Detail analysiert werden.<\/p>\n\n\n\n<p>Als letztes folgt eine graphisch interessante Abbildung:<\/p>\n\n\n\n<figure class=\"wp-block-image\"><a href=\"https:\/\/inphronesys.com\/wp-content\/uploads\/2019\/08\/parcoordMiss.png\"><img loading=\"lazy\" decoding=\"async\" width=\"1156\" height=\"550\" src=\"https:\/\/inphronesys.com\/wp-content\/uploads\/2019\/08\/parcoordMiss.png\" alt=\"\" class=\"wp-image-361\" srcset=\"https:\/\/inphronesys.com\/wp-content\/uploads\/2019\/08\/parcoordMiss.png 1156w, https:\/\/inphronesys.com\/wp-content\/uploads\/2019\/08\/parcoordMiss-300x143.png 300w, https:\/\/inphronesys.com\/wp-content\/uploads\/2019\/08\/parcoordMiss-768x365.png 768w, https:\/\/inphronesys.com\/wp-content\/uploads\/2019\/08\/parcoordMiss-1024x487.png 1024w\" sizes=\"auto, (max-width: 1156px) 100vw, 1156px\" \/><\/a><\/figure>\n\n\n\n<p>Es handelt sich bei dieser Graphik um eine  <br>parallele Koordinatendarstellung welche die fehlenden Daten rot markiert.<\/p>\n\n\n\n<p><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Die Datenqualit\u00e4t der Stammdaten ist\u00a0 entscheidend f\u00fcr das richtige funktionieren eines ERP Systems. Nicht umsonst hat sich der Begriff SISO (Sh** In, Sh** Out)\u00a0 etabliert. Es gibt mit R mehrere M\u00f6glichkeiten die Datenqualit\u00e4t von Stammdaten (oder aller anderen Daten) zu analysieren. Wir erstellen einen Datenqualit\u00e4tsindex, der zeigt, in welchen Bereichen man nachbessern muss, um das [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"parent":0,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"footnotes":""},"class_list":["post-61","page","type-page","status-publish","hentry"],"_links":{"self":[{"href":"https:\/\/inphronesys.com\/index.php?rest_route=\/wp\/v2\/pages\/61","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/inphronesys.com\/index.php?rest_route=\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/inphronesys.com\/index.php?rest_route=\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/inphronesys.com\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/inphronesys.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=61"}],"version-history":[{"count":18,"href":"https:\/\/inphronesys.com\/index.php?rest_route=\/wp\/v2\/pages\/61\/revisions"}],"predecessor-version":[{"id":823,"href":"https:\/\/inphronesys.com\/index.php?rest_route=\/wp\/v2\/pages\/61\/revisions\/823"}],"wp:attachment":[{"href":"https:\/\/inphronesys.com\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=61"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}