Dank volatiler Märkte und starkem Wettbewerb wird das Treffen von Entscheidungen im eigenen Business zu einer immer grösseren Herausforderung. Zeitgleich ermöglicht die zunehmende Digitalisierung, dass Unternehmen mehr und mehr Daten zur Verfügung stehen. Dies macht sich Business Intelligence zunutze und liefert so Unterstützung beim Treffen von Entscheidungen. Im Rahmen von BI werden Daten mithilfe eines technologiegetriebenen Prozesses analysiert und zu präsentierbaren Informationen weiterverarbeitet. Bei der Datenvisualisierung – einem Teilbereich der Business Intelligence – werden Daten in eine visuelle Form gebracht und so Informationen leicht verständlich gemacht. Das Resultat aus einem Business Intelligence Prozess kann Entscheidungsträgern und Endanwendern somit helfen, fundierte Entscheidungen zu treffen und einen Überblick zu erhalten. Aber zurück zum Anfang – bevor Daten in eine verständliche Form überführt werden können, müssen sie zunächst aufbereitet werden.
Datenaufbereitung – Was ist das?
Damit gesammelte Daten entscheidende Informationen liefern, gilt es zunächst eine verlässliche Basis zu schaffen. Dies ist die Aufgabe der Datenaufbereitung oder auch Data Preparation. Die Datenaufbereitung ist ein Prozess, bei dem die Rohdaten einer Organisation gesammelt und für User zur weiteren Verwendung nutzbar gemacht werden. Alternativ kommen sie in BI- oder Analyseprogrammen zum Einsatz. Dieser Prozess ist zwar zeitintensiv, jedoch unumgänglich für eine zielführende Analyse. In diesem Kontext haben wir bei Auditrium unser Dienstleistungsportfolio um CFO-Services erweitert, um Unternehmen bei ihrer stabilen Entwicklung zu unterstützen.
Schritte der Datenaufbereitung
Inwiefern der Datenaufbereitungsprozess eine Herausforderung darstellt, ist von der Organisation und Branche sowie von den Anforderungen an die Ergebnisse abhängig. Die einzelnen Prozessschritte gleichen einander jedoch unabhängig davon. Ehe begonnen werden kann, ist es wichtig, dass ein klares Ziel definiert wird – und dies ist nicht so trivial, wie es zunächst klingt. Bei einer Studie des Business Application Research Center (BARC) wurden 695 Business-Intelligence-Experten aus unterschiedlichen Bereichen befragt. 53 % gaben an, dass Entscheidungsträger häufig nicht wissen, welche Daten für anstehende Entscheidungen benötigt werden und somit aufbereitet werden müssten. In der DACH Region liegt der Prozentwert sogar bei 58 %. Die Identifikation des eigentlichen Sinns uns Zweckes der Analyse und die klare Definition dessen stellt somit zumeist eine Herausforderung dar und der dafür benötigte Zeitaufwand soll somit nicht unterschätzt werden.
1. Sammlung der Daten
Der tatsächliche Prozess der Aufbereitung beginnt mit der Identifikation und Sammlung relevanter Daten. Diese können zum Beispiel aus robusten und strukturierten Datenquellen wie Datenbanken oder ähnlichen internen Quellen stammen. Eine weitere Möglichkeit sind Daten aus Formaten wie Excel oder SAP-Reports, die gegebenenfalls zuerst identifiziert werden müssen.
2. Ermittlung und Bewertung von Daten
Nach der Identifikation der Daten, gilt es diese im nächsten Schritt – der Data Discovery – zu verstehen. Dabei geht es nicht nur um ein Verständnis für deren Inhalt, sondern auch um eine Einschätzung des Aufwands, der mit der Aufbereitung dieser verbunden ist. Die Frage, die sich dabei stellt, ist: In welcher Form müssen die Daten vorliegen, um für den gewünschten Anwendungszweck einsetzbar zu sein? Diese erste Analyse umfasst die Identifikation von Datenmustern, Beziehungen und sonstigen Datenattributen. Zudem werden auch Kriterien, die die Datenqualität betreffen, wie zum Beispiel die Vollständigkeit, Korrektheit, Konsistenz, Redundanzfreiheit und Relevanz der Datensätze betrachtet, um eine weitere Optimierungspotenziale zu ermitteln.
3. Bereinigung und Prüfung von Daten
In diesem Schritt findet die tatsächliche Datenbereinigung statt. Der zeitaufwendig – jedoch extrem wichtige Schritt soll sicherstellen, dass fehlerhafte Daten entfernt und Lücken geschlossen werden. Zu den Aufgaben zählen:
- Entfernung irrelevanter Daten & Ausreisser
- Hinzufügen fehlender Daten
- Standardisierung der einzelnen Datensätze (anhand eines definierten Musters)
- Maskierung privater und oder sensibler Dateneinträge
Das Ziel dieser Bereinigung ist ein vollständiger, konsistenter und genauer Datensatz. Nach der Datenbereinigung muss der nun standardisierte Datensatz auf Fehler im bisherigen Prozess untersucht werden. Im Anschluss kann der Datensatz gegebenenfalls mit anderen Datensätzen verknüpft werden.
4. Transformation und Anreicherung der Daten
Bei der Transformation wird der Datensatz in ein einheitliches und verwendbares Format überführt. Dabei werden zum Beispiel neue Felder oder Spalten erstellt. Dies inkludiert die Aktualisierung des Formats und der Datenwerte. So soll ein verständliches Ergebnis für alle Business-User geschaffen werden. Die Anreicherung betrifft das Hinzufügen, Optimieren und Verbinden von bereits verbundenen Datensätzen mit weiterer relevanter Information. So werden tiefgehende Einblicke und detailreiche Ergebnisse geschaffen.
5. Speicherung der Daten
Nachdem die Aufbereitung abgeschlossen ist, können die Daten gespeichert oder in eine Drittanbieteranwendung wie zum Beispiel Analise Franci eingespielt werden. Dort kann die weitere Verarbeitung und Analyse dieser durchgeführt werden.
Einsatzgebiete von aufbereiteten Daten
Aufbereitete Daten finden nicht nur in BI-Tool Anwendung, sondern auch in sogenannten Business Process Mining (BPM) Programmen. Während sich BI darauf konzentrieren, Daten auszuwerten, um eine konkrete Aussage über die Performance eines Unternehmens zu treffen, steht beim BPM die Analyse, Überwachung und Optimierung von Geschäftsprozessen im Mittelpunkt. Erkenntnisse werden dabei aus der Analyse von Ereignisdaten gewonnen. BI und PBM gehen dabei von derselben Art von Daten aus und befassen sich mit den gleichen Prozessen, unterscheiden sich jedoch in Umfang und Funktion ihrer Analysen.
Diskurs: Business Process Mining
Wird anhand einer BI-Analyse ersichtlich, dass ein Prozess nicht gut funktioniert, liegt es an Analysten zu entscheiden, warum dies der Fall ist und welche Korrekturmassnahmen getroffen werden. Problematisch ist hierbei, dass BI stets davon ausgeht, dass die Geschäftsprozesse an sich, nicht fehlerhaft sind. Business Process Mining geht hier noch einen Schritt weiter. Es identifiziert Engpässe, die den Grossteil der Zeit beanspruchen und daher die von den BI-Systemen erkannten Verfehlungen von KPIs zur Folge haben. So wird der Interpretationsspielraum reduziert. BPM kann somit unter anderem auch dazu genutzt werden, um Automatisierungspotenziale im Unternehmen zu identifizieren.