SAbineSDie Highlights dieses Artikels:
- Business Intelligence (BI) beinhaltet Data Mining, Visualisierung und mündliche „Was wäre wenn?“ Analysen.
- Predictive Analytics betrachtet Algorithmen in Form von statistischen Grundsätzen und berechnet diese computerunterstützt.
- Prescriptive Analytics greift die „Was wäre wenn?“ Analyse und die Simulation auf und versucht, durch Visualisierung der Daten sowie parametrisierten Änderung, die Zukunft vorherzusagen.
- Data Mining und Visualisierung als Schnittmenge der 3 Verfahren
Advanced Analytics besteht aus den drei Bereichen Business Intelligence, Predictive Analytics und Prescriptive Analytics. Diese Domänen überschneiden sich in verschiedenen Disziplinen, wie z.B. dem Data Mining mit all seinen Unterschritten sowie in der Visualisierung.
Folgendes Schaubild soll eine grobe Einteilung geben.
Während sich bei Business Intelligence (BI) alles um Data Mining, Visualisierung und mündlichen „Was wäre wenn?“ Analysen dreht, werden bei Predictive Analytics Algorithmen in Form von statistischen Grundsätzen zusätzlich betrachtet und computerunterstützt berechnet. Prescriptive Analytics greift die „Was wäre wenn?“ Analyse und die Simulation auf und versucht, durch Visualisierung der Daten sowie parametrisierten Änderung, die Zukunft vorherzusagen und nach der eigenen Unternehmensvision und -strategie zu optimieren.
Data Mining
Die technische Entwicklung fördert verschiedenste Ressorts. Datenbanksysteme entwickeln sich ständig weiter und können immer mehr Kapazitäten an Datenmenge effizient speichern. Es werden neue Algorithmen entdeckt oder aufgesetzt, die mit vorherigen technischen Mitteln nicht umgesetzt werden konnten. Data Mining (DM) wird als Prozess angesehen, der Rückschlüsse und Muster aus großen Datenmengen generieren soll. Dieser Vorgang beinhaltet Datenaufbereitung, Datenintegration, Datenselektion, Datentransformation, Mustererkennung und Validierung, sowie die Präsentation der Erkenntnisse. Dabei wird das Data Mining von vielen verschiedenen Bereichen beeinflusst, wie die folgende Abbildung zeigt.
Der Prozess des Data Minings selbst lässt sich in einen übergeordneten Prozess, der Bestandteile dieser Schritte schon abdeckt, einbauen.
Der Datenfluss dieses Prozesses beginnt bei den erworbenen Daten aus einer oder mehreren Datenquellen. Diese werden dann in einem Data Warehouse konsolidiert und anschließend mit DM Funktionen prozessiert. Daraus geht ein erkanntes Muster hervor, auf Basis dessen der Nutzer Wissen generieren kann. Die Charakteristiken von DM kommen im Datenfluss an allen Stellen zum Tragen. Im ersten Schritt auf Datenbankebene werden die Daten bereinigt und integriert. Anschließend werden die relevanten Daten selektiert und in eine Zielstruktur transformiert, welche für das DM von Bedeutung ist. Aus dem DM ergibt sich ein Muster, welches evaluiert und dem Endnutzer präsentiert werden muss. Dieser kann das Muster als Grundlage für Wissen verwenden oder bei fehlgeschlagener Evaluierung verwerfen. Im Prozess kann jeweils bilateral sowohl auf den Folgeschritt als auch auf den vorherigen Schritt zur Verbesserung gegangen werden. Für Unternehmen ist es wichtig ein konsolidiertes Datenmanagement trotz teilweise verteilter Systemlandschaften hinzubekommen. So können Daten effizient verknüpft und ggf. Muster erkannt werden. Beispielsweise können die ERP Daten mit den Daten aus einem firmeneigenen Onlineshop abgelegt werden, um zu prüfen, wie viele Kunden tatsächlich einen Kauf abschließen und vice versa wann der Kunde den Kauf abbricht. Eine Kombination dieser heterogenen Datenquellen hat für die weitere Erkundung nach Mustern großes Potential.
Im Hinblick auf Predictive Analytics lässt sich Data Mining in verschiedene Typen von Funktionen aufteilen, wie bspw. Regression, Clustering oder Time Series Forecasting. Das Endprodukt dieser Funktionalitäten ist ein Muster je nach Funktion.
Visualisierung
Eine weitere Gemeinsamkeit von Business Analytics ist die Visualisierung der Ergebnisse. Um aus den Mustern nach der Verarbeitung im Data Mining Wissen zu generieren, gilt es diese auch im richtigen Format zu visualisieren und lesen zu können.
Durch die stetig größer werdende Bedeutung der “Big Data” und den unzähligen täglich erzeugten Datenreihen, wird die Datenvisualisierung immer mehr zu einem elementaren Tool. Mit Hilfe von visuellen Elementen wie Graphen, Diagramme und Karten lassen sich bereits schnell Ausreißer, Trends und Muster der Daten erkennen. Die Daten werden dabei abstrahiert und in einer komprimierten Form visuell dargestellt. Dabei kann die Datenvisualisierung eine univariate (eine abhängige Variable) oder multivariate (zwei oder mehr abhängige Variablen) Darstellung ermöglichen.
Beispiele für solche sind in folgender Grafik zu finden:
Meistens im Fokus stehen die Beziehung (Relationship) und Verteilung (Distribution) der Daten.
Beispielsweise kann zur Entscheidungsfindung einer Automarke beim Kauf eines Gebrauchtwagens mittels einer Umfrage im Freundeskreis die Verteilung in einem Histogramm abgebildet werden.
Sofort erkennbar ist, dass die meisten ein Auto der Marke B fahren, da hier die Verteilung am größten ist. Die Entscheidung hängt hier nur von der Variablen „Automarke“ und der Verteilung solcher ab.
Haben Sie sich für eine Marke entschieden kommt es nun auf mehrere Faktoren an, die den finalen Kauf bestimmen. Vereinfacht betrachten wir nur den Preis in Abhängigkeit von maximal fünf Jahre alten Gebrauchtfahrzeugen.
Augenscheinlich lässt sich bereits erkennen, in welcher Beziehung der Preis mit dem Alter des Fahrzeuges steht. Je älter das Fahrzeug ist, desto niedriger ist der Preis. Neben den statistischen Fakten, die heute den Preis wiedergeben, muss ferner auch das Risiko eines älteren Fahrzeuges abgewogen werden mit der Frage „Was wäre, wenn“.
Wir beraten Sie, wie das Business Performance Management mit vorhersagenden Analysemodellen erweitert werden kann.