Bewertung von Datenpersistenz in Business-Data-Warehouse-Systemen mithilfe multikriterieller Entscheidungsmodelle
Thorsten Winsemann
Data-Warehouse-Systeme sind trotz – oder gerade wegen – der „In-Memory-Diskussion“ ein Thema aktueller Forschung, insbesondere aufgrund ihrer großen Datenmengen. Produktiv betriebene Data-Warehouse-Systeme für betriebswirtschaftliche Anwendungen beinhalten Datenbestände in Terabyte-Größe. Aufbau und Pflege persistenter Datenbestände in solchen Systemen erfordern hohen Aufwand an Zeit und Ressourcen – vom System und von den zuständigen Personen. Es ergeben sich Konfliktpotentiale aus den Anforderungen der Anwendung einer- und der Schaffung der hierfür notwendigen Voraussetzungen andererseits. Die Anforderung nach schneller und flexibler Analyse wird zum Beispiel durch den Aufbau zusätzlicher Datenbestände erfüllt. Hierfür sind jedoch oftmals aufwendige Prozesse der Datenbearbeitung und -bereitstellung notwendig, was wiederum den Aufwand für den Systembetrieb erhöht. Es schließt sich die untersuchte Fragestellung an: Wie kann eine fundierte Entscheidung darüber getroffen werden, welche Daten im Business-Data-Warehouse-System noch beziehungsweise nicht mehr benötigt werden? Diese Bewertung stellt aufgrund der vielfältigen Einflussgrößen ein komplexes Problem dar. Problematisch hierbei ist bereits die Entscheidung, ob Daten noch benötigt werden, was zunächst vom Grund der Datenspeicherung abhängt. Mögliche Persistenzgründe erstrecken sich auf technische, konzeptionelle, betriebswirtschaftliche und gesetzliche Bereiche und werden definiert, detailliert beschrieben und klassifiziert. Die Kategorisierung der Gründe nach ihrer Notwendigkeit ermöglicht die Entwicklung eines Entscheidungsprozesses als ein erstes Bewertungsverfahren. Für viele Datenbestände im Data-Warehouse ist eine fundierte Entscheidung dennoch schwer zu treffen, da zusätzlich detaillierte Informationen notwendig sind und somit ermittelt werden müssen. Für die Sammlung dieser Detailinformationen werden domänenabhängige Kennzahlensysteme definiert. Der hier erstellte Bewertungsansatz ist breiter aufgestellt als bisherige Ansätze und umfasst neben technischen auch betriebswirtschaftliche Kennzahlen. Aufgrund der mehrfachen Zielsetzung des Entscheidungsproblems werden Verfahren der multikriteriellen Entscheidungsanalyse in das Bewertungsmodell integriert und es somit zusätzlich ermöglicht, Entscheiderpräferenzen zu berücksichtigen. Über das entwickelte Bewertungsmodell werden schließlich die Gesamtnutzen als Grundlage für die Entscheidung über Beibehaltung oder Löschung der alternativen Datenpersistenzen berechnet. Dabei sind alle benötigten Informationen einfach zu ermitteln, das Bewertungsmodell ist übersichtlich und flexibel und die getroffenen Entscheidungen sind objektiv und leicht nachvollziehbar. Hierdurch wird ein vielseitiger, praxisbezogener Einsatz ermöglicht, was abschließend in drei Fallstudien praxisnah dargestellt wird.