Entwicklung und Evaluation eines Verfahrens zur Datenspeicherung in Data-Warehouse-Systemen auf Basis des Information Lifecycle Managements
Sebastian Büsch
In Data-Warehouse-Systemen (DWS) stehen verschiedene Möglichkeiten zur Verfügung, um Speicherkosten zu senken (wie Nearline-Storage oder Archivierung) oder Datenanalysezeiten zu verringern. Bisher fehlte allerdings ein geeignetes Verfahren, um zu bestimmen, welche Mittel für welche Zwecke und welche Daten eingesetzt werden sollten. Der Bereich der Klassifizierung von DWS-Daten unter der Berücksichtigung von Anwender- und Administratorenwissen, der Leistungsfähigkeit des Systems und auch des Informationslebenszyklus stellt einen offenen und notwendigen Forschungsbereich dar, der mit diesem Buch geschlossen wird. Diese Klassifizierung kann anhand des Lebenszyklus von Daten in Data-Warehouse-Systemen erfolgen. Die Daten durchlaufen verschiedene Phasen von ihrer Erstellung über Nutzung bis hin zur Archivierung und werden darin unterschiedlich häufig verwendet. Nur ein geringer und im Zeitverlauf abnehmender Anteil an Daten eines DWS wird aktiv verwendet. Um eine wirtschaftliche Datenspeicherung zu erreichen, müssen zu jeder Lebenszyklusphase passende Maßnahmen ergriffen werden. Statt einer einheitlichen, phasen-unspezifischen Verwaltung aller DWS-Daten kann so eine lebenszyklusabhängige Speicherung erreicht werden.