März 10, 2020

Viele Unternehmen verstehen zunehmend, welche große Bedeutung Daten sowie deren Visualisierung und Nutzung für die Entscheidungsfindung haben. Doch der erste Schritt in Richtung dieser datengetriebenen Entscheidungen, die Auf- und Vorbereitung der Daten für den erfolgreichen Einsatz, bereitet vielen Unternehmen noch Bauchschmerzen. Denn Arbeitsaufwände im Bereich Data Warehouse sind häufig mit viel Zeit verbunden.

Wozu nutzt man Data Warehousing?

Grundsätzlich bietet Data Warehousing die Möglichkeit, Daten zu bewahren, eine Single Source of Truth zu schaffen, die Produktivität der Endanwender zu steigern, die Abhängigkeit von Key-Usern zu reduzieren und flexibel auf ändernde Unternehmensanforderungen zu reagieren. Die Speicherung, Pflege und Erweiterung aller Unternehmensdaten sind dabei eine zeitfressende Angelegenheit.

Im Detail bedeutet dies, dass bei dem Extract, Transform, Load (ETL) Prozess Daten aus mehreren Datenquellen (in unterschiedlichen Formaten) in einer Zieldatenbank zusammengefügt werden. Bei der Extraktion werden die relevanten Daten aus den verschiedenen Quellen extrahiert, bei der Transformation in das gewünschte Schema und Format gebracht und danach in die Zieldatenbank geladen. Bei der Verwendung eines Data Warehouses, in dem Big Data aus mehreren operationalen Datenbanken zusammengeführt und gespeichert wird, kann dieser Prozess sehr langwierig sein – ein großer Nachteil für die Aktualität der Daten, die jedoch nur durch Regelmäßigkeit des Prozesses erreicht wird. Diese Informationsintegration ermöglicht, auf die Daten vollständig, zentral und konsistent zuzugreifen.

Welche Vorteile hat Data Warehouse Automation?

Eine Automatisierung schafft hier den Vorteil, dass der ETL Prozess nicht immer wieder manuell durchgeführt werden muss. Zwischen 70 und 80 Prozent der Prozesse können hier automatisiert werden. Datenbereinigungs- und Transformationsregeln können dabei automatisch angewandt werden. So erreichen Unternehmen ohne viel Aufwand ein sogenanntes Real-Time-Data-Warehousing, bei dem sich dank Automatisierung der zeitliche Aufwand stark reduzieren lässt (um etwa 60 bis 70 Prozent).

Data Warehouse Automation basiert auf Entwurfsmustern und Prozessen, mit deren Hilfe die Planungs-, Modellierungs- und Integrationsschritte über den gesamten Data Warehouse Lebenszyklus automatisiert werden können. Es bietet eine effiziente Alternative zum traditionellen Data Warehouse Design, indem es zeitaufwändige Aufgaben wie das Erzeugen und Bereitstellen von ETL-Codes auf einem Datenbankserver reduziert und den Endnutzern eine bessere Kontrolle über die Daten bietet. Auf diese Weise wird den Verantwortlichen Zeit geschaffen, sich auf andere Aufgaben oder Ausnahmenfälle zu konzentrieren, wie zum Beispiel die Weiterentwicklung von Prozessen. Hinzukommt eine durchgehende Qualität im ETL Prozess, die durch die automatische Eingabe entsteht. Konsistenz und Kontinuität werden unter anderem durch durchgehend verwendete Codes oder Namen erzielt.

Mit Data Warehouse Automation Tools können Unternehmen dann zum Beispiel Business Intelligence Projekte innerhalb von Stunden im Vergleich zu Monaten und zu einem Bruchteil der Kosten durchführen. Außerdem ist ein richtig aufgesetztes Datenmanagement die Grundlage für intelligente Anwendungen wie Machine Learning Projekte und dieses Fundament sollte stabil sein, um erfolgreich zu sein.

Zusammengefasst können Sie mit Data Warehouse Automation:

  • Ihre gesamte Data-Pipeline beschleunigen,
  • Die Erfassung, Verwaltung, Integration und das Streaming Ihrer Daten automatisieren,
  • Daten-Transaktionswege in kürzester Zeit definieren,
  • Datenflüsse vollautomatisch bestimmen,
  • Datenmodelle zielgerichtet aufsetzen und
  • Data Lakes einfach in Data Warehouses transformieren.

Je schneller Sie Ihre Daten analysieren können, desto früher entdecken Sie wichtige unternehmensrelevante Informationen.

Fazit

Der Einsatz von Data Warehousing erleichtert die Verwendung von Daten für die Geschäftsberichterstattung. Aber die traditionellen Ansätze zur Erfassung und Verwaltung riesiger Datenmengen, wie sie heute in den meisten Unternehmen existieren, durch manuelle ETL-Codierung sind nicht mehr effektiv. Im heutigen wettbewerbsintensiven Unternehmensmarkt sind jedoch Geschäftsagilität und Time-to-Market entscheidend. Für solche Anforderungen eignen sich Data Warehouse Automation Tools, da sie den manuellen Aufwand für den Aufbau und die Implementierung von Data Warehouses und die Zusammenführung von Daten für das Business Reporting minimieren. Darauf basierend können dann weitere Daten-Projekte wie Business Intelligence Anwendungen oder KI-Technologien problemlos ansetzen.

Wie lösen Sie in Ihrem Unternehmen Data Warehouse Prozesse?


AUTOR

Jens Siebertz

Jens Siebertz ist Senior Vice President bei INFORM DataLab.