Dezember 15, 2021

Um das Potenzial ihrer Daten vollständig ausschöpfen zu können, sollten Unternehmen auf ein modernes Data Stack setzen. Der Begriff „Data Stack“ löst bei Ihnen aber noch Verwirrung aus? Dann möchte ich Ihnen im folgenden Beitrag erklären, was der Begriff eigentlich umfasst und wie Unternehmen einen Mehrwert daraus generieren können. 

Woraus besteht ein Data Stack? 

Ein Data Stack ist ein mehrschichtiges Tool-Portfolio, das hilft, Daten im Unternehmen gezielt zu verarbeiten. Dies umfasst in der Regel folgende Schritte: 

  • Die Daten werden zentral in einer Data-Platform, z.B. einem Data Lake oder Data Warehouse, gespeichert. Dabei ermöglichen vorgefertigte Konnektoren zu allen Datenquellen eine schnelle und einfach skalierbare Datenintegration; API- oder Schemaänderungen können einfach berücksichtigt werden.  
  • Die Rohdaten werden aus den Quellsystemen angebunden. Hier sollte beachtet werden, dass das Datenziel problemlos in der Lage ist, sowohl die Rechenleistung als auch den Speicher auf Knopfdruck zu skalieren, um den heutigen und zukünftigen Datenspeicher- und Analyseanforderungen des Unternehmens gerecht zu werden. Zusätzliche Funktionen wie z. B. eine rollenbasierte Zugriffskontrolle oder Data Policies für Audits sollten im Portfolio von Beginn an berücksichtigt werden.  
  • Die transformierten Daten werden analysiert. Das verwendete Transformations-Tool sollte mit dem Ziel kompatibel sein und über Funktionen verfügen, mit denen sich die Datenherkunft leicht zurückverfolgen lässt, z. B. in einer One-Click-Dokumentation, die die Auswirkungen der Transformation auf Tabellen verdeutlicht. Die Möglichkeit, Transformationen zu orchestrieren und zu planen, ist ebenfalls wichtig. 

Wichtig:  Dies geschieht bei einem modernen Data Stack alles in einer Cloud-Umgebung! Die Umsetzung in der Cloud ist zeitsparend und kosteneffizienter als eine On-Premise-Lösung.  Als neuer Ansatz für die Datenintegration kann so enorm Zeit für die Entwicklung eingespart werden. Außerdem begünstigt die Cloud die Zugänglichkeit für den Endnutzer sowie die Skalierbarkeit, um den wachsenden Datenbedarf im Unternehmen schnell zu decken, ohne die kostspieligen, langwierigen Ausfallzeiten, die mit der Skalierung lokaler Serverinstanzen verbunden sind.  

Was sind die Vorteile eines modernen Data Stacks? 

Der moderne Data Stack spart Zeit, Geld und Mühe. Die niedrigen und weiter sinkenden Kosten für Cloud Computing und Speicherplatz sind ein starker Vorteil gegenüber On-Premise-Lösungen. Unter anderem sparen außerdem Standardkonnektoren beträchtliche Zeit, die ansonsten für die Entwicklung, Erstellung und Wartung von Datenkonnektoren aufgewendet werden muss. Analytics-Experten, Data Scientists und Datenmanager im Unternehmen können sich dementsprechend anderen, wichtigeren Aufgaben wie Data-Science-Projekten widmen. 

Außerdem ist die Einrichtung eines modernen Data Stacks sehr einfach und kann weniger als eine Stunde dauern, da durch den Cloud-Betrieb Komplikationen bei der Konfiguration der Infrastruktur wegfallen.  

Cloud-Migration – wer und wann? 

Vor allem größere oder ältere Unternehmen haben oft noch eine On-Premise-Infrastruktur, die zeitnah in die Cloud migriert werden sollte, um von deren Vorteilen zu profitieren. Startups und kleine Unternehmen setzen bereits häufig auf einen modernen, Cloud-basierten Data Stack, um durch die leichte Skalierbarkeit besser mitwachsen zu können.  

Daten in Unternehmen wachsen bekanntermaßen unaufhaltsam und die Data-Analytics- und anderen Daten-Lösungen in Unternehmen nehmen zu. Alle Mitarbeiter, die Daten nutzen, sollten Visualisierungen, Dashboards und Berichte so selbsterklärend wie möglich erhalten und in ihre tägliche Arbeit integrieren können. 

Der moderne Data Stack sollte außerdem berücksichtigen, wer ihn nutzt und wie die Daten verwaltet werden. Gerade in großen Unternehmen mit mehreren Abteilungen, die sich nicht unbedingt einig sind, was die Daten angeht (und möglicherweise sogar aktiv miteinander konkurrieren), liefert ein moderner Data Stack eine zentralisierte Datenspeicherebene, zusammen mit einem unternehmensweiten Datenkatalog und einem konsistenten Satz von Governance-Richtlinien für eine datenbasierte Entscheidungsfindung. 

Fazit 

Die große Mehrheit der Unternehmen sammelt und analysiert Daten bereits in Hülle und Fülle – häufig jedoch nur für simple Analysen. Ein moderner Data Stack hilft Unternehmen, das volle Potenzial ihrer Daten zu nutzen und alle relevanten Datenquellen einfach in die Datenanalyse zu integrieren und für darauf aufbauende Datenlösungen gezielt zur Verfügung zu stellen.  

Sie interessieren sich für das Thema „Data Stack“ in Ihrem Unternehmen? Kontaktieren Sie uns! 


AUTOR

Philipp Ziemer

Thinking for years about data and generating business value from data, I frequently encounter the problem of how to deliver data for analytics and data science. Many of my large enterprise customers face the challenge not just in landing their data, but making that data available in a feasible way to the actual business-user. In the sense of data democratization I care passionately about delivering all data to the people in a sustainable way.