TDWI Blog

Data Lake – eine Bestandsaufnahme in drei Akten: Organisation und Governance (3)

Die Diskussion um das Thema Data Lake ist oft sehr technologiegetrieben. Dies zeigt schon alleine die schiere Anzahl an Implementierungsansätzen und die endlose Produktlandschaft. Sobald ein Data Lake das Proof-Of-Concept-Stadium verlässt und erwachsen wird, kommt allerdings oft die Einsicht, dass zu einer Integration in eine Enterprise-Landschaft mehr als nur ein gutes technisches Fundament gehört. Insbesondere organisatorische, rechtliche und regulatorische Faktoren werden oft sträflich vernachlässigt, was sich bei einer Eingliederung in existierende Strukturen sowie im produktiven Alltagsbetrieb schnell rächt.

Weiterlesen

Umsetzung eines Data Lakes | TDWI Young Guns Beitrag

Durch die Einführung eines Data Lakes öffnet sich für Unternehmen die Möglichkeit, nahezu unbegrenzte Mengen an strukturierten und unstrukturierten Daten aus unzähligen Quellen zu speichern ohne Rücksicht darauf, ob und wie diese Daten in Zukunft genutzt werden können. Durch seine Beschaffenheit fördert ein Data Lake das Experimentieren und die Datenexploration durch einen breiteren Kreis an (Nicht-)Analysten und (Citizen) Data Scientists. Doch wie geht man mit den organisatorischen und personellen Herausforderungen bei der Einführung eines Data Lakes um, nachdem die strategische Entscheidung gefallen und ein Business Sponsor gefunden wurde?

Weiterlesen

Data Lake – eine Bestandsaufnahme in drei Akten: Architektonische Fragestellungen (2)

Nachdem der letzte Beitrag dieser Serie das grundsätzliche Begriffsverständnis sowie die Motivation für den Aufbau eines Data Lakes thematisierte, betrachtet dieser Artikel nun Fragestellungen hinsichtlich der Architektur und des Aufbaus eines Data Lakes. Entsprechend den unterschiedlichen Beweggründen für die Etablierung eines Data Lakes, gibt es auch verschiedenste Ansätze für die Strukturierung einer entsprechenden Systemlandschaft, welche die folgenden Abschnitte anhand ausgewählter architektonischer Fragestellungen kurz verdeutlichen.

Weiterlesen

Data Lake – eine Bestandsaufnahme in drei Akten: Begriff und Motivation (1)

Der Begriff Data Lake wird seit einigen Jahren heiß diskutiert. Bis heute gibt es kein einheitliches Verständnis und die Erwartungen der Anwender liegen verteilt zwischen universellem Heilsbringer und großer Festplatte. Diese Serie betrachtet das Konzept Data Lake auf Basis aktueller Entwicklungen sowie Erfahrungen in der Praxis und versucht dabei das breite Spektrum an Begrifflichkeiten und Ansätzen einzuordnen. Dieser erste Artikel der Serie betrachtet dabei initial den Begriff des Data Lakes und die zugrundeliegende Motivation.

Weiterlesen

Schneller, professioneller, systematischer – Wie entwickelt man heute einen Datalake/ein DWH/eine Machine-Learning-Plattform?

Die globale Konkurrenz zwingt Unternehmen heutzutage zu einer immer größeren Geschwindigkeit bei der Umsetzung von Projekten. Das gilt auch für Projekte, bei denen es um die Integration von Daten und den Aufbau von Datalakes, Data Warehouses oder Plattformen für Machine Learning geht. Thema des Abends war daher die Betrachtung von Möglichkeiten zur Steigerung der Produktivität von solchen Projekten durch einen generischen Ansatz: Man leistet gewisse Vorarbeiten, um anschließend wesentlich schneller und mit höherer Qualität konkrete Anwendungsfälle bzw. Projekte umsetzen zu können.

Weiterlesen