TDWI Blog

Hashing

Im Datenbereich stolpert man immer öfter über den Begriff „Hashing“. Im Data Vault 2.0 wird gehasht. Passwörter werden zusammen mit einem sogenannten Salt gehasht und als Hashwert in der Datenbank gespeichert. Es gibt Hash Joins.. Aber was genau ist Hashing? Hashing ist der Prozess, bei dem aus einer Eingabe beliebiger

Weiterlesen

Data Lake – eine Bestandsaufnahme in drei Akten: Organisation und Governance (3)

Die Diskussion um das Thema Data Lake ist oft sehr technologiegetrieben. Dies zeigt schon alleine die schiere Anzahl an Implementierungsansätzen und die endlose Produktlandschaft. Sobald ein Data Lake das Proof-Of-Concept-Stadium verlässt und erwachsen wird, kommt allerdings oft die Einsicht, dass zu einer Integration in eine Enterprise-Landschaft mehr als nur ein gutes technisches Fundament gehört. Insbesondere organisatorische, rechtliche und regulatorische Faktoren werden oft sträflich vernachlässigt, was sich bei einer Eingliederung in existierende Strukturen sowie im produktiven Alltagsbetrieb schnell rächt.

Weiterlesen

Data Lake – eine Bestandsaufnahme in drei Akten: Architektonische Fragestellungen (2)

Nachdem der letzte Beitrag dieser Serie das grundsätzliche Begriffsverständnis sowie die Motivation für den Aufbau eines Data Lakes thematisierte, betrachtet dieser Artikel nun Fragestellungen hinsichtlich der Architektur und des Aufbaus eines Data Lakes. Entsprechend den unterschiedlichen Beweggründen für die Etablierung eines Data Lakes, gibt es auch verschiedenste Ansätze für die Strukturierung einer entsprechenden Systemlandschaft, welche die folgenden Abschnitte anhand ausgewählter architektonischer Fragestellungen kurz verdeutlichen.

Weiterlesen

Data Lake – eine Bestandsaufnahme in drei Akten: Begriff und Motivation (1)

Der Begriff Data Lake wird seit einigen Jahren heiß diskutiert. Bis heute gibt es kein einheitliches Verständnis und die Erwartungen der Anwender liegen verteilt zwischen universellem Heilsbringer und großer Festplatte. Diese Serie betrachtet das Konzept Data Lake auf Basis aktueller Entwicklungen sowie Erfahrungen in der Praxis und versucht dabei das breite Spektrum an Begrifflichkeiten und Ansätzen einzuordnen. Dieser erste Artikel der Serie betrachtet dabei initial den Begriff des Data Lakes und die zugrundeliegende Motivation.

Weiterlesen