TDWI Blog

Hashing

Im Datenbereich stolpert man immer öfter über den Begriff „Hashing“. Im Data Vault 2.0 wird gehasht. Passwörter werden zusammen mit einem sogenannten Salt gehasht und als Hashwert in der Datenbank gespeichert. Es gibt Hash Joins.. Aber was genau ist Hashing? Hashing ist der Prozess, bei dem aus einer Eingabe beliebiger

Weiterlesen

DWH-Entwicklung im Umbruch

Immer mal wieder werde ich gefragt: Was muss ein guter Data Warehouse (DWH) Entwickler oder eine gute Entwicklerin können? Als ich vor über zehn Jahren in die DWH-Entwicklung einstieg, stellte ich die gleiche Frage. Die Antwort damals lautete: Lies mal die Bücher von Kimball (Stichwort „Dimensionale Modellierung“) und lerne SQL (SQL impliziert dabei auch Grundkenntnisse der relationalen Datenbanktheorie). Das sind beides ziemlich universelle Grundlagen, die auch heute noch zum Grundwortschatz eines jeden DWH-Entwicklers gehören sollten. In diesem Beitrag gehe ich der Frage nach, was im Jahr 2020 so alles von DWH-Entwicklern verlangt wird.

Weiterlesen

Schneller, professioneller, systematischer – Wie entwickelt man heute einen Datalake/ein DWH/eine Machine-Learning-Plattform?

Die globale Konkurrenz zwingt Unternehmen heutzutage zu einer immer größeren Geschwindigkeit bei der Umsetzung von Projekten. Das gilt auch für Projekte, bei denen es um die Integration von Daten und den Aufbau von Datalakes, Data Warehouses oder Plattformen für Machine Learning geht. Thema des Abends war daher die Betrachtung von Möglichkeiten zur Steigerung der Produktivität von solchen Projekten durch einen generischen Ansatz: Man leistet gewisse Vorarbeiten, um anschließend wesentlich schneller und mit höherer Qualität konkrete Anwendungsfälle bzw. Projekte umsetzen zu können.

Weiterlesen