TDWI Blog

Ist das “Science” in Data Science noch zu retten?

Kritiker bezeichnen Data Scientists gerne mal als “Statistiker mit einem Mac”. Die Anforderungen in Jobangeboten für “Data Scientists” sind jedoch oft sehr umfangreich, von Technologien für die parallele Verarbeitung großer Datenmengen bis hin zu der Erstellung von Dashboards. In vielen Jobangeboten wird Erfahrung mit wissenschaftlichen Methoden verlangt, idealerweise sogar verbunden mit einem Doktortitel. Dabei könnte man meinen, dass dies aktuell nicht mehr nötig ist. Die Automatisierung schafft Raum, um wissenschaftliche Methoden auf eine grundsätzliche Fragestellung anzuwenden: Wie kann man mit Daten einen Mehrwert für das Unternehmen erzielen?

Weiterlesen

TDWI Young Guns Mailing Juni 2020 | Transparency in Machine Learning

Transparenz von Machine Learning Modellen wird ein immer wichtigeres Thema, denn gerade „Black-Box-Modelle“ erfreuen sich großer Beliebtheit ob ihrer guten Vorhersagegüte. Black-Box-Modelle sind, wie der Name es schon sagt, Modelle, die einem Algorithmus folgen, dessen Entscheidungen allerdings nicht direkt nachvollziehbar sind. Damit die Vorhersagen aber möglichst transparent sind, also z.B. einzelne Gruppen nicht ungleich behandelt werden, oder der Einfluss einzelner Variablen auf das Ergebnis gemessen werden soll, ist es wichtig, diese Modelle und vor allem die Entscheidungen der Modelle auch als Mensch nachvollziehen zu können.

Weiterlesen

DWH-Entwicklung im Umbruch

Immer mal wieder werde ich gefragt: Was muss ein guter Data Warehouse (DWH) Entwickler oder eine gute Entwicklerin können? Als ich vor über zehn Jahren in die DWH-Entwicklung einstieg, stellte ich die gleiche Frage. Die Antwort damals lautete: Lies mal die Bücher von Kimball (Stichwort „Dimensionale Modellierung“) und lerne SQL (SQL impliziert dabei auch Grundkenntnisse der relationalen Datenbanktheorie). Das sind beides ziemlich universelle Grundlagen, die auch heute noch zum Grundwortschatz eines jeden DWH-Entwicklers gehören sollten. In diesem Beitrag gehe ich der Frage nach, was im Jahr 2020 so alles von DWH-Entwicklern verlangt wird.

Weiterlesen