DR. SEBASTIAN ROSE UND DR. GERO PRESSER
Vorstellung
Sebastian ist seit 2016 bei der MYTOYS Group (member of the otto group) im Bereich Analytics und Data Science tätig. Seine Aufgabenschwerpunkte bestehen in der Entwicklung eines adaptiven und personalisierten Produktlistenscores, eines dynamischen Marketingattributionsmodels und der Konzeption und Umsetzung von Data Science Anforderungen an eine IT –Architektur. Zuvor forschte Sebastian 5 Jahre an Humboldt-Universität zu Berlin zu neurowissenschaftlichen Grundlagen von Sprache und des Einflusses von „fake news“ auf die Wahrnehmung der betroffenen Personen.
Gero ist Mitgründer und Geschäftsführer bei der QuinScape GmbH, einem Dortmunder IT-Dienstleistungsunternehmen mit 170 Mitarbeitern und Fokus auf Data & Analytics. Er organisiert die Meetup-Gruppe „Business Intelligence & Analytics Dortmund“ mit über 1.000 Mitgliedern und ist Vorsitzender des TDWI Roundtable Ruhrgebiet. Zuvor hat er an der TU Dortmund Informatik mit dem Nebenfach Betriebswirtschaftslehre studiert, 1999 mit Auszeichnung abgeschlossen und im Anschluss über die ressourcenschonende Entscheidungsfindung autonomer Agenten promoviert. Er ist leidenschaftlicher Skifahrer und glücklicher Familienvater mit zwei Söhnen und einem Hund.
Persönliche Worte über Beweggründe, Motivation und Themeneinleitung
Durch die Einführung eines Data Lakes öffnet sich für Unternehmen die Möglichkeit, nahezu unbegrenzte Mengen an strukturierten und unstrukturierten Daten aus unzähligen Quellen zu speichern ohne Rücksicht darauf, ob und wie diese Daten in Zukunft genutzt werden können. Durch seine Beschaffenheit fördert ein Data Lake das Experimentieren und die Datenexploration durch einen breiteren Kreis an (Nicht-)Analysten und (Citizen) Data Scientists. Doch wie geht man mit den organisatorischen und personellen Herausforderungen bei der Einführung eines Data Lakes um, nachdem die strategische Entscheidung gefallen und ein Business Sponsor gefunden wurde? Zunächst müssen sich die an der Implementierung beteiligten Parteien auf Anwendungsfälle verständigen, die klar und deutlich den Bedarf und die Vorteilhaftigkeit eines Data Lakes aufzeigen. Anhand dieser Anwendungsfälle kann dann über die hierfür relevante Architektur gesprochen werden (z.B. key value vs. spaltenorientierte Datenbanken). Diese Punkte, Identifikation von spezifischen Anwendungsfälle und die daraus resultierende Anforderung an die Architektur, sind nicht nur Voraussetzung für die nächsten konkreten Schritte, sondern dienen auch dazu, für die beteiligten Mitarbeiter ein gemeinsames Verständnis aus- und aufzubauen. Wenn dies gelungen ist, kann im nächsten Schritt darüber diskutiert werden inwieweit eine Data Lake Technologie hausintern, unter Einsatz von vereinzelten Tools oder durch Erwerb einer Komplettlösung umgesetzt werden kann oder soll. Für Letzteres ist es im nächsten Schritt sinnvoll, für die Evaluierung externer Anbieter ein Proof of Concept zu erstellen, welches abgeleitet von den Anwendungsfällen Eigenschaften definiert, die es nicht oder unbedingt haben muss. Neben diesen organisatorischen Fragestellungen stellt die Einführung einer Data Lake Lösung neue Kompetenzanforderungen an Mitarbeiter, die in Abhängigkeit der Rolle identifiziert und entsprechend erweitert werden sollten.
Aber bilde dir deine eigene Meinung – Hier ein paar spannende Links und Empfehlungen:
Eine allgemeine Einführung zu Data Lakes (english)
Eine Bestandsaufnahme auf dem TDWI Blog
A smarter way to jump into data lakes
Meine Fragen an die Community
- Welche Erfahrungen habt ihr bei der Einführung eines Data Lakes gemacht? Was waren eure größten Herausforderungen?
- Wie hat sich eure Arbeit und die Anforderungen an euer Jobprofil dadurch verändert?
- Welche Frameworks/Technologien/Infrastruktur habt ihr verwendet?
- Wie habt ihr die Governance des Data Lakes umgesetzt?
Was meint ihr? Beteiligt euch jetzt an der Diskussion bei LinkedIn oder Slack.
Meine Highlights
Sebastian: „Mich begeistert an meiner Arbeit die schiere Interdisziplinarität in Data Science und Analytics und die Möglichkeit von anderen daten-begeisterten Menschen zu lernen! Von den Young Guns habe ich über einen Artikel im BI Spektrum erfahren, welches bei uns in der Firma manchmal herumliegt. Als technologie-affiner IT-Quereinsteiger freue ich mich auf den Austausch innerhalb des TDWI Vereins und natürlich innerhalb der Young Guns. Let’s do it :)!“
Schreibe einen Kommentar