TDWI Blog

Der Start in die weite Welt des Datendschungels

Dichter Dschungel, unwegsames Gelände

In unregelmäßigen Abständen stellen Mitglieder der TDWI Young Guns ihre Themen und Fragestellungen vor. In diesem Monat nimmt uns Angelika Bogacka mit auf ihre Reise in den Datendschungel. Unterstützt hat sie Leif Hitzschke.

Die beiden freuen sich auf eure Kommentare. Beteiligt euch mit an der Diskussion. Oder bringt euch bei LinkedIn ein. Wir freuen uns über über weitere Follower! Möchtet ihr auch einen Artikel für unser Mailing verfassen? Habt ihr ein spannendes Thema, welches ihr teilen wollt? Tretet mit uns in Kontakt. Wir freuen uns von euch zu hören.

Über Angelika und Leif

Angelika ist als Duale Studentin seit einigen Monaten bei den Young Guns. Sie studiert Software- und Systemtechnik in der Vertiefung Softwaretechnik an der Fachhochschule Dortmund und arbeitet seit 2017 bei der adesso SE. Nachdem sie ihre Ausbildung zur Fachinformatikerin abschloss, widmete sie sich beruflich der Data & Analytics-Welt im Unternehmen und ist seitdem als Business Engineer in unterschiedlichen Kundenprojekten unterwegs. In ihrer Rolle als Business Engineer fokussiert sie sich auf die technologieagnostischen Data & Analytics-Themen und stellt dabei das Bindeglied zwischen den Fachbereichen und der IT dar.

Leif ist Leiter Analytik bei der comdirect – eine Marke der Commerzbank AG in Hamburg. Er hat in seiner bisherigen Laufbahn ein breites Spektrum an Erfahrungen in den Bereichen Datenmodellierung, ETL, Visualisierung und Analytics gesammelt. Sein Fokus liegt auf der pragmatischen Definition und Umsetzung von BI-Architekturen und -Organisationsformen. Er macht sich besonders stark für den Austausch von Anwendern in den unterschiedlichen Bereichen der Business Intelligence. Über seine Tätigkeit und Erfahrungen berichtet er auf verschiedenen Veranstaltungen.

Mein Weg durch den Datendschungel

Mit diesem Blog-Artikel reihe ich mich in eine bestehende Sammlung von Beiträgen rund um Business Intelligence, Analytics, Data Science und AI ein. Bei der Auswahl eines konkreten Themas stand ich zuerst vor einigen Fragezeichen. Beginnend mit der Frage, ob ich über einen neu aufkommenden Trend, eine heiß diskutierte Studie oder doch lieber über ein tiefergehendes fachliches Thema in der Welt der Daten berichte.

Die Welt der Daten hat ein vielfältiges und breites Spektrum, wie es vielleicht sonst kein Bereich der IT bietet. Daten sind das neue Öl, heißt es in vielen Fachzeitschriften – worüber könnte man also nicht besser schreiben als über Daten und die damit verbundenen Methoden und Technologien? Ich stimme in allen Punkten zu: Die Welt der Daten ist riesig und erscheint kaum zu bändigen. Angekommen im 21. Jahrhundert fühlt es sich schon fast so an, als wenn wir uns in rasender Geschwindigkeit in dieser Welt überschlagen, um bloß kein neues Machine-Learning-Modell oder keine neue Big-Data-Analyse-Methode zu verpassen.

Meine ursprüngliche Frage nach der Themenwahl für diesen Blog kann ich daher wie folgt beantworten: Ich bin nun über ein halbes Jahr beruflich in der Datenwelt unterwegs und noch auf der Suche nach meinem persönlichen Steckenpferd. Ist es die Entwicklung einer Datenstrategie für das Unternehmen eines Kunden, die Datenaufbereitung oder doch die Datenvisualisierung? Diese Welt hat so vieles zu bieten und man kann seine Zeit nicht all diesen spannenden Themen gleichzeitig widmen. Daher möchte ich mit diesem Beitrag über meinen Einstieg in die Welt der Daten berichten.

Als Softwareentwicklerin hat man nicht viel mit den Bereichen Business Intelligence, AI, Data Science und Co. zu tun. Jedenfalls nicht in den Projekten, in denen ich zu Beginn meiner beruflichen Laufbahn tätig war. Das höchste der Gefühle äußerte sich in der Anbindung einer Datenbank an die Anwendung. Zusätzlich hatte man sich im Vorhinein ein sinnvolles Datenmodell überlegt, welches sich dann über kurze Annotationen an den entsprechenden Attributen umsetzen ließ. Damit war das Thema Daten auch schon abgehakt. Der Großteil meiner Zeit floss also in die Implementierung der Logik und der Oberfläche (Disclaimer: Das ist an dieser Stelle sehr grob umfasst und beinhaltet selbstverständlich viele weitere Tätigkeiten, auf welche hier nicht der Fokus gelegt werden soll).

Eines Tages kündigte sich dann im Unternehmen die Gründung einer neuen Line of Business (LoB) an. Es war kein geringeres Fachgebiet als Data & Analytics. Ich glaube zwar nicht an die Liebe auf den ersten Blick, aber hier hat es keinen zweiten Blick gebraucht. Ohne jemals etwas mit diesem Bereich zu tun gehabt zu haben, ließ mich das Interesse an dieser LoB nicht mehr los. In den Stellenausschreibungen hieß es: „Wir haben Bock auf Daten! Du auch?“ –  Du kannst dir die Antwort mit Sicherheit schon denken.

Dichter Dschungel, unwegsames Geländer.

Nachdem mir der Wechsel zur LoB Data & Analytics ohne tiefergehende Vorerfahrungen gelungen war, verlief alles rasend schnell. Noch bevor ich mich im Detail mit dem Portfolio auseinandersetzen konnte, arbeitete ich schon im Kundenprojekt. Es sollte eine Strategie für die Datenarchitektur des Kunden entwickelt werden. Dabei fielen dann Begrifflichkeiten wie unter anderem Data Governance, Data Quality Management, Datendomänen, Data Ownership und Metadatenmanagement. Für mich fühlte es sich anfangs wie Bullshit-Bingo (https://de.wikipedia.org/wiki/Buzzword-Bingo) an. In Workshops fielen dann ganze Sätze, die in ihrer Bedeutung für mich auch in einer mir unbekannten Fremdsprache hätten fallen können, sodass sie im Ergebnis gleich waren – unverständlich. War diese Welt der Daten doch eine Nummer zu groß für mich? Hätte ich mich mit dem Thema näher auseinandersetzen müssen, bevor ich die Abteilung wechselte? War es nur der Charme dieser Welt, der mich entzückt hatte und zum Vorschein kamen ungeahnte Hürden? Würde ich mich in diesem Datendschungel (so fühlte es sich an) überhaupt zurechtfinden? In diesem Projekt unterbreiteten wir dem Kunden auch einen Technologievorschlag. Darin waren dann Technologien wie Azure Data Factory, Qlik Replicate, Azure Stream Analytics und Azure Purview vertreten. Ich habe zu diesem Zeitpunkt noch von keiner einzigen dieser Technologien jemals etwas gehört. Schaue ich zu wenig nach links und rechts? Lese ich zu wenige Fachzeitschriften? Oder bin ich einfach nur nicht up to date? Die ersten Zweifel machten sich breit.

Dieses Gefühl setzte sich noch ein wenig fort, bis sich der Kreis zu schließen begann. Immer häufiger erkannte ich Begrifflichkeiten wieder und die Zusammenhänge ergaben zunehmend Sinn für mich. Zwar wäre ich nicht in der Lage gewesen nach diesem Projekt das gesamte Konzept im Alleingang auf die Beine zu stellen, jedoch wusste ich die Dienste zu diesem Zeitpunkt allemal einzusortieren.

Nach Abschluss des Projektes dachte ich (so grün hinter den Ohren wie ich war), dass ich nun alles Wichtige rund um den Aufbau einer Datenplattform gesehen habe. Allerdings wurde ich schnell eines Besseren belehrt. Im nächsten Projekt ging es dann intensiv um die Fachgebiete Data Visualisation und Data Preparation im Rahmen einer Self-Service-Analytics-Studie. Darüber fiel in meiner Gegenwart bis dato kaum ein Wort und so stand ich wieder in unbekanntem Terrain. Ab hier wiederholte sich die Erfahrung aus dem ersten Projekt, jedoch mit dem wesentlichen Unterschied, dass das Verständnis deutlich früher kam und ich somit schon deutlich früher mitreden konnte.

Dieses Erlebnis wiederholt sich seitdem kontinuierlich. Jedes Mal lerne ich etwas Neues und erarbeite mir damit Schritt für Schritt ein Gesamtbild, um meine Wege durch den Datendschungel zu finden.

Dichter Dschungel, ein Holzweg führt durch dsa dichte Blattwerk. Das Geländer ist mit Moss bewachsen.

Dies führt mich zu der folgenden Schlussfolgerung:

Nein, diese Welt war keine Nummer zu groß für mich.

Klar erschien mir der Datendschungel auf den ersten Blick undurchdringlich, was vor Allem an der Vielfältigkeit dieses Gebiets liegt. Dies bestärkte mich aber nur in meinem Streben und in meiner Neugier. Auf den zweiten Blick erkannte ich die vielen möglichen Wege durch diesen Dschungel. Bei der Überwindung der zahlreichen Hürden halfen mir insbesondere folgende Faktoren:

  • Mir standen jederzeit fachkundige Ansprechpartner zur Verfügung, welche auf alle meine Fragen ausführlich eingingen und mir so die Hintergründe und Zusammenhänge dieser Welt erklärten.
  • Eine intern angebotene Schulungsreihe zu den Grundlagen zum Themengebiet Data & Analytics, war eine große Hilfe einen generellen Überblick zu erhalten.
  • Zuletzt hat ein regelmäßiger Blick in Fachzeitschriften, wie die BI-SPEKTRUM, mit Sicherheit nicht geschadet.

Aber allen voran steht die Begeisterung über diese weite Welt der Daten – denn ja, ich habe Bock auf Daten!

Leifs Kommentar

Wie startet man nun in die unendliche Welt der Daten? Keine leichte Frage und schon beim Schreiben denke ich darüber nach, wie man es am besten nennen könnte, um alle Facetten aufzugreifen. Business Intelligence, Data Engineering, Data Science, Data Analysis, Data Visualisation – ich habe es einfach mal „Welt der Daten“ genannt. Aber genau das zeigt sehr gut, wie vielseitig und spannend diese Welt ist. Ich ganz persönlich teile diese Welt gerne in 3 Kernbereiche auf: Data Management, Reporting und Advance Analytics. Data Management bedeutet für mich das Bereitstellen und Veredeln der Daten. (Datenmodell und ETL-Jobs erstellen.) Mit Reporting verbinde ich alles was mit der Analyse und Visualisierung der Daten zu tun hat. Im Bereich Advance Analytik sehe ich beispielsweise Themen wie die Nutzung mathematischer Modelle oder auch die KI beheimatet. Und ja, das ist sehr, sehr vereinfacht dargestellt und man könnte noch mehr Buzzwords dazu packen.

Was ich damit zeigen möchte ist, dass es drei Kernbereiche gibt, die man idealer Weise alle einmal durchlaufen sollte, um festzustellen, was einem wirklich liegt. Manchmal liegt Jemandem das Arbeiten mit Datenbanken mehr als die Visualisierung in einen Fancy Tool. Der Andere findet sich mit Skriptsprachen besser zu Recht. Idealer Weise hat man, so wie Angelika, die Möglichkeit in alle Bereiche mal reinzuschnuppern, um seine persönlichen Vorlieben herauszufinden.

Und ich glaube daran, dass man dann feststellen wird, dass einem ein Bereich besonders am Herzen liegt. Das muss die anderen Bereiche nicht ausschließen, aber um wirklich zu einem Experten zu werden, muss man sich irgendwann festlegen. Diese Datenwelt ist einfach zu divers und wird fast täglich um neue Themen ergänzt. Und spätestens dann, kann man sich auch guten Gewissens in die Arena der Experten begeben.

Angelikas Fragen an euch

Was hat Dich in die Welt der Daten geführt?

Wie würdest Du Deinen Einstieg in den Datendschungel beschreiben? Ein Sprung ins kalte Wasser oder ein gut geplanter, systematischer Prozess?

Lesson Learned: Was würdest Du anders machen, wenn du noch einmal die Möglichkeit hättest die Uhr zurückzudrehen und erneut in die Welt der Daten einsteigen würdest? Do’s and Don’ts?

Angelikas Highlight

Mein bisheriges Highlight ist die Teilnahme an der TDWI München digital im Juni diesen Jahres. Drei Tage lang imponierten unzählige Live-Vorträge rund um das Motto „Advancing All Things Data.“. Die Konferenz startete mit der Keynote von Martin Wezowski, welcher in seinem Vortrag eindrucksvoll den Fragen „Wie funktioniert die Zukunft, die Mechanik des Wandels? Was ist die Zukunft der menschlichen Arbeit und unserer Interaktionen mit Maschinen untereinander? Wer gestaltet die Zukunft, in der wir leben werden?“ nachging. Einen datenunabhängigen Einblick gab es in einer Special Keynote, in der der zweimalige DTM-Champion Gary Paffett von seinen Erfahrungen als Motorsportfahrer und als sportlicher sowie technischer Berater des Mercedes-EQ-Formel-E-Teams erzählte. Ich konnte viele spannende Eindrücke aus der Welt der Daten mitnehmen und freue mich schon auf die nächste TDWI Konferenz!

Der Beitrag spiegelt die Meinung der Autoren wider und ist keine allgemeingültige Meinung des TDWI. Als TDWI bieten wir die Plattform, alle Themen und Sichtweisen zu diskutieren. *

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert