TDWI Blog

Data Science, Business Intelligence und Analytics – Beschreibung und Analyse mithilfe von Python

Deutsche Übersetzung dieses Artikels. In den letzten Jahren wurde die Datenwelt mit einer neuen Realität konfrontiert. Die bessere Verfügbarkeit von Daten und Rechenkapazität führte zu einem Anstieg der Jobrollen. Eine der wichtigsten neuartigen Jobrollen ist der Data Scientist. Die Definition lautet folgendermaßen:

„Als Data Scientist oder Datenwissenschaftler bist Du dafür zuständig, aus unstrukturierten Rohdaten eine strukturierte Datenbasis zu schaffen, zu analysieren und am Ende mit Deinem betriebswirtschaftlichen Knowhow eine Entscheidungsgrundlage für ein Unternehmen zu schaffen.“ (Schmole 2020).

Wie passt das zu den anderen Rollen: Business Intelligence (Experte) und Analyst?

Dieser Artikel hat das Ziel diese neuen Bereiche zu erforschen, beschreiben und analysieren. Dabei werden im Laufe des Artikels zuersteinmal die drei Rollen beschrieben gefolgt von einer Analyse des Deutschen Jobmarktes durch Python

Data Science, Business Intelligence und Analytics – alles das gleiche?

Meine kurze Antwort dazu ist: Es ist nicht das gleiche, aber es gibt Gemeinsamkeiten.

Data Science nutzt strukturierte (Tabellen) und unstrukturierte Daten (Texte, Dokumente, Bilder, Videos) um Erkenntnisse und Muster zu erkennen. Data Science ist dabei auf zukünftige Informationen gerichtet während Business Intelligence auf vergangene Daten gerichtet ist. Beide Bereiche teilen Datenvisualisierung –und Management. Das Bild beschreibt es sehr treffend:

(Pugsley 2017)

Analytics auf der anderen Seite ist ein Prozess um mithilfe mathematischer Methoden nützliche Muster zu erkennen (Cambridge University Press 2014).

Diese Einleitung hat uns einen kurzen Einblick in die drei Felder gegeben anhand der folgenden Analyse des Job-Marktes lässt sich erkennen worin die Gemeinsamkeiten und Unterschiede liegen.

Job Markt für Data Science, Business Intelligence und Analytics in Deutschland:

In einer Analyse vom September 2018 wurden 900 Jobeinträge unter dem Suchbegriff „Data Science“ in Deutschland gefunden (Piatetsky 2018). Wie sieht es heute aus?

Für diese Analyse wurden Daten von LinkedIn heruntergeladen. Es wurden folgende Suchbegriffe genutzt: „Data Scientist“, „Analyst“ und „Business Intelligence“ (BI). Das Resultat sind ca. 975 extrahierte Jobeinträge für jeden Begriff, insgesamt 2.923 Jobs.

Unter diesen Suchbegriffen gibt es natürlich mehr Jobeinträge als in unserem Fall analysiert wurden. Die meisten Jobs gibt es im BI Bereich. Analyst ist an zweiter und Data Science an dritter Stelle. Immerhin haben die Data Science Jobs um 2,784 zugenommen. Das ist ein Anstieg von 400% zu 2018.

Alle Jobs dieser Suche machen jedoch nur 5% der gesamten IT Stellen aus.

Jobtitel:

Unter den Top 10 Nennungen wurden Data Scientist, Data Analyst und Business Intelligence Analyst am meisten genannt.

Zwischen den Suchbegriffen und Jobtitel gibt es jedoch Überschneidungen. Am meisten taucht das Wort „Analyst“ auf. Dabei wird das Wort interdisziplinär in allen Bereichen genutzt. Die viertgrößte Gruppe zeigt Jobs in den drei Kategorien, welche keine der Suchbegriffe aufzeigen – welche sind es?

Die meisten dieser Jobs kommen aus dem BI Bereich. Der Data Engineer steht mit Abstand weit oben. Diese Rolle ist auf jeden Fall genauso wichtig wie die drei anderen Rollen.

Firmen:

Die meisten Jobs kommen von der Webseite Campusjäger – einer Recruitment Agentur für Young Professionals und Studenten.

Stadt:

Man ahnt es bereits……

……die meisten Jobs kommen aus Berlin gefolgt von Hamburg und München. Die Karte hilft dabei diese Observation zu bestätigen. Eine hohe Anzahl von Stellen gibt es jedoch auch im Ruhrgebiet sowie in und um Frankfurt.

Bei der genaueren Analyse der Ausbreitung hilft uns das Seaborn Heatmap Chart. Das Diagramm nutzt eine Normalisierungsfunktion der Daten um die Anzahl der Jobs zwischen den Kategorien pro Stadt zu vergleichen (dunklere Farbe). Es bedeutet zum Beispiel das es mehr Analystenjobs, als BI und Data Science Positionen, in Berlin gibt.  Bei der Betrachtung von Frankfurt fällt auf, dass es hier auch mehr Analystenstellen gibt. Das könnte durch die Finanzindustrie getrieben sein, welche in Frankfurt ihren Hauptsitz hat und sich stark auf Analysten stützt.

Hannover auf der anderen Seite bietet vermehrt Data Science Positionen. Der Grund liegt hier sehr wahrscheinlich in den Versicherungsunternehmen welche in Hannover beheimatet sind. Die Digitalisierung ist ein großes Thema bei den Versicherern und es wird versucht durch Data Science eine Expertise in diesem Bereich aufzubauen.

Alter der Anzeigen:

Die meisten Anzeigen wurden sind nicht älter als vier Monate. Am meisten gab es hierbei Jobs nicht älter als zwei Wochen.

Karrierestufe:

Gute Neuigkeiten für Young Professionals und Absolventen, die meisten Jobs kommen aus dem Entry Level Bereich. Gerade im Data Science Bereich gibt es die meisten dieser Entry Level Positionen. Es gibt dort auch kaum Executive und Director Positionen im Vergleich zum etablierten BI-Bereich.

Abteilung – erste Nennung:

Die meisten Jobs sind im Bereich Business Development, IT and Engineering zu finden.

Analysten und BI-Experten dominieren den Business Development Bereich. In der IT sind vermehrt Data Scientists zu finden. Im Engineering Bereich sind die meisten Data Science Positionen angesiedelt.

Der Finanzbereich stützt sich am meisten auf Analysten.

Industrie – erste Nennung:

Fast 50% der Positionen sind im IT Bereich angesidelt.

Der IT Bereich wird durch BI Experten und Data Scientisten geprägt. Marketing, Internet und die Chemieindustrie setzt hierbei mehr auf Analysten.

Word Cloud:

Mithilfe einer Word Cloud ist es möglich unstrukturierte Daten zu analysieren. Hierbei geht es um die Jobangebot-Texte. Die Word Cloud zeigt die am meisten genannten Wörter. Vorher werden natürlich noch alle StopWords (a, and, or, etc.) entfernt.

Die Word Cloud für Analyst:

Data Science:

Business Intelligence:

Alle drei nutzen sehr häufig die Wörter „team“ und „data“. In der Analyst Word Cloud das Wort wird das Wort „Customer“ sehr häufig genutzt. In der Data Science Word Cloud wurden die Wörter „Machine Learning“ sehr stark hervorgehoben. Data Science und BI nutzen beide den Begriff „Big Data“. BI nutzt natürlich den Begriff „Data Warehouse“.

Am Ende dieses Artikels kann man sagen, dass Analytics, Business Intelligence und Data Science trotz der Unterschiede, gewisse Gemeinsamkeiten teilen.  Diese Unterschiede und Differenzen wurden durch die Analyse des deutschen Jobmarktes hervorgehoben.

Am wichtigsten ist in meinen Augen, dass alle drei Bereiche die Leidenschaft für Daten teilen.

Der vollständige Code befindet sich als Notebook auf nbviewer oder auf Github.

Literaturverzeichnis

Cambridge University Press. 2014. Analytics. Zugriff am 17. Mai 2020. https://dictionary.cambridge.org/de/worterbuch/englisch/analytics.

Piatetsky, Gregory. 2018. How many data scientists are there and is there a shortage? September. Zugriff am 17. Mai 2020. https://www.kdnuggets.com/2018/09/how-many-data-scientists-are-there.html.

Pugsley, Stan. 2017. Understanding the Differences Between Data Science and BI. 5. Dezember. Zugriff am 17. Mai 2020. https://tdwi.org/articles/2017/12/05/bi-all-understanding-differences-data-science-and-bi.aspx.

Schmole, Melanie. 2020. Was macht ein Data Scientist? Zugriff am 15. Mai 2020. https://www.get-in-it.de/magazin/arbeitswelt/it-berufe/was-macht-ein-data-scientist.

*Der Beitrag spiegelt die Meinung des Autors wider und ist keine allgemeingültige Meinung des TDWI. Als TDWI bieten wir die Plattform, alle Themen und Sichtweisen zu diskutieren.*

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert