Der Begriff Data Lake wird seit einigen Jahren heiß diskutiert. Bis heute gibt es kein einheitliches Verständnis und die Erwartungen der Anwender liegen verteilt zwischen universellem Heilsbringer und großer Festplatte. Diese Serie betrachtet das Konzept Data Lake auf Basis aktueller Entwicklungen sowie Erfahrungen in der Praxis und versucht dabei das breite Spektrum an Begrifflichkeiten und Ansätzen einzuordnen. Dieser erste Artikel der Serie betrachtet dabei initial den Begriff des Data Lakes und die zugrundeliegende Motivation.
WeiterlesenMonat: Februar 2020
Join us and share your passion with peers!

Diese Woche möchten wir euch ein neues Event vorstellen, bei dem der TDWI als Partner dabei ist: c/o data science. Dazu gibt Nils Bruckhuisen einen Einblick in das letzte Event in Bonn.
WeiterlesenClustermap using hierarchical clustering in Python – A powerful chart to display many aspects of data

A so-called “Clustermap” chart serves different purposes and needs. This article has the aim to describe how you can create one, what purposes it serves and we will have a detailed look into the chart. This chart includes a hierarchical clustering which we will investigate as well.
WeiterlesenBusiness Intelligence meets Data Science: Zwei Welten treffen aufeinander
Auf den ersten Blick ist es verblüffend: Sowohl Business Intelligence als auch Data Science verfolgen den Erkenntnisgewinn aus Daten. Und dennoch trennen die beiden Themen häufig Welten: kulturell, organisatorisch und im Hinblick auf Werkzeuge. In dieser Serie aus Blog-Artikeln möchten wir näher in dieses Thema eintauchen, liegen doch in der Zusammenführung der beiden Themen erhebliche Chancen. Im ersten Teil betrachten wir die Ausgangslage näher.
Weiterlesen