TDWI Blog

Krisenzahlen

Vielleicht sind es Ihnen im Augenblick zu viele Themen, die um das Coronavirus kreisen. Aber die Eindämmung der Ausbreitung des Virus prägt unseren Alltag ja auch enorm – und das zu Recht. Der TDWI ist ein Verein, der datengetriebenes Handeln in den Vordergrund stellt und Entwicklungen in diesem Zusammenhang möchte er den Mitgliedern vermitteln. Dabei sehen wir aber immer wieder, dass die Herausforderung oftmals darin liegt, passende und stimmige Quellen zusammenzustellen, so dass wir einen Mehrwert für unsere tägliche Arbeit aus den Zahlen generieren zu können. So geht es mir in diesem Beitrag nun darum, ein bisschen jenseits aller Aufregung, zur Betrachtung von Zahlen einzuladen und eigene Schlüsse zu ziehen.

In einem Meme bekam ich unlängst die Information, dass die Italiener in der Krise vor allem Zigaretten und Grappa kaufen. Das wirkte zunächst sympathisch auf mich, aber in Verbindung mit Social Distancing auch nicht wirklich stimmungshebend – es scheint dann doch eher Individualerlebnis zu sein. Glaubt man nun Statista, so hat ergänzend im Vergleich zum März 2019 in Italien die Nachfrage nach Toilettenpapier um 140% zugenommen – in Deutschland übrigens nur um 35% (so wirken die Regale gar nicht auf mich). Aber Statista selbst gibt auch noch die Information, dass die Nachfrage sich hierzulande mehr als verdreifacht hätte (211%) … Da geht es dahin, mein Vertrauen in die Zahl. Also auch offizielle Seiten hinterlassen zahlenseitig Fragen bei mir.

Dazu möchte ich auf zwei interessante Links verweisen (es gibt noch viele mehr und ich würde mich ausdrücklich freuen, als Kommentar zum Blogbeitrag noch ein paar weitere von Ihnen zu erhalten). So informiere ich mich beispielsweise über Infektionsraten für Deutschland vor allem über das Robert-Koch-Institut (RKI). Einen weltweiten Überblick erhält man über die John-Hopkins Universität, die allerdings in ihren Zahlen auch Differenzen zu nationalen Zahlenwerken wie dem des Robert-Koch-Institutes hat. Am Tag des Verfassens meines Beitrages, dem 08.04.20 sind es beim RKI für Deutschland 103.228 COVID-19 Fälle, bei John-Hopkins 107.663. Nimmt man nun das RKI als Basis, so handelt es sich um eine Abweichung in Höhe von 4.435 Fällen, also etwa 4,3%. Wenn ich nun eine Quelle für mein weiteres Arbeiten suche, wer hat denn dann wie Recht?

Diese Fragestellung kennen alle, die Datenauswertung betreiben. So sind es auch hier die alten Bekannten, die uns hier wieder begegnen. An erster Stelle unterschiedliche Datenquellen, die zum Teil auch Doppelzählungen beinhalten können. Im Weiteren gibt es unterschiedliche Erhebungszeitpunkte und nicht zuletzt unterscheiden sich auch noch Definitionen. Ein informativer Artikel zu unterschiedlichen Zahlen in Bezug auf COVID-19 wurde auf der Seite von Quarks veröffentlicht. Dieser schlussfolgert: „Zahlen sind immer nur so gut und aussagekräftig, wie die Methode, mit der sie erhoben werden.“ Das gilt für die Wissenschaft und auch für die Methoden der Datenauswertung in Organisationen und Unternehmen.

Und denken wir das Thema weiter: Wir wollen diese Zahlen nun nicht nur für ein Berichtswesen nutzen, sondern basierend darauf Vorhersagen treffen. Eine vom Herrn Prof. Dr. Drosten, einem dieser Tage vielzitierten Virologen der Charité, als interessant bewertete Studie kommt aus seiner Sicht zu dem Ergebnis: „Nur das Maßnahmenbündel aus Isolation erkrankter Patienten, sozialer Distanzierung (Abstand halten) in der gesamten Bevölkerung plus der Schließung von Universitäten und Schulen ist ausreichend wirksam… [] … um die Kapazitäten der Intensivstationen nicht zu überlasten … []… Allerdings muss man das Ganze dann für fünf Monate durchhalten“.

Fünf Monate – das ist eine zunächst kleine Zahl stellvertretend für große Folgen. Zwischenmenschlich ist das vielleicht noch durch umfangreiche Alternativen wie Videotelefonie denkbar, aber wirtschaftlich ist es sicher schwerer darstellbar. Für diese fünf Monate ist es ja nun die Herausforderung, eine Vorhersage zu treffen, so dass ich mein Unternehmen bzw. meine Geschäftstätigkeit darauf ausrichten kann. Welche Zahlen brauche ich nun und woher bekomme ich diese? Ich muss unterschiedliche Szenarios durchdenken (und damit vorhersagen), so dass ich mein Risiko einschätzen und steuern kann. Mit düsterer Perspektive hat das ifo-Institut beispielsweise solche Szenariorechnungen betrieben und dabei eine unterschiedliche Beeinflussung der Produktivität unterstellt. Es gibt die Gruppen:

  • Einstellung der Produktivität (beispielsweise Event und Sport),
  • Volle Produktivität (beispielsweise Pharmaindustrie und Landwirtschaft) und
  • halbe Produktivität (beispielsweise Werbung und Architektur).

Zudem werden die Dauer des Shutdown, die Dauer der Post-Shutdown-Phase zur Erholung und auch die Stärke der Auswirkung selbst variiert. Die Ergebnisse der resultierenden 18 Szenarios reichen bei einem einmonatigen Shutdown von einer Reduktion des BIP um 4,3% in 2020 bis zum dreimonatigen Shutdown und einer Reduktion des BIP um 20,6% für 2020. Der Shutdown von 5 Monaten wurde als Szenario nicht bewertet.  

Welche Zahlen zählen in einer solchen Situation? Und da sehen wir die Einseitigkeit, die trotz aller Standardisierungsansätze und Prozessdefinitionen immer vorhanden ist. Es entscheidet derjenige, der die Analyse aufsetzt. Für viele geschäftlich individuell zusammengestellte Daten muss die jeweilige Organisation dann für sich bewerten, welche Subjektivität ein Problem darstellt. In unserer aktuellen Situation und in dieser Krise stehen – zumindest für mich – klar die Opfer und die potentiellen Opfer der Pandemie im Vordergrund. Hier betreffen Entscheidungen Länder mit ihren Menschen und dann ist es umso wichtiger, dass man sich auf die Datenanalyse verlassen kann und sich dann die richtigen Maßnahmen ableiten lassen. 

Ich wünsche mir einen aussagekräftigen Informationsstand unter Abstimmung der Definitionen und Werte. Also die Informationen, welche die Szenarios zusammen darstellen und auch die gleichen Annahmen treffen. Ich würde mir zudem wünschen, dass wissenschaftliche Erkenntnisse an einer gemeinsamen Stelle kommentiert werden. Im Kopf habe ich dazu kollaborative BI-Dashboards. So möchte ich Sie heute auf einen kostenfreien TDWI-Akademie-Webcast hinweisen, in dem wir das im Detail vorstellen. Herstellerneutral, aber anhand von Beispielen. Vielleicht eine Anregung, die Sie mitnehmen können in den Alltag – vor und nach dem Shutdown.

Bleiben Sie gesund und arbeiten Sie mit daran, dass Zahlen etwas wert sind – weil das Ergebnis zählt!

3 Kommentare

  1. Das RKI gibt selber zu, dass seine Zahlen vielfach verspätet sind. Eine „Wochenend-Delle“ bei Neuinfektionen ist sachlich auch eher unwahrscheinlich. Wir alle als TDWI/Datenenthusiasten hätten gerne bessere Zahlen. Nach Neufassung des Infektionsschutzgesetzes 2014 hat das RKI das Projekt DEMIS initiiert. Hier geht es darum die unterschiedlichen Meldewege und -verfahren zu vereinheitlichen und zu beschleunigen. Leider gibt es 5 Jahre später noch keine Ergebnisse und die Zeit, JHU etc. rufen lieber selber in den Landkreisen an – eine Posse.
    Was mit den vorhandene (JHU) Zahlen gemacht werden kann, ist zum Beispiel aus „Neuinfektionen“, „genesenen“ und „verstorbenen“ eine (ungefähre) Zahl der „aktiven“ Infektionen zu errechnen. Und diese ist in den letzten Tagen (Stand 15.4.) rückläufig.

    1. Danke für den Kommentar! Ja, auch die Prozesskette der Datenerhebung ist hier ganz klar ein Thema und auch das kennen wir als Datenenthusiasten – danke für den schönen Begriff in dem ich mich auch subsummiert fühle – aus dem täglichen Umgang mit Daten!

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert