Neu auf der Corona Datenplattform: Regionale Trends und Entwicklungen der Inzidenzen

von Christoph Höser, Institut für Hygiene und Public Health des Universitätsklinikums Bonn und Bea Nolte, infas 360 GmbH

Zur Bewertung von Inzidenzen benötigt man zusätzlich die Richtung der Entwicklung. Trends ermöglichen eine differenzierte Betrachtung der Inzidenzen.

Die Corona-Datenplattform integriert seit Kurzem die Visualisierung regionaler Trends, ein Projekt des Konsortiumsmitglied IHPH des Universitätsklinikums Bonn. Mit dem neuen Datenupdate Juni 2021 liegen diese Informationen nun auch für alle Anwender als downloadbarer Datensatz zur Verfügung.

Das Trend-Dashboard

Die Nutzung des Dashboards auf der Corona-Datenplattform kann wie folgt beschrieben werden:

Reporting Areas sind als Kreise im zentralen Diagramm dargestellt: der Durchmesser entspricht der Bevölkerung, die Farbe den Bundesländern. In der interaktiven Version können Bundesländer selektiert werden, deren Kreise sichtbar sein sollen. Der zentrale Scatterplot zeigt die Verhältnisse von letztem Trend + aktuelle Situation für einen bestimmten Stichtag. Im interaktiven Plot kann dies tagesscharf gewählt werden.

Über die reine Situationsbewertung hinaus, wie sie z.B. durch die vergleichbaren 7-Tage-Inzuidenzen möglich ist, können nun 7-Tage-Inzidenzen differenziert betrachtet werden: 7-Tage-Inzidenzen verschiedener Kreise mit identischem Wert können sehr wohl weit auseinander liegen, wenn der letzte Trend zur Interpretation mit herangezogen wird. In der Abbildung zum 3. April zeigt sich beispielsweise, dass die Kreise die Klasse mit der 7-Tage-Inzidenz „120 bis 140“ am stärksten belegen. Innerhalb dieser Klasse zeichnet sich jedoch eine Dichotomisierung ab, nämlich Kreise mit stark fallendem und Kreise mit zuletzt stark steigendem Trend. Daher ist es nicht hilfreich, die 7-Tage-Inzidenz allein zu betrachten, wenn man die Situation bewerten möchte.
Damit die Differenzierung einfach möglich und trotzdem vollständig bleibt, wurden die Extremwerte der Inzidenzen am rechten Rand gesammelt dargestellt.

Die randlichen Balkengraphiken geben eine Zusammenfassung des Scatterplots nach Zeilen und Spalten in jeweils zwei Versionen. Hier wird einerseits die Anzahl der Kreise verwendet, andererseits nach Anzahl der Einwohner gewichtet. Am Beispiel 3. April sind beide Varianten nahezu identisch für die 7-Tage-Inzidenzen und nur leicht abweichend bei den Trends. Das stellt sich zu anderem Datum anders dar, wen urbane Gebiete bspw. besonders intensives Infektionsgeschehen verzeichnen.

Beispielinterpretation

Der große orangene Kreis am unteren Rand repräsentiert Berlin. Die 7-Tage-Inzidenz lag am 3. April bei 133,7 mit zuletzt sehr stark fallendem Trend.

Bei 97,2 lag die 7-Tage-Inzidenz des SK München (hellblauer Kreis) am gleichen Tag, mit leicht fallendem Trend. Damit sind Trend und 7-Tage-Inzidenz für beide Großstädte verschieden. In der Zusammenschau zeigt sich, dass die komplexe Situation aus jeweiliger 7-Tage-Inzidenz in Kombination mit dem Trend jedoch keine sehr unterschiedliche Prognose wahrscheinlich erscheinen lässt.

Viele Kreise, mit möglicherweise einer weiten Spanne an 7-Tage-Inzidenzen incl. hoher Werte,  können sich am unteren Rand des Scatterplots sammeln. Dies würde bedeuten: Die Situation ist schlecht, aber der Trend ist positiv, wir sind – trotz hier Inzidenzwerte – auf dem richtigen Weg (interaktive Version am 3.Mai 2021)

Das Gegenteil zeigt die Graphik am 12. März 2021: viele Kreise mit einer 7-Tage-Inzidenz < 80, aber sehr viele mit extrem steigendem Trend.

Sie haben Fragen zu den Visualisierungsmöglichkeiten? Dann kontaktieren Sie unser Corona-Datenteam unter corona@infas360.de 

Predictve Analytics: Gibt es einen Pleitefaktor für Unternehmergesellschaften?

Die Antwort lautet: Ja! Geht statistisch etwa jede fünfte haftungsbeschränkte Unternehmergesellschaft, kurz UG(h), pleite, verbessern Daten und Analysen diese Vorhersage deutlich.

Die UG(h) wurde 2008 als kleinere Variante der herkömmlichen Gesellschaft mit beschränkter Haftung (GmbH) geschaffen und stellt eine beliebte Gründungsform für Start-ups dar. Gründung, Änderungen und Löschung (durch Insolvenz) werden wie bei der GmbH im Handelsregister vermerkt.

Das Handelsregister wiederum wird von infas 360 tagtäglich analysiert und ausgewertet. Für ein Projekt ergab sich nun die Fragestellung: Zeichnen sich Insolvenzen von UG(h)-Neugründungen durch spezifische Indikatoren aus, die als eine Art „Pleitefaktor“ im Moment einer zukünftigen Neueintragung (also ad hoc) vorhergesagt werden können?

Basis der Untersuchung waren alle UG(h)-Neueintragungen seit 2008 bis heute, die entweder immer noch existieren oder bis zum 31.12.2014 als ‚liquidiert‘ bzw. als ‚vermögenslos‘ im Handelsregister hinterlegt wurden. Es handelt sich dabei um rund 100.000 Fälle (siehe nachfolgende Tabelle).

UG(h)
ABSOLUT
‚Pleite‘ nur Männer nur Frauen
Nein               74.365               58.384                15.981
Ja                    25.053               19.383                  5.670
Gesamt        99.418               77.767                21.651
RELATIV
‚Pleite‘ nur Männer nur Frauen
Nein 79% 21%
Ja 77% 23%
Gesamt 78% 22%

Da zu den jeweiligen Unternehmen auch die Adresse existiert, konnten diese mit weiteren vorliegenden Businessinformationen angereichert werden wie z.B. Gebäudetyp, Gewerbeflächen, Gebäudenutzung, weitere bekannte Firmen je Adresse und Branche, Lage usw.

Das Ergebnis des im ersten Schritt noch bewusst einfach gehaltenen Prognosemodells (logistische Regressionsanalyse) ist bereits erstaunlich. Liegt der ’natürliche‘ Pleitefaktor bei rund jeder 5. UG(h), so wird die Vorhersage dank der o.g. Daten auf Adressebene um über 1/3 verbessert. Vereinfacht ausgedrückt heißt das: Die Vorhersage, dass der Zonk hinter einem von 5 Türen steckt, wird auf 3 Türen reduziert.

Hier einige der Treiberfaktoren für eine ‚Pleite‘:

  • Firmen in Großstädten, die in Central Business Districts (CBD) liegen, gehen mit 8% höherer Wahrscheinlichkeit pleite, als Firmen in Großstädten, die nicht im CBD liegen.
  • Firmen in Großstädten, die in einem Industrie- und Gewerbegebiet liegen, gehen mit 10% geringerer Wahrscheinlichkeit pleite, als Firmen in Großstädten, die nicht in einem solchen Gebiet liegen.
  • In Großstädten gehen Firmen, bei denen nur Männer im Handelsregister eingetragen sind, mit 14% geringerer Wahrscheinlichkeit pleite

In einem der nächsten Schritte wird das Modell nun mit den Pleiten (Echtfällen) von UG(h)s aus den Jahren 2015-2018 trainiert. Sie haben Fragen zum Pleitefaktor? Dann kontaktieren Sie unser Consulting-Team unter Consulting@infas360.de

Predicitve Policing: Wie Gebäude- und Regionaldaten Wohnungseinbrüche vorhersagen

(Copyright Foto: fotolia.com/Racle Fotodesign)

In diesem Jahr (2017) veröffentlichte das Landeskriminalamt Nordrhein-Westfalen den Basis-Forschungsbericht Wohnungseinbruchdiebstahl (WED) https://lka.polizei.nrw/sites/default/files/2017-05/Basisbericht_Forschungsprojekt%20WED.pdf

Darin wird u.a. festgestellt, dass – unterschieden nach Häusern und Wohnungen – es sich bei den ersten Fällen mehrheitlich um freistehende Einfamilienhäuser (n = 1 328, 60,7 %) handelt. Weitere 25,6 Prozent der Delikte (n = 559) erfolgen in Reihenhäusern. Gebäude vom Typ Doppelhaushälfte machten dagegen nur 13,7 Prozent (n = 300) aller betroffenen Häuser aus.

Die Anteile der verschiedenen Wohngebäudetypen werden im Wesentlichen durch die Gemeindegrößen der Tatorte bestimmt. Der Anteil raumsparender Reihenhäuser und Doppelhaushälften ist in Großstädten dabei natürlich größer. In Großstädten mit mehr als 150 000 Einwohnern hatten Reihenhäuser und Doppelhaushälften einen Anteil von 51,5 Prozent (n = 399) an allen von WED betroffenen Tatobjekten. Dieser Anteil sinkt dem Bericht zur Folge kontinuierlich mit der Abnahme der Einwohnerzahl. So betrug der Anteil angegangener Reihenhäuser und Doppelhaushälften in Gemeinden bis 25.000 Einwohnern nur noch 16,4 Prozent (n = 64).

infas 360 hat auf amtlicher Basis alle bundesweit rund 20 Mio. Wohngebäude auf Adressebene analysiert und u.a. die einzelhausgenaue CASA-Gebäudetypologie in 98 Klassen entwickelt

Mehr Infos dazu unter http://infas360.de/service/news/so-wohnt-deutschland/

Für Predictive Analytics sollten alle über 700 berechnete CASA-Merkmale zur Anwendung kommen. Die Small Area Methodik bestimmt dann, welche Variablen am besten das Gebäude und seine Umgebung voraussagt.

Haben Sie Fragen zu regionalen Einbruchsdaten, Predicitive Analytics oder Predicitve Policing, dann kontaktieren Sie uns unter Consulting@infas360.de