Der Virus und sein Veedel

Zum Hauptartikel

Update 27. April 2021

Die Stadt Köln veröffentlicht erstmals die Daten auf Ebene der Stadtviertel wöchentlich aktualisiert in einer interaktiven Karte Stadt Köln – Corona-Fallzahlen nach Stadtteil (arcgis.com)

Update 23. April 2021

Analog zur Analyse der Kölner Daten vom 16.3.21 liegen nun auch die Ergebnisse der Stadt Duisburg vor, die ebenfalls die Infektionszahlen auf Stadtteilebene veröffentlicht haben (siehe Meldung der Rheinischen Post vom 16. April 21). Hier geht`s zu den Duisburger Ergebnissen.

Der Virus und sein Veedel

Soziale Ungleichheit prägt den Verlauf der Infektion. So lautete die Überschrift eines Artikels von P. Heisig und C. König des Wissenschaftszentrum Berlin für Sozialforschung. Die beiden Wissenschaftler wiesen bereits in einer frühen Phase der Pandemie darauf hin, dass Infektionsrisiko, Schwere des Krankheitsverlaufs und Sterberisiko vom sozialen Status abhängen würde, was auf sozioökonomisch und ethnisch ungleich verteilte Risikofaktoren zurückgeführt werden könne. Das RKI bekräftigt diese These erst kürzlich mit einer Veröffentlichung im März 2021 unter dem Titel Soziale Unterschiede in der COVID-19-Sterblichkeit während der zweiten Infektionswelle in Deutschland und stellte dabei fest:

  • Der Anstieg der COVID-19-Todesfälle fiel in sozial benachteiligten Regionen Deutschlands am stärksten aus – sowohl bei Männern als auch bei Frauen.
  • Im Dezember und Januar lag die COVID-19-Sterblichkeit in sozial stark benachteiligten Regionen um rund 50 bis 70 Prozent höher als in Regionen mit geringer sozialer Benachteiligung

Etwa zur selben Zeit veröffentlichte die Stadt Köln die Infektionsdaten pro Stadtviertel (‚Veedel‘) mit Stand 16.3.2021 (siehe dazu auch Blogbeitrag Innerstädtische Zonen für eine nachhaltige Niedriginzidenz). infas 360 hat diese Daten nun aufbereitet und mit weiteren ihr bundesweit zur Verfügung stehenden adressgenauen sozio-demographischen, ökonomischen und infrastrukturellen Informationen angereichert. Für den Kölner Datensatz wurden dazu u.a. folgende rund 100 Merkmale (Variablen) entsprechend pro ‚Veedel‘ ausgewählt und aggregiert:

  • Einwohnerdichte, Kaufkraft, Wirtschaftsbranchen, Zentralität, ÖPNV-Verbindung, Shop-Dichte, Wahleinstellungen, Migrationsanteil, Miet-und Kaufpreisspiegel, Gebäudestruktur, Altersstruktur, Schul- und Gesundheitseinrichtungen u.v.m.

Anschließend wurden die Pearson-Korrelationen als Maß für den linearen Zusammenhang zwischen der jeweiligen Variable und der Gesamtinzidenz je Stadtteil (Gesamtanzahl der Covid19-Fälle je 100.000 Einwohner) berechnet (siehe nachfolgendes Tabellenbeispiel).

Stadt Köln Covid19-Korrelationen
Auszug aus dem Datensatz und den jeweiligen Korrelationen zwischen den Variablen und der Inzidenz je Stadtviertel (‚Veedel). Grün je weniger/rot je mehr desto höhere Inzidenz.

Danach sind die Korrelationen mit den höchsten Koeffizienten (Auszug)

  • die Arbeitslosenquote
  • der Migrations- und Ausländeranteil
  • Zweitstimmenanteil sonstige Parteien und AfD, Bundestagswahl 2017
  • Kaufkraft je Einwohner (negativ)
  • Zweitstimmenanteil FDP, Bundestagswahl 2017 (negativ)
  • Anteil Hochschulabschlüsse (negativ)
  • Hochhäuser
  • Anteil Einwohner unter 18J.
  • Einwohnerdichte
  • Anteil Firmen in Finanz- und Versicherungsdienstleistungen (negativ)
  • Anteil Schüler
  • Kaufpreisspiegel (negativ)
  • ÖPNV-Verfügbarkeit
  • Freistehende Ein-/Zweifamilienhäuser (negativ)

Der komplette Datensatz inkl. aller Korrelationen steht für nicht-kommerzielle, wissenschaftliche Zwecke kostenlos zur Verfügung und kann für weitere Analysen eingesetzt werden (Lizenzbedingungen). Dazu einfach kurz eine Mail an corona-datenplattform@infas360.de senden.

Ausblick

In diesem Verfahren wurden die aggregierten Falldaten je Stadtteil nachträglich mit weiteren Informationen ebenfalls aggregierten Datensätzen angereichert. Deutlich präziser und damit aussagekräftiger werden die Analysen, wenn man vor dem Aggregationsprozess die gebäudescharfen Merkmale mit den pseudo-anonymisierten Adressen der Gesundheitsämter DSGVO-konform verknüpft und dann anonymisiert sowie räumlich aggregiert. Im Anschluss können mikrogeographische Analysen wie z.B. eine Predictive Risk Analytics (vorhersagende Risikobewertung) durchgeführt werden.

Analyse der Neuinfektionszahlen nach Stadtteilen in Duisburg

Auf Basis desselben Datenkranzes (Auswahl der Merkmale) wie in Köln wurden auch die Neuinfektionszahlen in Duisburg mit Datenstand 11. April 2021 untersucht. Folgende der ca. 100 Auswahlkriterien weisen die höchsten Korrelationen auf (Auszug):

  • Ausländeranteil
  • Anteil Personen mit höchstem schulischen Abschluss Fachhochschulreife oder Abitur (negativ)
  • Anteil Personen mit türkischem Migrationshintergrund
  • Migrationsanteil, allgemein
  • Anteil Personen mit höchstem beruflichen Abschluss Fachschule, Fachakademie oder Berufsakademie (negativ)
  • Anteil Personen mit höchstem beruflichen Abschluss  Fachhochschulabschluss oder Hochschulabschluss (negativ)
  • Kaufspiegel (negativ)
  • Kaufkraft pro Einwohner (negativ)
  • Mietspiegel (negativ)
  • Anteil Einwohner unter 18 Jahren
  • Anteil Schüler

Der komplette Datensatz inkl. aller Korrelationen steht für nicht-kommerzielle, wissenschaftliche Zwecke kostenlos zur Verfügung und kann für weitere Analysen eingesetzt werden (Lizenzbedingungen). Dazu einfach kurz eine Mail an corona-datenplattform@infas360.de senden.

Nutzung innerstädtischer Covid19-Zonen für eine nachhaltige Niedriginzidenz

Durch räumliche Lokalisierung vorhandener Falldaten können innerstädtische Zonen nach Inzidenz und Risikofaktoren bewertet und klassifiziert werden. Als sogenannte Ampelkarten (rote, gelbe und grüne Zonen) in Dashboards bringen sie für Amt und Bürger die notwendige Transparenz ins Infektionsgeschehen, um unmittelbar und maßgeblich handeln zu können.

  1. Die Basis: Intrakommunale Zonen und deren Inzidenzbewertung

Im höchsten Maße zweckdienlich bei der räumlichen Unterteilung der Gemeinde in geographische Zonen ist die Nutzung der vorhandenen, intrakommunalen Gliederung auf Basis der flächendeckenden, amtlichen Siedlungsblöcke und Stadtviertel bzw. Ortsteile.

Auf dieser Basis kann jede Wohnadresse eindeutig einem amtlichen Siedlungsblock und damit einer Zone zugeordnet werden. Dieses bundesweit vorhandene Adressregister nach intrakommunalen Strukturen nennt sich auch postalisch-amtliches Gliederungssystem, kurz PAGS, wozu auch die notwendigen aktuellen Einwohnerzahlen sowie zahlreiche Strukturdaten vorliegen.

Durch eine DSGVO-konforme Verknüpfung, der sog. Geocodierung der Falldaten über die Adressen, können die Infektionsdaten sofort den entsprechenden Zonen zugeordnet werden. Im Ergebnis liegen so unmittelbar feinräumige, deutlich genauere Inzidenzwerte vor, nach denen die Zonen bewertet und klassifiziert werden können. Infektionscluster werden so sofort sichtbar.

Neben tagesaktueller und wöchentlicher Zonen-Inzidenzen können durch Nutzung weiterer mikrogeographischer Daten wie Gebäudetyp, -nutzung, Haushaltsgrößen, Migrationsanteile usw. geostatistisch Prognosewerte (Predicitve Risk Analytics) ermittelt werden. Diese dienen der zukünftigen Risikoeinschätzung und können auch außerhalb des Krisenstabs kommuniziert werden.

Im Ergebnis entsteht eine neuartige, intrakommunale Transparenz des aktuellen sowie zukünftigen Infektionsgeschehens auch für den Bürger, was die Chance zum antizipativen Verhalten und persönlichen Change- und Motivationsmanagement bietet.

2. Die Umsetzung: In wenigen Stunden zur Ampelkarte

Mit entsprechender Unterstützung der IT-Administration des Amts wird der für die Pandemiebekämpfung kostenlose PAGS-Coder installiert. Dieser ordnet in wenigen Minuten mehrere Tausend Fallzahlen den entsprechenden Zonen mittels Zuspielung aller vorhandenen Zonenschlüssel (Geoschlüssel) zu. Der kostenlose PAGS-Coder ist eine Servertechnologie, die lokal installiert wird und verfügt über zahlreiche, offene Schnittstellen, siehe auch http://89.31.1.14/PAGSCoder2020/ So wird u.a. gewährleistet, dass die Adressen innerhalb der Gemeinde verbleiben. Die Daten können danach sofort ausgewertet, klassifiziert und via Web dargestellt werden (Ampelkarte).

3. Ad-Hoc: Risikobewertung für eine nachhaltige Niedriginzidenzstrategie

Durch die offenen Schnittstellen des PAGS-Systems können neue Adressen dynamisch bzw. vollautomatisiert mit der jeweils aktuellen Zonen-Inzidenz angereichert werden. So kann beispielsweise eine Adress-Registrierung durch einen Besucher in einem Einkaufs-Shop sofort mit der zugehörigen Zonen-Inzidenz abgeglichen werden und folgernd ein unterschiedliches Einlassverfahren angewendet werden z.B. grün = Wochentest, rot = Tagestestung).

4. Fallbeispiel Köln

Auf der Webseite Corona-Virus in Köln – Entwicklung der Fallzahlen – Stadt Köln (stadt-koeln.de) findet man innerstädtische Angaben der Stadt Köln mit den Fallzahlen und aktiven Fällen zum Stichtag 16.3.2021 pro Stadtteil (86). Die unterschiedliche Verteilung auftretender Fälle (hier pro 100.000 Einwohner, Quelle infas 360) je Stadtteil (blaue Punkte) wird offensichtlich.

Hier die tabellarischen Daten dargestellt als Ampelkarte am Beispiel der aktiven Fälle pro 100.000 Einwohner je Stadtteil zum 16. März 2021.

Die Daten der Stadtteile können nun nach beliebigen Strukturmerkmalen wie z.B. Bebauung, Kaufkraft, Arbeitslosenrate, Fußgängerfrequenzen, Shopdichte, ÖPNV usw. ausgewertet werden. Auch eine feinräumigere Auswertung pro Siedlungsblock je Stadtteil wäre möglich.