Der Virus und sein Veedel

Zum Hauptartikel

Update 27. April 2021

Die Stadt Köln veröffentlicht erstmals die Daten auf Ebene der Stadtviertel wöchentlich aktualisiert in einer interaktiven Karte Stadt Köln – Corona-Fallzahlen nach Stadtteil (arcgis.com)

Update 23. April 2021

Analog zur Analyse der Kölner Daten vom 16.3.21 liegen nun auch die Ergebnisse der Stadt Duisburg vor, die ebenfalls die Infektionszahlen auf Stadtteilebene veröffentlicht haben (siehe Meldung der Rheinischen Post vom 16. April 21). Hier geht`s zu den Duisburger Ergebnissen.

Der Virus und sein Veedel

Soziale Ungleichheit prägt den Verlauf der Infektion. So lautete die Überschrift eines Artikels von P. Heisig und C. König des Wissenschaftszentrum Berlin für Sozialforschung. Die beiden Wissenschaftler wiesen bereits in einer frühen Phase der Pandemie darauf hin, dass Infektionsrisiko, Schwere des Krankheitsverlaufs und Sterberisiko vom sozialen Status abhängen würde, was auf sozioökonomisch und ethnisch ungleich verteilte Risikofaktoren zurückgeführt werden könne. Das RKI bekräftigt diese These erst kürzlich mit einer Veröffentlichung im März 2021 unter dem Titel Soziale Unterschiede in der COVID-19-Sterblichkeit während der zweiten Infektionswelle in Deutschland und stellte dabei fest:

  • Der Anstieg der COVID-19-Todesfälle fiel in sozial benachteiligten Regionen Deutschlands am stärksten aus – sowohl bei Männern als auch bei Frauen.
  • Im Dezember und Januar lag die COVID-19-Sterblichkeit in sozial stark benachteiligten Regionen um rund 50 bis 70 Prozent höher als in Regionen mit geringer sozialer Benachteiligung

Etwa zur selben Zeit veröffentlichte die Stadt Köln die Infektionsdaten pro Stadtviertel (‚Veedel‘) mit Stand 16.3.2021 (siehe dazu auch Blogbeitrag Innerstädtische Zonen für eine nachhaltige Niedriginzidenz). infas 360 hat diese Daten nun aufbereitet und mit weiteren ihr bundesweit zur Verfügung stehenden adressgenauen sozio-demographischen, ökonomischen und infrastrukturellen Informationen angereichert. Für den Kölner Datensatz wurden dazu u.a. folgende rund 100 Merkmale (Variablen) entsprechend pro ‚Veedel‘ ausgewählt und aggregiert:

  • Einwohnerdichte, Kaufkraft, Wirtschaftsbranchen, Zentralität, ÖPNV-Verbindung, Shop-Dichte, Wahleinstellungen, Migrationsanteil, Miet-und Kaufpreisspiegel, Gebäudestruktur, Altersstruktur, Schul- und Gesundheitseinrichtungen u.v.m.

Anschließend wurden die Pearson-Korrelationen als Maß für den linearen Zusammenhang zwischen der jeweiligen Variable und der Gesamtinzidenz je Stadtteil (Gesamtanzahl der Covid19-Fälle je 100.000 Einwohner) berechnet (siehe nachfolgendes Tabellenbeispiel).

Stadt Köln Covid19-Korrelationen
Auszug aus dem Datensatz und den jeweiligen Korrelationen zwischen den Variablen und der Inzidenz je Stadtviertel (‚Veedel). Grün je weniger/rot je mehr desto höhere Inzidenz.

Danach sind die Korrelationen mit den höchsten Koeffizienten (Auszug)

  • die Arbeitslosenquote
  • der Migrations- und Ausländeranteil
  • Zweitstimmenanteil sonstige Parteien und AfD, Bundestagswahl 2017
  • Kaufkraft je Einwohner (negativ)
  • Zweitstimmenanteil FDP, Bundestagswahl 2017 (negativ)
  • Anteil Hochschulabschlüsse (negativ)
  • Hochhäuser
  • Anteil Einwohner unter 18J.
  • Einwohnerdichte
  • Anteil Firmen in Finanz- und Versicherungsdienstleistungen (negativ)
  • Anteil Schüler
  • Kaufpreisspiegel (negativ)
  • ÖPNV-Verfügbarkeit
  • Freistehende Ein-/Zweifamilienhäuser (negativ)

Der komplette Datensatz inkl. aller Korrelationen steht für nicht-kommerzielle, wissenschaftliche Zwecke kostenlos zur Verfügung und kann für weitere Analysen eingesetzt werden (Lizenzbedingungen). Dazu einfach kurz eine Mail an corona-datenplattform@infas360.de senden.

Ausblick

In diesem Verfahren wurden die aggregierten Falldaten je Stadtteil nachträglich mit weiteren Informationen ebenfalls aggregierten Datensätzen angereichert. Deutlich präziser und damit aussagekräftiger werden die Analysen, wenn man vor dem Aggregationsprozess die gebäudescharfen Merkmale mit den pseudo-anonymisierten Adressen der Gesundheitsämter DSGVO-konform verknüpft und dann anonymisiert sowie räumlich aggregiert. Im Anschluss können mikrogeographische Analysen wie z.B. eine Predictive Risk Analytics (vorhersagende Risikobewertung) durchgeführt werden.

Analyse der Neuinfektionszahlen nach Stadtteilen in Duisburg

Auf Basis desselben Datenkranzes (Auswahl der Merkmale) wie in Köln wurden auch die Neuinfektionszahlen in Duisburg mit Datenstand 11. April 2021 untersucht. Folgende der ca. 100 Auswahlkriterien weisen die höchsten Korrelationen auf (Auszug):

  • Ausländeranteil
  • Anteil Personen mit höchstem schulischen Abschluss Fachhochschulreife oder Abitur (negativ)
  • Anteil Personen mit türkischem Migrationshintergrund
  • Migrationsanteil, allgemein
  • Anteil Personen mit höchstem beruflichen Abschluss Fachschule, Fachakademie oder Berufsakademie (negativ)
  • Anteil Personen mit höchstem beruflichen Abschluss  Fachhochschulabschluss oder Hochschulabschluss (negativ)
  • Kaufspiegel (negativ)
  • Kaufkraft pro Einwohner (negativ)
  • Mietspiegel (negativ)
  • Anteil Einwohner unter 18 Jahren
  • Anteil Schüler

Der komplette Datensatz inkl. aller Korrelationen steht für nicht-kommerzielle, wissenschaftliche Zwecke kostenlos zur Verfügung und kann für weitere Analysen eingesetzt werden (Lizenzbedingungen). Dazu einfach kurz eine Mail an corona-datenplattform@infas360.de senden.

Mit georeferenzierten Daten gegen Corona

Geoinformationen leisten seit vielen Jahren einen wichtigen Beitrag in der Bewältigung und Prävention von Krisen. Bekannte Beispiele hierfür sind der Einsatz von Geodaten bei der Prognose und Visualisierung großflächiger Naturkatastrophen oder in der feinräumigen Einsatzplanung von Rettungsdiensten, Feuerwehr und Polizei. Eine aktuell sehr populäre Anwendung ist das internationale Karten-Dashboard der John-Hopkins-Universität und des RKI, die das internationale, nationale und regionale Infektionsgeschehen von COVID-19 darstellen.

Die Basis der regionalen Zahlen für Deutschland liefern die Gesundheitsämter der Kreise. Die Durchschnittszahlen auf Kreisebene zeigen aber nicht auf, dass das Infektionsgeschehen tatsächlich deutlich lokaler ist. Die Zahlen auf Kreisebene sind – wie wir längst wissen – letztlich die Summen punktueller Ereignisse. Wenn man den Verlauf der Pandemie richtig darstellen, verstehen und prognostizieren will, muss man vor allem die sog. Hotspots und Superspreader identifizieren, die deutlich lokaler und eben wesentlich für die regionale Ausbreitung (Spreading) sind. Auch deren Eindämmung könnte bestmöglich erreicht werden, wenn man zu allen auftretenden Fällen Ort und Zeitpunkt der Infektion und der potenziellen Weitergabe (Kontakte) bestimmen würde.

Und genau hier setzt die Georeferenzierung an. Vereinfacht ausgedrückt ermöglicht sie die Darstellung von verschiedensten Aufenthaltsorten (Wohnen, Arbeiten, Freizeit, usw.) z. B. von Infizierten in einer zentralen digitalen Karte. Auf diese Art und Weise können alle relevanten Informationen gebündelt und in einen Gesamtkontext gebracht werden. Voraussetzung für die Georeferenzierung ist die Geocodierung. Bei der Geocodierung werden automatisiert postalische Adressen geprüft und ggfs. korrigiert, z.B. die Wohnadressen von auf COVID-19 getesteten Menschen oder die eines von ihnen besuchten Restaurants.

Diese postalischen Adressen werden dann mit x/y-Koordinaten angereichert und können so lokalisiert werden. Aber auch alle anderen aus der bisherigen Erfahrung mit der Pandemie als relevant identifizierten Orte wie Senioren- und Pflegeheime, Schulen, Kitas, Krankenhäuser, Schlachtereien, Ärzte, Apotheken, Arbeitsplätze, mobile Testmöglichkeiten usw. liegen als postalische Adressen sowie x/y-Koordinaten vor.

Durch diese gemeinsame Georeferenz könnte das gesamte lokale Infektionsgeschehen dargestellt, Zusammenhänge erkannt, Verläufe besser nachvollzogen und zukünftige Entwicklungen konkreter prognostiziert werden. Je präziser, desto besser. An dieser Stelle setzt der Datenschutz ein. Für diese metergenaue Georeferenz bedarf es deshalb entweder einer Einverständniserklärung der Betroffenen wie sie z.B. bei Installation der Corona-App abgefragt wird oder einer Pseudonimisierung bzw. einer Anonymiosierung in Form räumlicher Aggregation (Zusammenfassung mehrerer Fälle auf einer gemeinsamen geographischen Ebene).

Warum werden aber die Möglichkeiten des Einsatzes georeferenzierter Daten nicht ausgeschöpft? Wir sind weit davon entfernt, dass der Bürger z. B. auf einer aktuellen digitalen Karte erfährt, wo und wann sich was in seinem individuellen Umfeld hinsichtlich des Corona-Infektionsgeschehens abspielt. Dabei gibt es Vergleichbares längst, wie z. B. beim Einbruchsradar für NRW, wo man sehr genau nachschauen kann, wo das Risiko wie hoch ist.

Es scheint so, dass auch die Gesundheitsämter nicht wirklich datengetrieben sind. Entweder fehlen dem öffentlichen Bereich die Kapazitäten und/oder die Kompetenzen. Dabei wäre die Georeferenzierung der Coronadaten und die Integration für das Infektionsgeschehen relevanter Zusatzinformationen zweifelsfrei zeitnah möglich. Schließlich sind vergleichbare Daten und Anwendungen in anderen Bereichen, aber auch in der Wirtschaft längst im Einsatz.

Aus diesem Grund unterstützt infas 360 ab sofort aktiv alle Gesundheitsämter, indem die nutzerfreundliche Kartensoftware easymap office inkl. Geocodierung und Georaster kostenfrei zur Verfügung gestellt wird.

Sollten Sie Fragen zur Georeferenzierung, den Hotspot-Adressen oder der Software haben, dann kontaktieren Sie uns unter Consulting@infas360.de