Soziale Ungleichheit prägt den Verlauf der Infektion. So lautete die Überschrift eines Artikels von P. Heisig und C. König des Wissenschaftszentrum Berlin für Sozialforschung. Die beiden Wissenschaftler wiesen bereits in einer frühen Phase der Pandemie darauf hin, dass Infektionsrisiko, Schwere des Krankheitsverlaufs und Sterberisiko vom sozialen Status abhängen würde, was auf sozioökonomisch und ethnisch ungleich verteilte Risikofaktoren zurückgeführt werden könne. Das RKI bekräftigt diese These erst kürzlich mit einer Veröffentlichung im März 2021 unter dem Titel Soziale Unterschiede in der COVID-19-Sterblichkeit während der zweiten Infektionswelle in Deutschland und stellte dabei fest:
- Der Anstieg der COVID-19-Todesfälle fiel in sozial benachteiligten Regionen Deutschlands am stärksten aus – sowohl bei Männern als auch bei Frauen.
- Im Dezember und Januar lag die COVID-19-Sterblichkeit in sozial stark benachteiligten Regionen um rund 50 bis 70 Prozent höher als in Regionen mit geringer sozialer Benachteiligung
Etwa zur selben Zeit veröffentlichte die Stadt Köln die Infektionsdaten pro Stadtviertel (‚Veedel‘) mit Stand 16.3.2021 (siehe dazu auch Blogbeitrag Innerstädtische Zonen für eine nachhaltige Niedriginzidenz). infas 360 hat diese Daten nun aufbereitet und mit weiteren ihr bundesweit zur Verfügung stehenden adressgenauen sozio-demographischen, ökonomischen und infrastrukturellen Informationen angereichert. Für den Kölner Datensatz wurden dazu u.a. folgende rund 100 Merkmale (Variablen) entsprechend pro ‚Veedel‘ ausgewählt und aggregiert:
- Einwohnerdichte, Kaufkraft, Wirtschaftsbranchen, Zentralität, ÖPNV-Verbindung, Shop-Dichte, Wahleinstellungen, Migrationsanteil, Miet-und Kaufpreisspiegel, Gebäudestruktur, Altersstruktur, Schul- und Gesundheitseinrichtungen u.v.m.
Anschließend wurden die Pearson-Korrelationen als Maß für den linearen Zusammenhang zwischen der jeweiligen Variable und der Gesamtinzidenz je Stadtteil (Gesamtanzahl der Covid19-Fälle je 100.000 Einwohner) berechnet (siehe nachfolgendes Tabellenbeispiel).

Danach sind die Korrelationen mit den höchsten Koeffizienten (Auszug)
- die Arbeitslosenquote
- der Migrations- und Ausländeranteil
- Zweitstimmenanteil sonstige Parteien und AfD, Bundestagswahl 2017
- Kaufkraft je Einwohner (negativ)
- Zweitstimmenanteil FDP, Bundestagswahl 2017 (negativ)
- Anteil Hochschulabschlüsse (negativ)
- Hochhäuser
- Anteil Einwohner unter 18J.
- Einwohnerdichte
- Anteil Firmen in Finanz- und Versicherungsdienstleistungen (negativ)
- Anteil Schüler
- Kaufpreisspiegel (negativ)
- ÖPNV-Verfügbarkeit
- Freistehende Ein-/Zweifamilienhäuser (negativ)
Der komplette Datensatz inkl. aller Korrelationen steht frei zur Verfügung und kann für weitere Analysen eingesetzt werden. Dazu einfach kurz eine Mail an corona-datenplattform@infas360.de senden.
Ausblick
In diesem Verfahren wurden die aggregierten Falldaten je Stadtteil nachträglich mit weiteren Informationen ebenfalls aggregierten Datensätzen angereichert. Deutlich präziser und damit aussagekräftiger werden die Analysen, wenn man vor dem Aggregationsprozess die gebäudescharfen Merkmale mit den pseudo-anonymisierten Adressen der Gesundheitsämter DSGVO-konform verknüpft und dann anonymisiert sowie räumlich aggregiert. Im Anschluss können mikrogeographische Analysen wie z.B. eine Predictive Risk Analytics (vorhersagende Risikobewertung) durchgeführt werden.