Der Virus und sein Veedel

Zum Hauptartikel

Update 27. April 2021

Die Stadt Köln veröffentlicht erstmals die Daten auf Ebene der Stadtviertel wöchentlich aktualisiert in einer interaktiven Karte Stadt Köln – Corona-Fallzahlen nach Stadtteil (arcgis.com)

Update 23. April 2021

Analog zur Analyse der Kölner Daten vom 16.3.21 liegen nun auch die Ergebnisse der Stadt Duisburg vor, die ebenfalls die Infektionszahlen auf Stadtteilebene veröffentlicht haben (siehe Meldung der Rheinischen Post vom 16. April 21). Hier geht`s zu den Duisburger Ergebnissen.

Der Virus und sein Veedel

Soziale Ungleichheit prägt den Verlauf der Infektion. So lautete die Überschrift eines Artikels von P. Heisig und C. König des Wissenschaftszentrum Berlin für Sozialforschung. Die beiden Wissenschaftler wiesen bereits in einer frühen Phase der Pandemie darauf hin, dass Infektionsrisiko, Schwere des Krankheitsverlaufs und Sterberisiko vom sozialen Status abhängen würde, was auf sozioökonomisch und ethnisch ungleich verteilte Risikofaktoren zurückgeführt werden könne. Das RKI bekräftigt diese These erst kürzlich mit einer Veröffentlichung im März 2021 unter dem Titel Soziale Unterschiede in der COVID-19-Sterblichkeit während der zweiten Infektionswelle in Deutschland und stellte dabei fest:

  • Der Anstieg der COVID-19-Todesfälle fiel in sozial benachteiligten Regionen Deutschlands am stärksten aus – sowohl bei Männern als auch bei Frauen.
  • Im Dezember und Januar lag die COVID-19-Sterblichkeit in sozial stark benachteiligten Regionen um rund 50 bis 70 Prozent höher als in Regionen mit geringer sozialer Benachteiligung

Etwa zur selben Zeit veröffentlichte die Stadt Köln die Infektionsdaten pro Stadtviertel (‚Veedel‘) mit Stand 16.3.2021 (siehe dazu auch Blogbeitrag Innerstädtische Zonen für eine nachhaltige Niedriginzidenz). infas 360 hat diese Daten nun aufbereitet und mit weiteren ihr bundesweit zur Verfügung stehenden adressgenauen sozio-demographischen, ökonomischen und infrastrukturellen Informationen angereichert. Für den Kölner Datensatz wurden dazu u.a. folgende rund 100 Merkmale (Variablen) entsprechend pro ‚Veedel‘ ausgewählt und aggregiert:

  • Einwohnerdichte, Kaufkraft, Wirtschaftsbranchen, Zentralität, ÖPNV-Verbindung, Shop-Dichte, Wahleinstellungen, Migrationsanteil, Miet-und Kaufpreisspiegel, Gebäudestruktur, Altersstruktur, Schul- und Gesundheitseinrichtungen u.v.m.

Anschließend wurden die Pearson-Korrelationen als Maß für den linearen Zusammenhang zwischen der jeweiligen Variable und der Gesamtinzidenz je Stadtteil (Gesamtanzahl der Covid19-Fälle je 100.000 Einwohner) berechnet (siehe nachfolgendes Tabellenbeispiel).

Stadt Köln Covid19-Korrelationen
Auszug aus dem Datensatz und den jeweiligen Korrelationen zwischen den Variablen und der Inzidenz je Stadtviertel (‚Veedel). Grün je weniger/rot je mehr desto höhere Inzidenz.

Danach sind die Korrelationen mit den höchsten Koeffizienten (Auszug)

  • die Arbeitslosenquote
  • der Migrations- und Ausländeranteil
  • Zweitstimmenanteil sonstige Parteien und AfD, Bundestagswahl 2017
  • Kaufkraft je Einwohner (negativ)
  • Zweitstimmenanteil FDP, Bundestagswahl 2017 (negativ)
  • Anteil Hochschulabschlüsse (negativ)
  • Hochhäuser
  • Anteil Einwohner unter 18J.
  • Einwohnerdichte
  • Anteil Firmen in Finanz- und Versicherungsdienstleistungen (negativ)
  • Anteil Schüler
  • Kaufpreisspiegel (negativ)
  • ÖPNV-Verfügbarkeit
  • Freistehende Ein-/Zweifamilienhäuser (negativ)

Der komplette Datensatz inkl. aller Korrelationen steht für nicht-kommerzielle, wissenschaftliche Zwecke kostenlos zur Verfügung und kann für weitere Analysen eingesetzt werden (Lizenzbedingungen). Dazu einfach kurz eine Mail an corona-datenplattform@infas360.de senden.

Ausblick

In diesem Verfahren wurden die aggregierten Falldaten je Stadtteil nachträglich mit weiteren Informationen ebenfalls aggregierten Datensätzen angereichert. Deutlich präziser und damit aussagekräftiger werden die Analysen, wenn man vor dem Aggregationsprozess die gebäudescharfen Merkmale mit den pseudo-anonymisierten Adressen der Gesundheitsämter DSGVO-konform verknüpft und dann anonymisiert sowie räumlich aggregiert. Im Anschluss können mikrogeographische Analysen wie z.B. eine Predictive Risk Analytics (vorhersagende Risikobewertung) durchgeführt werden.

Analyse der Neuinfektionszahlen nach Stadtteilen in Duisburg

Auf Basis desselben Datenkranzes (Auswahl der Merkmale) wie in Köln wurden auch die Neuinfektionszahlen in Duisburg mit Datenstand 11. April 2021 untersucht. Folgende der ca. 100 Auswahlkriterien weisen die höchsten Korrelationen auf (Auszug):

  • Ausländeranteil
  • Anteil Personen mit höchstem schulischen Abschluss Fachhochschulreife oder Abitur (negativ)
  • Anteil Personen mit türkischem Migrationshintergrund
  • Migrationsanteil, allgemein
  • Anteil Personen mit höchstem beruflichen Abschluss Fachschule, Fachakademie oder Berufsakademie (negativ)
  • Anteil Personen mit höchstem beruflichen Abschluss  Fachhochschulabschluss oder Hochschulabschluss (negativ)
  • Kaufspiegel (negativ)
  • Kaufkraft pro Einwohner (negativ)
  • Mietspiegel (negativ)
  • Anteil Einwohner unter 18 Jahren
  • Anteil Schüler

Der komplette Datensatz inkl. aller Korrelationen steht für nicht-kommerzielle, wissenschaftliche Zwecke kostenlos zur Verfügung und kann für weitere Analysen eingesetzt werden (Lizenzbedingungen). Dazu einfach kurz eine Mail an corona-datenplattform@infas360.de senden.

Nutzung innerstädtischer Covid19-Zonen für eine nachhaltige Niedriginzidenz

Durch räumliche Lokalisierung vorhandener Falldaten können innerstädtische Zonen nach Inzidenz und Risikofaktoren bewertet und klassifiziert werden. Als sogenannte Ampelkarten (rote, gelbe und grüne Zonen) in Dashboards bringen sie für Amt und Bürger die notwendige Transparenz ins Infektionsgeschehen, um unmittelbar und maßgeblich handeln zu können.

  1. Die Basis: Intrakommunale Zonen und deren Inzidenzbewertung

Im höchsten Maße zweckdienlich bei der räumlichen Unterteilung der Gemeinde in geographische Zonen ist die Nutzung der vorhandenen, intrakommunalen Gliederung auf Basis der flächendeckenden, amtlichen Siedlungsblöcke und Stadtviertel bzw. Ortsteile.

Auf dieser Basis kann jede Wohnadresse eindeutig einem amtlichen Siedlungsblock und damit einer Zone zugeordnet werden. Dieses bundesweit vorhandene Adressregister nach intrakommunalen Strukturen nennt sich auch postalisch-amtliches Gliederungssystem, kurz PAGS, wozu auch die notwendigen aktuellen Einwohnerzahlen sowie zahlreiche Strukturdaten vorliegen.

Durch eine DSGVO-konforme Verknüpfung, der sog. Geocodierung der Falldaten über die Adressen, können die Infektionsdaten sofort den entsprechenden Zonen zugeordnet werden. Im Ergebnis liegen so unmittelbar feinräumige, deutlich genauere Inzidenzwerte vor, nach denen die Zonen bewertet und klassifiziert werden können. Infektionscluster werden so sofort sichtbar.

Neben tagesaktueller und wöchentlicher Zonen-Inzidenzen können durch Nutzung weiterer mikrogeographischer Daten wie Gebäudetyp, -nutzung, Haushaltsgrößen, Migrationsanteile usw. geostatistisch Prognosewerte (Predicitve Risk Analytics) ermittelt werden. Diese dienen der zukünftigen Risikoeinschätzung und können auch außerhalb des Krisenstabs kommuniziert werden.

Im Ergebnis entsteht eine neuartige, intrakommunale Transparenz des aktuellen sowie zukünftigen Infektionsgeschehens auch für den Bürger, was die Chance zum antizipativen Verhalten und persönlichen Change- und Motivationsmanagement bietet.

2. Die Umsetzung: In wenigen Stunden zur Ampelkarte

Mit entsprechender Unterstützung der IT-Administration des Amts wird der für die Pandemiebekämpfung kostenlose PAGS-Coder installiert. Dieser ordnet in wenigen Minuten mehrere Tausend Fallzahlen den entsprechenden Zonen mittels Zuspielung aller vorhandenen Zonenschlüssel (Geoschlüssel) zu. Der kostenlose PAGS-Coder ist eine Servertechnologie, die lokal installiert wird und verfügt über zahlreiche, offene Schnittstellen, siehe auch http://89.31.1.14/PAGSCoder2020/ So wird u.a. gewährleistet, dass die Adressen innerhalb der Gemeinde verbleiben. Die Daten können danach sofort ausgewertet, klassifiziert und via Web dargestellt werden (Ampelkarte).

3. Ad-Hoc: Risikobewertung für eine nachhaltige Niedriginzidenzstrategie

Durch die offenen Schnittstellen des PAGS-Systems können neue Adressen dynamisch bzw. vollautomatisiert mit der jeweils aktuellen Zonen-Inzidenz angereichert werden. So kann beispielsweise eine Adress-Registrierung durch einen Besucher in einem Einkaufs-Shop sofort mit der zugehörigen Zonen-Inzidenz abgeglichen werden und folgernd ein unterschiedliches Einlassverfahren angewendet werden z.B. grün = Wochentest, rot = Tagestestung).

4. Fallbeispiel Köln

Auf der Webseite Corona-Virus in Köln – Entwicklung der Fallzahlen – Stadt Köln (stadt-koeln.de) findet man innerstädtische Angaben der Stadt Köln mit den Fallzahlen und aktiven Fällen zum Stichtag 16.3.2021 pro Stadtteil (86). Die unterschiedliche Verteilung auftretender Fälle (hier pro 100.000 Einwohner, Quelle infas 360) je Stadtteil (blaue Punkte) wird offensichtlich.

Hier die tabellarischen Daten dargestellt als Ampelkarte am Beispiel der aktiven Fälle pro 100.000 Einwohner je Stadtteil zum 16. März 2021.

Die Daten der Stadtteile können nun nach beliebigen Strukturmerkmalen wie z.B. Bebauung, Kaufkraft, Arbeitslosenrate, Fußgängerfrequenzen, Shopdichte, ÖPNV usw. ausgewertet werden. Auch eine feinräumigere Auswertung pro Siedlungsblock je Stadtteil wäre möglich.

 

Evidenzbasiertes Handeln durch Data Science – infas 360 auf der DAIS 2021

Am 24. und 25. März findet der Data Analytics & Insights Salon (DAIS) als internationales, virtuelles Event statt. Neben spannenden Vorträgen auf dem Kongress gibt es auch eine Lounge, in der sich Besucher die Angebote der Aussteller anschauen und mit ihnen interagieren können. In einem dritten Bereich wird es Möglichkeiten zum digitalen Networking geben.

Infas 360 ist sowohl mit einem virtuellen Messestand als auch mit einem Vortrag vertreten. Frau Dr. Barbara Wawrzyniak, Leiterin Daten und Analysen, wird am 25.03. um 13:20 Uhr am Beispiel der Corona-Datenplattform erläutern, warum eine solide Datenbasis sowie fachkompetente Analysen wichtig für die Bekämpfung der Pandemie sind. In der Lounge finden Besucher dann noch weitere Anwendungsbeispiele, welche die Bedeutung von Data Science für evidenzbasiertes Handeln verdeutlichen. So können sich Besucher unterschiedlichster Branchen beispielsweise über die Gebäude-Sanierungsquote oder die Nachhaltigkeitstypen informieren.

Nähere Informationen finden Sie hier.

Eine kostenlose Anmeldung zum Event ist bis zum 22.03. möglich.

Sollten Sie weiterführende Fragen haben, können Sie jederzeit unser Consulting-Team unter consulting@infas360.de kontaktieren.

Die Coronakrise ist eine Datenkrise – Vortrag auf dem 9. Bonner GeoDialog

Unser Talk-Tipp im Rahmen des  9. GeoDIALOG als virtuelle Netzwerkveranstaltung der geobusiness region bonn:

„Die Coronakrise ist eine Datenkrise“

Der Vortrag von Michael Herter, Geschäftsführer von infas 360, beschäftigt sich mit den verfügbaren aber auch fehlenden Daten, um die Pandemie überhaupt zu verstehen und somit (auch) erfolgreich bekämpfen zu können.

Hören Sie einem spannenden Thema zu und talken Sie mit, am 11.3. von 16-18h. Der GeoDialog steht dabei unter dem Motto „Geoinformationen in Pandemien“. 

Weitere Vorträge von Friedrich Fuß, Chief Digital Officer der Stadt Bonn zu Smart City und Christoph Höser vom Institut für Hygiene & Public Health am UKB über Karten in der Risikokommunikation. Weitere Infos finden Sie hier.

Sollten Sie weiterführende Fragen haben, können Sie jederzeit unser Consulting-Team unter consulting@infas360.de kontaktieren.

Einladung zum digitalen Talk: Nutzen von Geoinformationen in der Pandemie

Der 2. GeoIN-Talk als neues, digitales Austausch- und Informationsangebot des Deutschen Dachverbands für Geoinformation, kurz  DDGI, präsentiert dieses Mal ein brandaktuelles Thema:

„Geoinformation und Geo-Intelligence in der Pandemie“

Schwerpunkte bilden aktuelle Anwendungen sowie potenzieller Nutzen raumbezogener Daten im Kampf gegen den Coronavirus, um evidenzbasierte Entscheidungen, z.B. gezielteres Handeln durch schnellere und zuverlässigere Ermittlung und Verfolgung von Infektionsketten an Orten. Die Stimmen, die einen deutlich breiteren Einsatz von Geoinformationen und Location Intelligence fordern, werden immer lauter.

Talken Sie kostenlos mit, am 24.2. von 10-12h auf der Digitalen Plattform des DDGI

Als Impuls dienen derzeit folgende drei Kurzbeiträge:

Dashboards, Plattformen und Dateninfrastrukturen –
Selbstzweck oder gesellschaftlicher Nutzen?
Gerd Buziek, Business Relations Executive, Esri Deutschland GmbH

Die neue Corona-Datenplattform im Auftrag des
BMWI – Basis für effiziente Wissensgenerierung zur
Pandemie in Deutschland – Datenanalysen und DataScience
Michael Herter, Geschäftsführer infas 360 GmbH

Überblick zu Mobilitätsanalysen auf Basis von Mobilfunkdaten
Dr. Vorgrimler und Younes Saidani, Destatis – Statistisches Bundesamt

Sollten Sie weiterführende Fragen haben, können Sie jederzeit unser Consulting-Team unter consulting@infas360.de kontaktieren.

 

Eine wichtige Kennziffer fehlt in der Pandemie: Die Infektionen pro Haushalt

Laut Destatis lebten in Deutschland 2019 rund 82,8 Mio. Menschen in 41,5 Mio. Haushalten. 21,2% davon sind Einpersonenhaushalte. 78,8% sind folglich Mehrpersonenhaushalte, z.B. Ehe- oder Lebensgemeinschaften mit oder ohne Kinder. In dieser Gruppe der Mehrpersonen-Haushalte beträgt die mittlere Haushaltsgröße etwa 2,7 Personen (vgl. nachfolgende Tabelle, Quelle Destatis).

Haushaltsgröße Haushalte Haushalts­mitglieder
1 000 % 1 000 %
Insgesamt 41 506 100,0 82 785 100,0
Einpersonen­haushalte 17 557 42,3 17 557 21,2
2 – Personen­haushalte 13 781 33,2 27 562 33,3
3 – Personen­haushalte 4 952 11,9 14 856 17,9
4 – Personen­haushalte 3 783 9,1 15 130 18,3
Haushalte mit 5 Personen und mehr 1 434 3,5 7 680 9,3

So weit der Durchschnitt für Deutschland. Für präzise Analysen, Planungen und Prognosen in Wirtschaft und Wissenschaft muss diese Kennziffer allerdings deutlich feinräumiger sein. Gerade die Haushaltsanzahl und -größen an bestimmten Orten sind häufig elementar für entsprechende Untersuchungen. Aus diesem Grund berechnet und aktualisiert infas 360 jedes Jahr für Bundesinstitute und Unternehmen in einem aufwendigen Verfahren die Anzahl der Haushalte und Einwohner sogar bis auf Einzelhausebene bzw. pro Adresse (ca. 20 Mio. Wohnadressen, Whitepaper Haushalte Datenbeschreibung Haushalte PAGS2020 (1)).

Deren Bedeutung belegt auch die aktuelle Corona-Krise. Schließlich kann man Presseberichten entnehmen, dass auch Großfamilien das Infektionsgeschehen treiben. Erstaunlicherweise aber werden Fälle nach Haushaltsanzahl oder -größe gar nicht ausgewiesen – obwohl sie dieses Phänomen doch verifizieren könnten. Die Frage lautet: Warum ist das so? Eine Nachfrage dazu beim Bonner Gesundheitsamt führte zur Antwort, dass „kurzfristige Auswertungen von komplexen Vorgängen derzeit nicht leistbar seien“.

Dabei könnte die Verwendung der Haushaltsgröße in der Coronakrise weitere wichtige Kennziffern liefern: Wird eine Person positiv auf Covid19 getestet und entsprechend eine Quarantäne verhängt, so betrifft das automatisch alle im selben Haushalt lebenden Personen. Auch diese werden dann getestet und fallen ggfs. auch unter die Quarantänemaßnahmen. Daraus ließe sich z. B. eine höchst interessante Kennziffer für die Pandemie ableiten: Das Verhältnis der Anzahl Positivtestungen zur Anzahl aller Testungen (= Anzahl der Haushaltsmitglieder). Eine weitere wichtige Kennziffer ergäbe sich aus der Anzahl der Covid19-Infizierten (Stand RKI 02.08.2020, 209.893) pro Haushalt bzw. Haushaltsgröße. Läge z. B. dieser Wert über dem anfangs zitierten Mittelwert von 2,7 Mitgliedern je Haushalt in Mehrpersonenhaushalten, dann hieße das, dass überdurchschnittlich viele Familien betroffen wären.

Sie haben weitere Fragen zu den Haushalten oder deren Größen, dann kontaktieren Sie einfach unser Consulting-Team unter Consulting@infas360.de 

Infektions-Hotspot in Verl: Wohnen auf engstem Raum bei sehr hohem Ausländeranteil.

Was Gebäudedaten und Mikrogeographie über die in Quarantäne gesetzten Wohnhäuser im Arbeiterviertel von Verl noch verraten

Seit ein paar Tagen ist der Stadtteil Sürenheide in Verl bei Gütersloh in aller Munde. Wurden doch genau dort im Zuge der neu festgestellten Coronainfektionen von über 1.500 Mitarbeitern (Stand 23.6.2020) der Firma Tönnies rund 670 Menschen unter Quarantäne gesetzt.

Laut Presse geht es dabei um mehrere Wohngebäude im Zollenhausweg 1-29, der Grillenstraße 1-5 und 46-48 (50) sowie der Libellenstr. 39-41, übersichtlich dargestellt im dem Artikel „Arbeiterviertel in Verl abgeperrt„.

Über die postalischen Adressen können zu den jeweiligen Wohnblocks zahlreiche Zusatzinformationen aus der Gebäudedatenbank CASA von infas 360 abgefragt werden. Die CASA-Datenbank wird auf Basis aller amtlich verfügbaren Daten entwickelt und mit weiteren Geo- und Wirtschaftsdaten kombiniert, um möglichst tiefgreifende Insights zu jedem der rund 22,5 Mio. Gebäude in Deutschland zu ermöglichen (Whitepaper zu den Basisdaten). Eine erste Erkenntnis: Von den in der Presse 670 betroffenen Personen wohnen laut CASA-Datenbank 683.

Ziehen wir weiterhin beispielhaft die Häuser des im Quarantänebereich liegenden Bereiches Grillenstr. 46-50 heran, so lässt sich erkennen, dass sich die identische Bebauung in der parallel verlaufenden Libellenstraße 1-5 wiederfindet – es handelt sich um eine Zwillingsbebauung. In beiden Bereichen reihen sich jeweils 3 weitere große Wohngebäude an, weshalb sie als „Mehrparteienhaus en Block“ klassifiziert sind. Dies ist einer von 15 Gebäudebasistypen der CASA-Datenbank auf Basis der amtlichen 3D-Daten. Den Daten lässt sich auch entnehmen, dass die Gebäude versetzt aneinander gereiht sind und mit 10, 18 und 23 Metern bzw. 3, 5 und 7 Etagen unterschiedliche Bauhöhen und Wohnkapazitäten aufweisen (siehe dazu auch das aktuelle Gebäudefoto von P. Menzel). Direkt anliegend befinden sich zahlreiche Garagen, was nicht verwundert, denn die ÖPNV-Anbindung ist hier relativ schlecht und die nächste Apotheke ist 1,8 km entfernt.

In den größten Gebäuden im Quarantänebereich, Grillenstr. 48-50 und Libellenstr. 1-3, wohnen laut Deutscher Post und Analyse von infas 360 offiziell jeweils rund 100 Einwohner in 21 Haushalten. Der Ausländeranteil liegt hier bei 84% und der Anteil der bis 18 Jährigen bei knapp 10%. Die mittlere Wohnfläche einer Wohneinheit liegt zwischen 66 und 80 qm und kostet (Kaufpreis) geschätzt zwischen 75.000 und 100.000 Euro. Das Haushaltsnettoeinkommen wird auf unter 1.000 Euro monatlich berechnet. Gewerbe im Haus sind nicht verzeichnet.

Insgesamt beinhaltet die CASA-Datenbank rund 1.000 Merkmale zu Gebäude- und Wohnumfeld. Von der Dachflächenausrichtung über den Gasanschluss und Straßentyp bis hin zum nächst gelegenen fachspezifischen Arzt oder der Entfernung zu Krankenhäusern mit Intesivbetten inkl. deren aktueller Auslastung mit und ohne Beatmungsgerät (siehe Lösung www.trackyourbed.com ).

Auch in den aktuellen Corona-Zeiten zeigt sich wieder einmal, wie unterschiedlich die lokale Ausprägung von Phänomenen wie dem Infektionsgeschehen sein kann. Um die Gründe dafür besser erkennen, verstehen und eine Entwicklung prognostizieren zu können, bedarf es einer mehrdimensionalen Datenverknüpfung, die so nur mit Geoinformationen möglich ist. Zur besseren Corona-Risikoabschätzung hat infas 360 in den vergangenen Wochen dafür eigens die Datenbank CORA entwickelt, die neben den aktuellsten Fallzahlen zahlreiche weitere Spezialdaten beinhaltet (siehe Blogbeitrag CORA: Bundesweite Datenbank zur Corona-Risikoabschätzung).

Ein weiterer Vorteil: Gebäudedaten und Daten auf Gebäudeebene stellen zunächst immer sachbezogene Informationen dar und sind somit keine personenbezogenen Daten (siehe datenschutzrechtlicher Hinweis)

Sollten Sie weitere Fragen zur CASA-Datenbank haben, dann kontaktieren Sie unser Consulting-Team unter Consulting@infas360.de