Statistiken zu COVID-19 in Deutschland (beta)
Dies ist eine beta-Version der
regulären Version der Web-Seite. Derzeit besteht kein
Unterschied zwischen den beiden Versionen.
Dieses Projekt stellt Statistiken sowie zugehörige Graphiken und Datensätze
zur Ausbreitung von
COVID-19 in Deutschland
bereit und zwar konkret zu folgenden Bereichen:
Die Anzahl der jeweiligen Statistiken in den beiden Bereichen ist
unterschiedlich. Sie kann in Zukunft noch wachsen. Die Statistiken werden
in der Regel täglich bis 7:30 Uhr aktualisiert.
Einen guten Eindruck der aktuellen Situation und ihrer kurzfristigen
Entwicklung für Deutschland insgesamt vermittelt die
Graphik der
Zusammenfassung der Seite zur Einschätzung
der Situation und ihrer Entwicklung, ergänzt durch die Statistik der
absoluten
7-Tage-Summen der neuen Verstorbenen für die letzten 4 Wochen. Eine
Einschätzung der mittelfristigen Entwicklung vermittelt die Statistik vom
7-Tage-Faktor
der neuen Infizierten. Der
7-Tage-Faktor ähnelt der
häufig genannten
effektiven Reproduktionszahl
(auch Nettoreproduktionszahl genannt). Außerdem gibt es eine
Abschätzung der Krankheitsschwere wichtiger
SARS-CoV-2 Varianten in Deutschland.
Neuigkeiten und aktuelle Hinweise
- 09.03.2025
- Historische Statistiken für die neu Infizierten und die neu
Verstorbenen aus den letzten drei Monaten aufgenommen.
- 29.12.2024
- Die Seiten für das Jahr 2025 aktualisiert, z.B. Seiten für die
historischen Statistiken erstellt und die Seite mit Sondereinflüssen
(aufgrund von Feiertagen) ergänzt.
- 05.10.2024
- Den Zeitraum vom 01.07.2023 bis zum 01.05.2024 als fünfte Phase der
Ausbreitung von COVID-19 in Deutschland definiert. Der Zeitraum seit
dem 01.05.2024 ist damit die aktuelle Phase.
- 05.10.2024
- Die historischen Statistiken werden jetzt unterteilt nach Jahren
und Phasen bereitgestellt.
- 04.10.2024
- Nach einer längeren Zeit ohne tägliche Updates stehen diese jetzt
wieder zur Verfügung.
Zielsetzung
Das Ziel des Projekts ist es, zuverlässige und aussagekräftige
Informationen zu Stand und Entwicklung der Ausbreitung von
COVID-19, der
Krankheit verursacht vom Virus
SARS-CoV-2,
in Deutschland zu veröffentlichen. Dazu werden mittels der
offiziellen Fallzahlen
des Robert Koch-Instituts (RKI)
Statistiken mit zugehörigen Graphiken sowie Datensätze bereitgestellt und
täglich aktualisiert. Diese beziehen sich alle auf Fälle von
neu infizierten oder verstorbenen Personen, da die anfänglich stark
verbreiteten kumulativen Darstellungen aus meiner Sicht nur eine geringe
Aussagekraft haben. Aufgrund der Nachmeldungen von Fällen zu vorherigen
Tagen werden zu den neu infizierten Personen die Werte der letzten drei
Tage und zu den neu verstorbenen Personen die Werte der letzten drei Wochen
nicht berücksichtigt.
Angeregt zu diesem Projekt wurde ich durch zahlreiche wenig relevante,
teilweise irreführende oder sogar falsche Aussagen zur Entwicklung
der Ausbreitung von COVID-19 in Deutschland, durchaus auch von
anerkannten Organisationen und Medien. Eine zusätzliche Anregung habe
ich durch einen Artikel
erhalten, der sich kritisch mit der Wirksamkeit der am 22. März 2020
beschlossenen Maßnahmen
zur Eindämmung von COVID-19 in Deutschland befasst. Zur Aufnahme speziell
der Statistiken zum 7-Tage-Faktor
angeregt wurde ich durch einen
Artikel
zu den Reproduktionszahlen.
Interpretation und Verwendung der Ergebnisse
Zur Interpretation der Daten ist allgemein anzumerken, dass eine
gleichbleibende Anzahl neu infizierter Personen zu einem zu linearem
Anstieg der Gesamtanzahl an infizierten Personen (zu sehen in einer
kumulativen Darstellung) aber (zumindest mittelfristig) zu einer
gleichbleibenden Anzahl erkrankter Personen führt (da früher erkrankte
Personen nach einiger Zeit genesen oder zum geringen Teil versterben).
Eine abnehmende Anzahl neu infizierter Personen führt (zumindest
mittelfristig) zu einer abnehmenden Anzahl erkrankter Personen.
Die Entwicklung wird gut dargestellt durch die Statistiken zum
7-Tage-Faktor und durch die
vom RKI berechnete
effektive Reproduktionszahl,
die beide bei einer abnehmenden Anzahl neu infizierter Personen kleiner
als Eins werden. Während es sich bei der effektiven Reproduktionszahl um
eine Schätzung für einen (insbesondere aktuellen) Tag handelt,
handelt sich sich beim 7-Tage-Faktor um eine exakte Berechnung mittels der
dem RKI gemeldeten Zahlen. Der 7-Tage-Faktor wird jedoch durch
besondere Ereignisse im
Meldeverfahren teilweise relativ stark beeinflusst. Aufgrund des
Zeitverzugs zwischen dem Beginn einer Erkrankung (dem Auftreten erster
Symptome) und deren Meldung an das RKI beschreibt der 7-Tage-Faktor die
Entwicklung der Erkrankungen mit einer Verzögerung von etwa ein bis zwei
Wochen.
Es sind aktuelle Statistiken zu den letzten 4 Wochen, zur aktuellen
Phase und zum Gesamtzeitraum vorhanden, die täglich aktualisiert
werden. Außerdem sind Statistiken zu den vergangenen Monaten und Jahren
sowie zu den vergangenen Phasen vorhanden. Als Phasen wurden folgende
Zeiträume festgelegt:
- Phase: 09.03.2020 - 15.06.2020
- Phase: 15.06.2020 - 01.09.2020
- Phase: 01.09.2020 - 01.07.2021
- Phase: 01.07.2021 - 01.07.2023
- Phase: 01.07.2023 - 01.05.2024
Seit dem 01.05.2024 läuft also die sechste Phase.
Jede Graphik, die auf diesen Seiten dargestellt ist, kann auch als
pdf-Datei und als ASCII-Tabelle heruntergeladen werden. Verweise dazu
sind unter jeder Graphik angegeben. Die Graphiken stehen unter der Lizenz
CC BY-ND 4.0,
die Daten unter der auch vom RKI verwendeten Lizenz
dl-de/by-2-0.
Andere Seiten mit Statistiken
Im folgenden sind einige Seiten mit weiteren Statistiken angegeben
(persönliche Auswahl). Die kumulativen Darstellungen dienen dabei aus meiner
Sicht weniger der Beurteilung in einer Region als dem Vergleich zwischen
Regionen (auch wenn die Verfahren der Zählung von Fällen in verschiedenen
Regionen unterschiedlich sein können), unter Berücksichtigung der Anzahl
der in einer Region lebenden Personen.
- Das Pandemieradar
vom RKI mit den wichtigsten Zahlen zu COVID-19 in Deutschland.
- Das Dashboard vom RKI zur
Verbreitung von COVID-19 auf der Ebene der Bundesländern und Landkreise
sowie eine Tabelle mit den Fallzahlen zu den Bundesländern.
- Die Themen-Seite vom Deutschlandfunk
bietet einige sehr interessante Graphiken, auch zum internationalen
Vergleich.
- Die Darstellung der COVID-19 Entwicklung in Deutschland, in Europa und
weltweit über die Seite
CoronaMaps des
Institut für Statistik der LMU München.
- Das Dashboard der Johns
Hopkins Universität zur weltweiten Verbreitung.
- Die Karte der Berliner Morgenpost, mit der
Möglichkeit, sich über einen Schieberegler auch Daten der Vergangenheit
anzeigen zu lassen.
- Wochenweise Auswertungen der in Krankenhäusern wegen COVID-19 neu
behandelten (hospitalisierten) Personen finden sich jeweils am Dienstag
in den
täglichen Situationsberichten des RKI
in der ersten Tabelle im Abschnitt Klinische Aspekte in
der Spalte Anzahl hospitalisiert.
- Eine wöchentlich aktualisierte Statistik
mit etwa vier Wochen Verzug zur Anzahl der Personen, im Jahr 2020 im
Vergleich zum Durchschnitt der Jahre 2016 bis 2019 statistisch mehr
verstorben sind (Übersterblichkeit genannt), verglichen mit
den Sterbefall-Zahlen nach Sterbewoche vom RKI.
- Statistiken zur Mobilität der Bevölkerung in den letzten Wochen erzeugt
von Apple und von
Google.
Es ist zu beachten, dass bei einigen Statistiken auch Modellannahmen
eingehen, z.B. bei der Anzahl der Personen, die zu einem bestimmten
Zeitpunkt wieder genesen sind.
Programme zur Erzeugung der Statistiken
Die Programme zur Erzeugung der Statistiken, Graphiken und Tabellen sind
verfügbar über das Subversion Repository
der
Projekt-Verwaltung
und stehen unter der Lizenz GPLv3.
Dort sind auch eine Mailingliste
und ein Ticket-System
vorhanden, über die Anregungen gegeben und Fehler gemeldet werden könnnen.
Zur Ausführung der Programme sind folgende weitere Programme bzw.
Programm-Pakete erforderlich:
Die entsprechenden Programme sind z.B. in einer aktueller Version des
von mir verwendeten Fedora Linux
enthalten. Weitere Hinweise stehen in der
ReadMe-Datei
zum Projekt.
Danksagung
Ich danke dem Robert Koch Institut
und dem Unternehmen Esri
für die Bereitstellung der Daten, die für dieses Angebot verwendet werden,
unter der Lizenz dl-de/by-2-0.
Außerdem danke ich den Entwicklern der im vorhergehenden Abschnitt
genannten Software sowie des von mir verwendeten Subversion-Clients
SmartSVN und der Bibliothek
Weka mit dem
Verfahren zur linearen Regression für deren kostenlose Bereitstellung.
Anregungen und Fragen zu diesem Angebot sind willkommen.