Die Fall-Tabelle vom RKI
Diese Seite ist Teil eines Angebots von
Statistiken zur Ausbreitung von COVID-19 in Deutschland.
Beschreibung der Fall-Tabelle
Die Daten zur Erzeugung der Statistiken auf diesen Seiten werden der
Fall-Tabelle entnommen, die vom
Robert Koch Institut und dem Unternehmen
Esri
auf der enstprechenden Seite
täglich zur Verfügung gestellt wird. Dort sind auch die Spalten der Tabelle
beschrieben.
In der Tabelle sind die Spalten durch Kommata voneinander getrennt. Zu
beachten ist, dass die Spalte Datenstand einen durch
Anführungszeichen eingeschlossenen Text enthält, der ebenfalls ein Komma
(gefolgt von einem Leerzeichen) enthält.
Jede Zeile in der Tabelle beschreibt einen oder mehrere gleichartige
Fälle von infizierten Personen. Zusätzlich ist jeweils angegeben, ob
die entsprechende Person bzw. die entsprechenden Personen inzwischen
verstorben oder (vermutlich, aufgrund einer allgemeinen Schätzung)
genesen sind.
Die Meldungen, die das RKI an einem Tag erhält, beziehen sich auf
verschiedene Tage, an denen die Fälle den lokalen Gesundheitsämtern
bekannt wurden. Ein Fall wird dabei jeweils dem Gesundheitsamt gemeldet,
in dessen Bezirk sich die betroffene Person unmittelbar vor der Meldung
aufhielt. Das Datum, an dem ein Fall einem lokalen Gesundheitsamt
bekannt wurde, wird Meldedatum genannt. Die Zahlen für ein
Meldedatum ändern sich beim RKI für neu infizierte Personen in den drei
folgenden Tagen noch wesentlich (Meldeverzug), es gibt aber
für einzelne Fälle auch deutlich längere Verzögerungen. Außerdem gibt es
Meldungen, mit denen ein lokales Gesundheitsamt eine frühere Meldung
korrigiert.
Auch bei neu verstorbenen Personen ist das Meldedatum das Datum, an dem
das lokale Gesundheitsamt vorher von der Infektion der Person erfahren
hat. Durch die unterschiedliche Zeit zwischen der Meldung beim
Gesundheitsamt und dem Versterben einer Person ändert sich die Zahl der
Verstorbenen zu einem Meldedatum drei Wochen lang noch wesentlich. Nur in
wenigen Fällen erfährt ein Gesundheitsamt erst mit dem Versterben einer
Person, dass diese infiziert war.
Die Erzeugung der Tabelle kann man sich so vorstellen, dass täglich aus
einer Datenbank alle gemeldeten Fälle exportiert werden und dann Fälle,
die in allen Eigenschaften übereinstimmen, zu einer Zeile
zusammengefasst werden. Bei Zeilen, die aus einer Zusammenfassung
entstehen, ist der Wert in der Spalte AnzahlFall und
gegebenenfalls in der Spalte AnzahlTodesfall größer
als Eins. Dadurch kann sich von einer Tabelle zur Tabelle des
nächsten Tages die Aufteilung der Fälle auf die Zeilen ändern.
In der Tabelle gibt es Spalten, die die Veränderungen der Fallzahlen
gegenüber der vorherigen Tabelle (vom Vortag) angeben. Für die gemeldeten
infizierten Personen ist dies die Spalte NeuerFall, für
die gemeldeten verstorbenen Personen ist dies die Spalte
NeuerTodesfall. Eine Veränderung gegenüber dem Vortag kann
durch folgende Ereignisse eintreten:
- Eine lebende Person wurde neu als infiziert gemeldet. Dann hat die
Spalte NeuerFall den Wert 1 und die Spalte
NeuerTodesfall den Wert -9.
- Eine Person, die als infiziert gemeldet war, verstirbt. Dann hat die
Spalte NeuerFall den Wert 0 und die Spalte
NeuerTodesfall den Wert 1.
- Eine Person, die bisher nicht als infiziert gemeldet war, verstirbt
und bei der anschließenden Untersuchung wird festgestellt, dass sie mit
SARS-CoV-2 (dem Virus von COVID-19) infiziert war. Dann haben die
Spalten NeuerFall und NeuerTodesfall beide
den Wert 1.
- Eine lebende Person, die als infiziert gemeldet worden war, war doch
nicht infiziert (Fehler beim Test oder die entsprechende Meldung wurde
fälschlicherweise verschickt). Dann hat die Spalte
NeuerFall den Wert -1 und die Spalte
NeuerTodesfall den Wert -9.
- Eine verstorbene Person, die als infiziert gemeldet worden war, war
doch nicht infiziert. Dann hat die Spalte NeuerFall den
Wert -1 und die Spalte NeuerTodesfall den Wert -1.
- Eine Person, die als infiziert und verstorben gemeldet worden war, ist
tatsächlich nicht verstorben (die entsprechende Meldung wurde
fälschlicherweise verschickt). Dann hat die Spalte
NeuerFall den Wert 0 und die Spalte
NeuerTodesfall den Wert -1.
Wenn sich für einen Fall nichts ändert (was für die allermeisten Zeilen
in der Tabelle gilt), hat bei einer lebenden Person die Spalte
NeuerFall den Wert 0 und die Spalte
NeuerTodesfall den Wert -9. Bei einer verstorbenen Person,
für die sich nichts ändert (also keine Korrektur gemeldet wurde), haben
beide Spalten den Wert Null.
Daraus ergibt sich die folgende spezielle Konsequenz:
- Da jede mit COVID-19 verstorbene Person eine infizierte Person war,
steht in allen Zeilen der Tabelle, in denen der Wert in der Spalte
AnzahlTodesfall größer als Null ist, der gleiche Wert
in der Spalte AnzahlFall. Und wenn in diesen Zeilen in
der Spalte NeuerFall der Wert 1 steht, muss dieser Wert
auch in der Spalte NeuerTodesfall stehen.
Für die Erzeugung der Statistiken auf diesen Seiten werden die folgenden
Spalten ausgewertet (angegeben jeweils mit ihrer Nummer in der Tabelle):
- Bundesland
- Landkreis
- AnzahlFall
- AnzahlTodesfall
- Meldedatum
- Datenstand
- NeuerFall
- NeuerTodesfall
Die Anzahl der Fälle gemeldeter infizierter Personen ergibt sich (für ein
bestimmtes Meldedatum oder insgesamt) entsprechend der obigen Erläuterungen
als Summe der Werte in der Spalte AnzahlFall (für das
entsprechende Meldedatum bzw. insgesamt), für die der Wert in der Spalte
NeuerFall gleich oder größer Null ist. Für die Anzahl der
Fälle gemeldeter verstorbener Personen gilt Entsprechendes bezüglich der
Spalten AnzahlTodesfall und NeuerTodesfall.
Fragen und Antworten zur Fall-Tabelle
Vorhandene Fragen mit Antworten:
- Gibt es einen
alternativen URL, von dem die jeweils aktuelle Fall-Tabelle
heruntergeladen werden kann?
- Seit einiger Zeit kann die Fall-Tabelle
von dem URL,
der auf der oben genannten Seite
angegeben ist, nicht mehr komprimiert heruntergeladen werden. Auch
ist der Download teilweise sehr langsam. Eine andere von Esri angebotene
Datei
beinhaltete die Daten zeitweise (z.B. Ende Dezember 2020) im gleichen
Format. Inzwischen (Mitte Januar 2021) hat das Format aber wieder
etwas geändert (u.a. befindet sich eine Spalte an anderer Position).
Diese Datei kann aber komprimiert heruntergeladen werden. Aufgrund
der gelegentlichen Änderungen im Format der Datei eignet sich
diese nur bedingt zur automatischen Verarbeitung. Auf einer anderen
Seite werden die
Daten täglich in Teilen angeboten. Dort gibt es zum einen Dateien
mit einer Auswahl von Spalten und zum anderen Dateien mit allen
Spalten, die aber nach Bundesländern aufgeteilt sind und Anpassungen
enthalten.
- Kann man ältere
Versionen der Fall-Tabelle irgendwo herunterladen?
- Es gibt folgende Archive:
- Eine Seite
mit den Dateien im Originalformat.
- Eine Seite
mit nach Monaten geordneten Dateien im einem leicht vereinfachten
Format, z.B. ohne die Standard-Uhrzeit 00:00 Uhr im
Meldedatum.
- Eine
Folge
von Seiten mit Dateien in einem etwas anderen Format, bei dem z.B.
das Meldedatum und das Referenzdatum in Unix-Zeit (Sekunden seit
01.01.1970) angegeben sind.
- Eine Seite
mit dem Archiv des RKI selbst, das aber nur Datensätze seit dem
02.04.2021 enthält. In diesen ist als Geoinformation nur eine
Landkreis-ID angegeben, aus der die Namen vom Landkreis und vom
Bundesland abzuleiten sind.
Von wo die jeweils aktuellen Daten herunter geladen werden können
ist in der Antwort zu einer anderen
Frage angegeben.
- Warum liegt
das Referenzdatum, das den Beginn einer Erkrankung angibt, bei einem
kleinen Teil der Fälle nach dem Meldedatum? Es kann doch eigentlich
keine Meldung (noch) ohne vorhandene Erkrankung stattgefunden haben.
- Die Tatsache, dass bei manchen Fällen das
Referenzdatum nach dem Meldedatum liegt, die Anzahl der Tage vom
Erkrankungsbeginn (Referenzdatum) bis zum Meldedatum also negativ ist,
erläutert das RKI in seinem
Epidemiologisches Bulletin 17/2020
auf Seite 11. Im Text steht:
In 522 Fällen war der zeitliche Abstand zwischen dem Datum der
Übermittlung an das RKI und dem Erkrankungsbeginn negativ oder lag
über 30 Tage.
Dazu steht in der Fußnote:
Anmerkung: Eine Dauer von 0 Tagen oder sogar kleine negative
Dauern lassen sich durch Fälle erklären, die im Rahmen einer
Kontaktpersonen-Nachverfolgung eines bestätigten Falles getestet
wurden und erst nach dem positiven Test Symptome entwickelt haben.
Ein Referenzdatum liegt also vor dem zugehörigen Meldedatum, wenn
ein Test kurz vor dem Auftreten von Symptomen durchgeführt wurde und
aufgrund der Umstände davon auszugehen ist, dass die Person schon
zum Zeitpunkt des Tests infiziert war.
- Welcher Landkreis
wird in einer Meldung einer Infektion angegeben, z.B. der vom
Wohnort der infizierten Person oder der vom aktuellen
Aufenthaltsort?
- Auf einer Seite vom RKI
steht im Abschnitt Meldeweg:
Die Meldung hat an das
Gesundheitsamt zu erfolgen, in dessen Bezirk sich die betroffene
Person derzeitig aufhält oder zuletzt aufhielt.
Z.B. wird also
für eine im Urlaub (in Deutschland) erkrankte Person der Landkreis
vom Urlaubsort in der Meldung angegeben.
- Wie kann man ermitteln,
welcher Meldeverzug, also welche Zeitdauer zwischen der
Meldung an das Gesundheitsamt (Meldedatum) und der Aufnahme in die
Fall-Tabelle, bei den in der Fall-Tabelle enthaltenen Fällen
aufgetreten ist? Das Datum der Aufnahme eines Falls in die
Fall-Tabelle scheint nicht angegeben zu sein.
- In der Tat ist das Datum der Aufnahme
eines Falls in die Fall-Tabelle nicht angegeben. Für Fälle, die neu
in die Fall-Tabelle aufgenommen wurden und bei denen also
NeuerFall den Wert Eins hat, weiß man aber, dass sie
am vorherigen Tag, also am Tag vor Datenstand,
aufgenommen wurden. Für eine Fall-Tabelle, eines bestimmten Datums
lässt sich also der Meldeverzug für die neu aufgenommenen Fälle
berechnen. Durch Auswertung älterer
Fall-Tabellen lässt sich der Meldeverzug so auch für in der
Vergangenheit aufgenommene Fälle berechnen. Es ist jedoch zu
beachten, dass die Zusammenfassung von Fällen zu Zeilen in einer
Fall-Tabelle sich durch Korrekturen der Angaben zu einem Fall
verändert und dann zwischen verschiedenen Fall-Tabellen
unterschiedlich ist.
- Wie kann man für die
verstorbenen Personen ermitteln, welche Zeitdauer zwischen dem
Meldedatum und dem Sterbedatum lag? Das Sterbedatum scheint
nicht angegeben zu sein.
- In der Tat ist das Sterbedatum in der
Fall-Tabelle nicht angegeben. Für Fälle neu verstorbener Personen,
die neu in die Fall-Tabelle aufgenommen wurden und bei denen also
NeuerTodesfall den Wert Eins hat, weiß man aber, dass
sie am vorherigen Tag, also am Tag vor Datenstand,
aufgenommen wurden. Bei diesen Fällen kann das Datum der Aufnahme
in die Fall-Tabelle grob als Sterbedatum verwendet werden. Durch
Auswertung älterer Fall-Tabellen
lässt sich das Sterbedatum auch für in der Vergangenheit verstorbene
Personen grob ermitteln. Es ist jedoch zu beachten, dass die
Zusammenfassung von Fällen (Personen) zu Zeilen in einer
Fall-Tabelle sich durch Korrekturen der Angaben zu einem Fall
verändert und dann zwischen verschiedenen Fall-Tabelle
unterschiedlich ist. Das RKI bietet übrigens
Statistiken
zu den Verstorbenen in Abhängigkeit vom Sterbedatum an, in
denen jedoch keine Angaben zum Meldedatum enthalten sind.