Die Fall-Tabelle vom RKI
Diese Seite ist Teil eines Angebots von
Statistiken zur Ausbreitung von COVID-19 in Deutschland.
Beschreibung der Fall-Tabelle
Die Daten zur Erzeugung der Statistiken auf diesen Seiten werden der
Fall-Tabelle entnommen, die vom
Robert Koch Institut und dem Unternehmen
Esri
auf der enstprechenden Seite
täglich zur Verfügung gestellt wird. Dort sind auch die Spalten der Tabelle
beschrieben.
In der Tabelle sind die Spalten durch Kommata voneinander getrennt. Zu
beachten ist, dass die Spalte Datenstand einen durch
Anführungszeichen eingeschlossenen Text enthält, der ebenfalls ein Komma
(gefolgt von einem Leerzeichen) enthält.
Jede Zeile in der Tabelle beschreibt einen oder mehrere gleichartige
Fälle von infizierten Personen. Zusätzlich ist jeweils angegeben, ob
die entsprechende Person bzw. die entsprechenden Personen inzwischen
verstorben oder (vermutlich, aufgrund einer allgemeinen Schätzung)
genesen sind.
Die Meldungen, die das RKI an einem Tag erhält, beziehen sich auf
verschiedene Tage, an denen die Fälle den lokalen Gesundheitsämtern
bekannt wurden. Ein Fall wird dabei jeweils dem Gesundheitsamt gemeldet,
in dessen Bezirk sich die betroffene Person unmittelbar vor der Meldung
aufhielt. Das Datum, an dem ein Fall einem lokalen Gesundheitsamt
bekannt wurde, wird Meldedatum genannt. Die Zahlen für ein
Meldedatum ändern sich beim RKI für neu infizierte Personen in den drei
folgenden Tagen noch wesentlich (Meldeverzug), es gibt aber
für einzelne Fälle auch deutlich längere Verzögerungen. Außerdem gibt es
Meldungen, mit denen ein lokales Gesundheitsamt eine frühere Meldung
korrigiert.
Auch bei neu verstorbenen Personen ist das Meldedatum das Datum, an dem
das lokale Gesundheitsamt vorher von der Infektion der Person erfahren
hat. Durch die unterschiedliche Zeit zwischen der Meldung beim
Gesundheitsamt und dem Versterben einer Person ändert sich die Zahl der
Verstorbenen zu einem Meldedatum drei Wochen lang noch wesentlich. Nur in
wenigen Fällen erfährt ein Gesundheitsamt erst mit dem Versterben einer
Person, dass diese infiziert war.
Die Erzeugung der Tabelle kann man sich so vorstellen, dass täglich aus
einer Datenbank alle gemeldeten Fälle exportiert werden und dann Fälle,
die in allen Eigenschaften übereinstimmen, zu einer Zeile
zusammengefasst werden. Bei Zeilen, die aus einer Zusammenfassung
entstehen, ist der Wert in der Spalte AnzahlFall und
gegebenenfalls in der Spalte  AnzahlTodesfall größer
als Eins. Dadurch kann sich von einer Tabelle zur Tabelle des
nächsten Tages die Aufteilung der Fälle auf die Zeilen ändern.
In der Tabelle gibt es Spalten, die die Veränderungen der Fallzahlen
gegenüber der vorherigen Tabelle (vom Vortag) angeben. Für die gemeldeten
infizierten Personen ist dies die Spalte NeuerFall, für
die gemeldeten verstorbenen Personen ist dies die Spalte 
NeuerTodesfall. Eine Veränderung gegenüber dem Vortag kann
durch folgende Ereignisse eintreten:
- Eine lebende Person wurde neu als infiziert gemeldet. Dann hat die
    Spalte NeuerFall den Wert 1 und die Spalte
    NeuerTodesfall den Wert -9.
 - Eine Person, die als infiziert gemeldet war, verstirbt. Dann hat die
    Spalte NeuerFall den Wert 0 und die Spalte
    NeuerTodesfall den Wert 1.
 - Eine Person, die bisher nicht als infiziert gemeldet war, verstirbt
    und bei der anschließenden Untersuchung wird festgestellt, dass sie mit
    SARS-CoV-2 (dem Virus von COVID-19) infiziert war. Dann haben die
    Spalten NeuerFall und NeuerTodesfall beide
    den Wert 1.
 - Eine lebende Person, die als infiziert gemeldet worden war, war doch
    nicht infiziert (Fehler beim Test oder die entsprechende Meldung wurde
    fälschlicherweise verschickt). Dann hat die Spalte
    NeuerFall den Wert -1 und die Spalte
    NeuerTodesfall den Wert -9.
 -  Eine verstorbene Person, die als infiziert gemeldet worden war, war
     doch nicht infiziert. Dann hat die Spalte NeuerFall den
     Wert -1 und die Spalte NeuerTodesfall den Wert -1.
 -  Eine Person, die als infiziert und verstorben gemeldet worden war, ist
     tatsächlich nicht verstorben (die entsprechende Meldung wurde
     fälschlicherweise verschickt). Dann hat die Spalte
     NeuerFall den Wert 0 und die Spalte
     NeuerTodesfall den Wert -1.
 
Wenn sich für einen Fall nichts ändert (was für die allermeisten Zeilen
in der Tabelle gilt), hat bei einer lebenden Person die Spalte
NeuerFall den Wert 0 und die Spalte
NeuerTodesfall den Wert -9. Bei einer verstorbenen Person,
für die sich nichts ändert (also keine Korrektur gemeldet wurde), haben
beide Spalten den Wert Null.
Daraus ergibt sich die folgende spezielle Konsequenz:
- Da jede mit COVID-19 verstorbene Person eine infizierte Person war,
    steht in allen Zeilen der Tabelle, in denen der Wert in der Spalte
    AnzahlTodesfall größer als Null ist, der gleiche Wert
    in der Spalte AnzahlFall. Und wenn in diesen Zeilen in
    der Spalte NeuerFall der Wert 1 steht, muss dieser Wert
    auch in der Spalte NeuerTodesfall stehen.
 
Für die Erzeugung der Statistiken auf diesen Seiten werden die folgenden
Spalten ausgewertet (angegeben jeweils mit ihrer Nummer in der Tabelle):
- Bundesland
 - Landkreis
 - AnzahlFall
 - AnzahlTodesfall
 - Meldedatum
 - Datenstand
 - NeuerFall
 - NeuerTodesfall
 
Die Anzahl der Fälle gemeldeter infizierter Personen ergibt sich (für ein
bestimmtes Meldedatum oder insgesamt) entsprechend der obigen Erläuterungen
als Summe der Werte in der Spalte AnzahlFall (für das
entsprechende Meldedatum bzw. insgesamt), für die der Wert in der Spalte
NeuerFall gleich oder größer Null ist. Für die Anzahl der
Fälle gemeldeter verstorbener Personen gilt Entsprechendes bezüglich der
Spalten AnzahlTodesfall und NeuerTodesfall.
Fragen und Antworten zur Fall-Tabelle
Vorhandene Fragen mit Antworten:
  - Gibt es einen
      alternativen URL, von dem die jeweils aktuelle Fall-Tabelle
      heruntergeladen werden kann?
 
  - Seit einiger Zeit kann die Fall-Tabelle
      von dem URL,
      der auf der oben genannten Seite
      angegeben ist, nicht mehr komprimiert heruntergeladen werden. Auch
      ist der Download teilweise sehr langsam. Eine andere von Esri angebotene
      Datei
      beinhaltete die Daten zeitweise (z.B. Ende Dezember 2020) im gleichen
      Format. Inzwischen (Mitte Januar 2021) hat das Format aber wieder
      etwas geändert (u.a. befindet sich eine Spalte an anderer Position).
      Diese Datei kann aber komprimiert heruntergeladen werden. Aufgrund
      der gelegentlichen Änderungen im Format der Datei eignet sich
      diese nur bedingt zur automatischen Verarbeitung. Auf einer anderen
      Seite werden die
      Daten täglich in Teilen angeboten. Dort gibt es zum einen Dateien
      mit einer Auswahl von Spalten und zum anderen Dateien mit allen
      Spalten, die aber nach Bundesländern aufgeteilt sind und Anpassungen
      enthalten.
  
 - Kann man ältere
      Versionen der Fall-Tabelle irgendwo herunterladen?
 
  - Es gibt folgende Archive:
      
      - Eine Seite
          mit den Dateien im Originalformat.
      
 - Eine Seite 
          mit nach Monaten geordneten Dateien im einem leicht vereinfachten
          Format, z.B. ohne die Standard-Uhrzeit 00:00 Uhr im
          Meldedatum.
      
 - Eine
          Folge
          von Seiten mit Dateien in einem etwas anderen Format, bei dem z.B.
          das Meldedatum und das Referenzdatum in Unix-Zeit (Sekunden seit
          01.01.1970) angegeben sind.
      
 - Eine Seite
          mit dem Archiv des RKI selbst, das aber nur Datensätze seit dem
          02.04.2021 enthält. In diesen ist als Geoinformation nur eine
          Landkreis-ID angegeben, aus der die Namen vom Landkreis und vom
          Bundesland abzuleiten sind.
      
 
      Von wo die jeweils aktuellen Daten herunter geladen werden können
      ist in der Antwort zu einer anderen
      Frage angegeben. 
  - Warum liegt
      das Referenzdatum, das den Beginn einer Erkrankung angibt, bei einem
      kleinen Teil der Fälle nach dem Meldedatum? Es kann doch eigentlich
      keine Meldung (noch) ohne vorhandene Erkrankung stattgefunden haben.
 
  - Die Tatsache, dass bei manchen Fällen das
      Referenzdatum nach dem Meldedatum liegt, die Anzahl der Tage vom
      Erkrankungsbeginn (Referenzdatum) bis zum Meldedatum also negativ ist,
      erläutert das RKI in seinem
      Epidemiologisches Bulletin 17/2020
      auf Seite 11. Im Text steht:
      
        
        In 522 Fällen war der zeitliche Abstand zwischen dem Datum der
        Übermittlung an das RKI und dem Erkrankungsbeginn negativ oder lag
        über 30 Tage.
        
      
      Dazu steht in der Fußnote:
      
        
        Anmerkung: Eine Dauer von 0 Tagen oder sogar kleine negative
        Dauern lassen sich durch Fälle erklären, die im Rahmen einer
        Kontaktpersonen-Nachverfolgung eines bestätigten Falles getestet
        wurden und erst nach dem positiven Test Symptome entwickelt haben.
        
      
      Ein Referenzdatum liegt also vor dem zugehörigen Meldedatum, wenn
      ein Test kurz vor dem Auftreten von Symptomen durchgeführt wurde und
      aufgrund der Umstände davon auszugehen ist, dass die Person schon
      zum Zeitpunkt des Tests infiziert war. 
  - Welcher Landkreis
        wird in einer Meldung einer Infektion angegeben, z.B. der vom
        Wohnort der infizierten Person oder der vom aktuellen
        Aufenthaltsort?
 
  - Auf einer Seite vom RKI
        steht im Abschnitt Meldeweg: 
Die Meldung hat an das
        Gesundheitsamt zu erfolgen, in dessen Bezirk sich die betroffene
        Person derzeitig aufhält oder zuletzt aufhielt.
 Z.B. wird also
        für eine im Urlaub (in Deutschland) erkrankte Person der Landkreis
        vom Urlaubsort in der Meldung angegeben. 
  - Wie kann man ermitteln,
        welcher Meldeverzug, also welche Zeitdauer zwischen der
        Meldung an das Gesundheitsamt (Meldedatum) und der Aufnahme in die
        Fall-Tabelle, bei den in der Fall-Tabelle enthaltenen Fällen
        aufgetreten ist? Das Datum der Aufnahme eines Falls in die
        Fall-Tabelle scheint nicht angegeben zu sein.
 
  - In der Tat ist das Datum der Aufnahme
        eines Falls in die Fall-Tabelle nicht angegeben. Für Fälle, die neu
        in die Fall-Tabelle aufgenommen wurden und bei denen also
        NeuerFall den Wert Eins hat, weiß man aber, dass sie
        am vorherigen Tag, also am Tag vor Datenstand,
        aufgenommen wurden. Für eine Fall-Tabelle, eines bestimmten Datums
        lässt sich also der Meldeverzug für die neu aufgenommenen Fälle
        berechnen. Durch Auswertung älterer
        Fall-Tabellen lässt sich der Meldeverzug so auch für in der
        Vergangenheit aufgenommene Fälle berechnen. Es ist jedoch zu
        beachten, dass die Zusammenfassung von Fällen zu Zeilen in einer
        Fall-Tabelle sich durch Korrekturen der Angaben zu einem Fall
        verändert und dann zwischen verschiedenen Fall-Tabellen
        unterschiedlich ist.
 
  - Wie kann man für die
        verstorbenen Personen ermitteln, welche Zeitdauer zwischen dem
        Meldedatum und dem Sterbedatum lag? Das Sterbedatum scheint
        nicht angegeben zu sein.
 
  - In der Tat ist das Sterbedatum in der
        Fall-Tabelle nicht angegeben. Für Fälle neu verstorbener Personen,
        die neu in die Fall-Tabelle aufgenommen wurden und bei denen also
        NeuerTodesfall den Wert Eins hat, weiß man aber, dass
        sie am vorherigen Tag, also am Tag vor Datenstand,
        aufgenommen wurden. Bei diesen Fällen kann das Datum der Aufnahme
        in die Fall-Tabelle grob als Sterbedatum verwendet werden. Durch
        Auswertung älterer Fall-Tabellen
        lässt sich das Sterbedatum auch für in der Vergangenheit verstorbene
        Personen grob ermitteln. Es ist jedoch zu beachten, dass die
        Zusammenfassung von Fällen (Personen) zu Zeilen in einer
        Fall-Tabelle sich durch Korrekturen der Angaben zu einem Fall
        verändert und dann zwischen verschiedenen Fall-Tabelle
        unterschiedlich ist. Das RKI bietet übrigens
        Statistiken
        zu den Verstorbenen in Abhängigkeit vom Sterbedatum an, in
        denen jedoch keine Angaben zum Meldedatum enthalten sind.