7-Tage-Faktor

Diese Seite ist Teil eines Angebots von Statistiken zur Ausbreitung von COVID-19 in Deutschland.

Zu Deutschland insgesamt und zu den Bundesländern werden insbesondere Statistiken des 7-Tage-Faktors angegeben. Dieser hat Ähnlichkeit zur effektiven Reproduktionszahl (oftmals verkürzt nur als Reproduktionszahl bezeichnet), wie sie das Robert Koch-Institut (RKI) berechnet (s. Epidemiologisches Bulletin 17/2020, Version vom 23.04.2020, S. 13-15 und Artikel dazu) und die in Zusammenhang mit COVID-19 häufig betrachtet wird. Im Folgenden ist angegeben, wie der 7-Tage-Faktor definiert ist. Daran anschließend wird er mit der effektiven Reproduktionszahl verglichen.

Definition des 7-Tage-Faktors

Der 7-Tage-Faktor wird für die Statistiken hier auf den Seiten berechnet als über 3 Tage gemittelter Änderungsfaktor der Meldezahlen mit 7 Tagen Abstand.

Sei F der 7-Tage-Faktor, t die Nummer eines Tages, (t - i) die Nummer eines i Tage vorhergehenden Tages und N(t) die Anzahl der für Tag t neu infiziert gemeldeten Personen. Dann gilt:

F(t) = k=0 2 N(t-k) N(t-7-k) 3

Für Bowser, die die Formel nicht darstellen können, hier in Textform (wobei root die Wurzelfunktion ist, konkret die dritte Wurzel berechnet):
F(t) = root(N(t)/N(t-7) * N(t-1)/N(t-7-1) * N(t-2)/N(t-7-2), 3)

Der Wert ist nur für die Tage definiert, für die N(t-7-k) größer als Null ist.

Vergleich von 7-Tage-Faktor mit effektiver Reproduktionszahl

Der 7-Tage-Faktor und die effektive Reproduktionszahl (in diesem Abschnitt ist damit grundsätzlich die vom RKI berechnete gemeint, sie wird im folgenden vereinfachend nur noch Reproduktionszahl genannt) stimmen in einem wesentlichen Merkmal überein: Bei einem Wert von Eins bleibt die Anzahl der Neuinfektionen gleich, bei einem größeren Wert steigt die Anzahl und bei einem kleineren Wert sinkt die Anzahl. Die Anzahl der jeweils aktuell infizierten Personen verhält sich mit etwas Verzögerung in der gleichen Weise. Damit können beide Werte für die Prognose einer Epidemie verwendet werden.

Ein wesentlicher Unterschied der beiden Werte liegt in dem Vorgang, den sie beschreiben. Der 7-Tage-Faktor beschreibt die Meldungen der Infektionen (beim lokalen Gesundheitsamt), die Reproduktionszahl beschreibt den vorherigen Beginn der Erkrankungen (das Auftreten erster Symtome). Die Reproduktionszahl scheint damit näher am aktuellen Geschehen (den stattfindenden Infektionen) zu sein als der 7-Tage-Faktor. Jedoch basieren beide Verfahren auf den gleichen Meldungen an das RKI. Jede Meldung eines Erkrankungsbeginns beinhaltet auch die Meldung einer Neuinfektion (genau genommen ist es sogar umgekehrt, da erst durch den Nachweis einer Neuinfektion eine Meldung entsteht). Für die Reproduktionszahl wird bei einer Meldung lediglich die zusätzlich vorhandene Angabe des Beginns der Erkrankung ausgewertet. Die Reproduktionszahl macht damit eine zusätzliche Aussage zur Vergangenheit. Für die Voraussage der Entwicklung in der Zukunft verwenden beide Werte die gleichen Informationen (zumindest unter der Annahme, dass die Verzögerung zwischen Krankheitsbeginn und Meldung gleich bleibt bzw. die Verzögerung keine Aussagekraft für die Entwicklung der Epidemie hat).

Andererseits ist die Berechnung der Reproduktionszahl jedoch mit einigen Problemen verbunden:

  1. Da nur bei knapp zwei Dritteln der Meldungen an das RKI der Beginn der Erkrankung angegeben ist (s. oben genanntes Bulletin 17/2020, S. 11), müssen die fehlenden Werte geschätzt werden. Das ensprechende Verfahren wird Nowcast-Verfahren genannt. Durch eine Schätzung entstehen notwendigerweise Ungenauigkeiten.
  2. Die Reproduktionszahl hängt ab von der (durchschnittlichen) Länge des Zeitraums, in dem eine infizierte Person andere Personen infiziert, Generationszeit des Virus genannt. Die Länge ist nicht bekannt und muss daher ebenfalls geschätzt werden (das RKI geht für seine Berechnungen von 4 Tagen aus), was zu weiteren Ungenauigkeiten führt. Die Länge kann (bzw. wird) sich jedoch mit der Zeit auch ändern.
  3. Das RKI verwendet für die Berechnung der Reproduktionszahl zwei unmittelbar aufeinanderfolgende Intervalle (Generationszeiten) von jeweils jeweils 4 Tagen. Dadurch wird der vorhandene Wochenzyklus der Meldezahlen nicht berücksichtigt. Auch wenn der Wochenzyklus bezüglich des Erkrankungsbeginns geringer sein mag, wird auch ein solcher vorhanden sein. Dessen Nicht-Berücksichtigung führt zu weiteren Ungenauigkeiten.
Die Einbeziehung von Schätzungen hat nicht nur den Nachteil, dass Ungenauigkeiten entstehen, sondern führt auch dazu, dass wenn zu einem späteren Zeitpunkt (z.B. aufgund dann umfangreicheren Wissens) die Schätzungen korrigiert werden, alle bis dahin ermittelten Werte ungültig werden. Dies kann man im Vorhinein zwar durch die Angabe von Vertrauensintervallen zu vermeiden versuchen, aber dies macht die Berechnungen und die Vorhersagen komplizierter und deren Verständlichkeit schwerer.

Für die Berechnung des 7-Tage-Faktors sind keine Schätzungen erforderlich. Außerdem wird durch die Verwendung von Werten, die 7 Tage auseinander liegen, der Wochenzyklus der Meldezahlen berücksichtigt. Die Berechnung des 7-Tage-Faktors ist daher mit keinem der genannten Probleme verbunden.

Seit dem 14.05.2020 gibt das RKI zusätzlich zu der bis dahin berechneten Reproduktionszahl, seitdem sensitiver R-Wert genannt, eine weitere Reproduktionszahl an, die 7-Tage R-Wert und stabilerer R-Wert genannt wird. Diese wird auf der Basis der gleitenden 7-Tage Mittelwerte berechnet. Dieser 7-Tage R-Wert hat daher das oben genannte wesentliche dritte Problem des unberücksichtigten Wochenzyklus nicht. Durch die (arithmetische) Mittelung über 7 Tagen reagiert dieser Wert im Vergleich zum 7-Tage-Faktor mit seiner (geometrischen) Mittelung über 3 Tage weniger deutlich auf kurzfristige aber oftmals auch nur kurz dauernde Veränderungen der Anzahl der Neuinfektionen.

Ein Nachteil des 7-Tage-Faktors gegenüber den vom RKI berechneten Reproduktionszahlen besteht darin, dass dieser teilweise relativ stark von besonderen Ereignissen im Meldeverfahren, hauptsächlich Feiertage, beeinflusst wird, wodurch sich für einzelne Tage oder Zeiträume erhöhte Werte ergeben, ohne dass daraus Aussagen für die Entwicklung der Ausbreitung von COVID-19 ableitbar wären.

Unabhängig von der Schätzung der Veränderung der Zahl der erfolgten Infektionen (durch die Reproduktionszahl) und der Berechnung der Veränderung der Zahl der gemeldeten Infektionen (durch den 7-Tage-Faktor), beides auf der Basis der bisher gemeldeten weitgehend stabilen Zahlen, ließe sich die Vorhersage für die folgenden Tage vermutlich dadurch verbessern, dass man die Zahl der in den nächsten Tagen noch erfolgenden Nachmeldungen (insbesondere für die letzten drei Tage, die in den Statistiken auf diesen Seiten nicht berücksichtigt werden) schätzt (auf der Basis der bereits erfolgten Meldungen). Da für dieses Angebot (bisher) aber grundsätzlich auf Schätzungen verzichtet wird, erfolgt auch diese Schätzung (bis jetzt) nicht.