È possibile stimare la letalità usando i dati aggregati dei decessi e dei positivi al coronavirus?

Avevamo tutti letto che la letalità per infezione da Covid-19 era relativamente modesta e non superava il 2%. In un articolo su Lancet [1] Ferguson stima una Crude Case Fatality Rate di 2,29 ed invece una Infection Fatality Rate di 0,675; la prima (CFR) è la proporzione (non corretta per struttura demografica) di decessi sui casi di malattia, la seconda (IFR) invece si riferisce a tutti i contagiati anche se asintomatici.

Alla luce di queste stime, che peraltro trovano molti riscontri [4] , non può che sorprendere nell’epidemia italiana da Covid-19 la stima della letalità che l’Istituto Superiore di Sanità (ISS) calcola [2] e che complessivamente verso fine maggio assume il valore di 13,7%. E’ la letalità dei soli soggetti diagnosticati positivi con test molecolare orofaringeo (tampone) e non è quindi la letalità di tutti i malati (CFR) e ancor meno di tutti i contagiati (IFR compresi sia i paucisintomatici sia i asintomatici.

A lato si riporta una stima del possibile valore dei denominatori per passare dalla stima del 13,7% a quelle indicate da Ferguson:. In particolare per avere una CFR pari a 2,29% i malati dovrebbero essere sei volte i soggetti positivi oggi certificati e per avere un IFR pari a 0,675 i contagiati dovrebbero essere venti volte più numerosi.

Per calcolare in modo corretto e preciso la letalità sono necessari i dati individuali di tutti i soggetti con la loro storia dal contagio al decesso o alla completa guarigione o al termine del contagio []3] [3], ma questi dati sono a disposizione solo dell’ISS che per il momento non li condivide con altri, mentre gli unici dati dell’epidemia che vengono condivisi sono quelli che, pur a vendo la stessa origine, vengono pubblicati in forma aggregata dalla Protezione Civile e che purtroppo non permettono di associare il singolo soggetto diagnosticato come positivo al suo esito.

Le due serie delle frequenze  giornaliere dei nuovi positivi e dei deceduti, che qui sono rappresentate in grafico, mostrano una ciclicità settimanale importante dovuta alle attività di comunicazione delle notifiche rallentata nelle giornate di sabato e domenica. Per questo motivo è necessario trasformare le due serie con delle medie mobili a sette giorni che permettono di eliminare questi artifici estranei alle vere frequenze degli eventi stessi e creano uno smoothing utile per il prosieguo delle analisi.

Gli andamenti delle due serie appaiono molto simili come anche dal grafico seguente che utilizza una scala logaritmica delle frequenze.
Per stimare il valore del CFR utilizzando questi dati aggregati è però necessario stimare quanto sia il valore mediano della latenza tra la data della notifica del caso e la data del decesso [5,6].

 

 

 

 

 

Una possibilità è ricorrere ai dati di alcune casistiche che segnalano i giorni che intercorrono ad esempio tra ricovero e decesso [7] che sono di sei giorni. Si consideri però che i dati della notifica del caso avvengono solo dopo il riscontro della positività del tampone e quindi circa due giorni dopo e quindi è verosimile che il tempo che intercorre nei dati pubblicati dalla Protezione Civile tra l’inserimento di un caso positivo e il suo decesso sia mediamente di 4 giorni. I seguenti tre grafici riportano lo scatter plot delle frequenze dei casi positivi e dei decessi con la data del rispettivo inserimento e invece con la data del decesso posticipata di 4 e di 8 giorni.

 

 

Nel grafico al centro lo sfalsamento di 4 giorni porta le frequenze di entrambe le serie a coincidere e questo lo si può ulteriormente verificare calcolando gli indici di correlazione tra le due serie sfalsando quelle dei deceduti di differenti giorni (tecnicamente calcolando la correlazione a diversi “lag”. Questi sono gli indici di correlazione tra lag zero (cioè allo stesso giorno) e lag otto.

lag 0 lag 1 lag 2 lag 3 lag 4 lag 5 lag 6 lag 7 lag 8
0,919 0,953 0,977 0,992   0,996   0,988  0,971 0,943  0,906

                               
E questo è il grafico che conferma come, sull’intero periodo  dell’epidemia,  sia a lag 4 che si massimizza la correlazione sino quasi a raggiungere il valore uno.

Si è allora anche calcolato il rapporto tra la frequenza dei deceduti e la frequenza dei nuovi casi positivi (CFR) sia per date loro di notifica sia con le frequenze dei casi con data a lag 4 e a lag 8 antecedenti [5] . Il grafico mostra per il CFR calcolato a lag 4 un andamento sostanzialmente piatto sino a fine aprile con valori simili a quelli che l’ISS da della letalità (cioè 13,7) per poi mostrare sorprendentemente una crescita che potrebbe sembrare inaspettata.

Infatti ci si poteva aspettare una diminuzione del CFR dato che varie informazioni sembrano indicare che i casi ricoverati negli ultimi giorni presentino una minor gravità, e se fosse così i il grafico mostrare una diminuzione e non una crescita. La ragione potrebbe invece essere che la media dei giorni di malattia che portano al decesso siano cresciuti negli ultimi tempi proprio grazie alle migliorate capacità di trattamento ed infatti se ricalcoliamo gli indici di correlazione solo nei dati di maggio vediamo che la correlazione aumenta considerando i lag maggiori di 4.

Con questi soli dati a disposizione non si può dire purtroppo molto di più, ma non si può però neppure affermare che la letalità diminuisca e quindi che il virus sia realmente oggi meno aggressivo di prima. Sostanzialmente si dovrebbe ritenere che la letalità sia rimasta sinora costante rispetto per lo meno ai casi di malattia che richiede un ricovero.

 Come si è stimato il CFR a livello nazionale si può cercare di eseguire una stima anche sui dati regionali anche se in questo caso l’analisi può risultare meno solida data l’esiguità delle frequenze soprattutto per quelle relative alle Regioni con meno abitanti. Si sono calcolati in rapporti tra decessi e nuovi casi in tre periodi ugualmente ampi: a) i decessi sino al 25 marzo con i casi positivi sino al 21 marzo, b) decessi dal 26 marzo al 25 aprile e positivi dal 22 marzo al 21 aprile, c) decessi dal 26 aprile al 25 maggio e positivi dal 22 aprile al 21 maggio e le percentuali delle frequenze a livello nazionale nei tre periodi risultano quasi costanti seppur con una leggere crescita che conferma il trend prima descritto. Per ogni Regione si è calcolato anche l’intervallo di confidenza al 95% che nelle Regioni meno popolose risulta molto ampio.

Non si osserva una diminuzione importante del CFR nel terzo periodo, ed anzi in alcune delle Regioni maggiori, come Emilia Romagna, Veneto, Toscana e Puglia si osserva una crescita significativa.  Anche a livello regionale si devono fare le stesse ipotesi fatte a riguardo del totale nazionale: se ci fosse un allargamento dei positivi ai casi meno gravi si dovrebbe vedere una diminuzione dei rapporti tra decessi e positivi, così come se fosse il virus ad essere diventato meno letale. E’ probabile allora che si è semplicemente allungato il tempo del decorso della malattia prima dell’esito e quindi dato che il trend dei casi positivi è in diminuzione il calcolo del rapporto a lag 4 risulta più elevato.

In conclusione si può ritenere che in mancanza della disponibilità di dati individuali l’analisi dei dati aggregati forniti dalla Protezione Civile permette di effettuare una stima relativamente accettabile del CFR che  sembra sostanzialmente confermare la stima della letalità calcolata da parte dell’ISS sui casi individuali.  Si può infine ritenere che non si siano evidenziate sinora  importanti differenze di CFR nei tre mesi di questa epidemia e neppure che vi siano importanti differenze di CFR tra le varie Regioni.
Non possiamo comunque non auspicare che, pur nel rispetto di tutte le precauzione necessarie per il rispetto della privacy, i dati che riguardano la salute della collettività siano disponibili per tutti i ricercatori e non solo per chi abbia la fiducia del Governo.


Riferimenti bibliografici consultati in Internet il 27 maggio 2020

  1. Robert Verity, Lucy C Okell, Ilaria Dorigatti, … , Neil M Ferguson, Estimates of the severity of coronavirus disease 2019: a model-based analysis, March 30, 2020 [https://www.thelancet.com/action/showPdf?pii=S1473-3099%2820%2930243-7]
  2. Istat, Epicentro-ISS, Impatto dell’epidemia COVID-19 sulla mortalità totale della popolazione residente. Primo trimestre 2020. 4 maggio 2020. [https://www.epicentro.iss.it/coronavirus/pdf/Rapporto_Istat_ISS.pdf]
  3. Ghani, A.C.; Donnelly, C.A.; Cox, D.R.; Griffin, J.T.; Fraser, C.; Lam, T.H.; Ho, L.M.; Chan, W.S.; Anderson, R.M.; Hedley, A.J.; et al. Methods for estimating the case fatality ratio for a novel, emerging infectious disease. Am. J. Epidemiol. 2005, 162, 479–486 [https://academic.oup.com/aje/article/162/5/479/82647]
  4. Kenji Mizumoto e Gerardo Chowell, Estimating the risk of 2019 Novel Coronavirus death during the course of the outbreak in China, 2020, in medRxiv, 23 febbraio 2020. [https://www.medrxiv.org/content/10.1101/2020.02.19.20025163v1].
  5. Coronavirus Mortality Rate (COVID-19) - Worldometer, [https://www.worldometers.info/coronavirus/coronavirus-death-rate/#correct]
  6. Natalie M. Linton, Tetsuro Kobayashi e Yichi Yang, Incubation Period and Other Epidemiological Characteristics of 2019 Novel Coronavirus Infections with Right Truncation: A Statistical Analysis of Publicly Available Case Data, in Journal of Clinical Medicine, vol. 9, n. 2, 2020/2, pp. 538, DOI:10.3390/jcm9020538. [https://www.mdpi.com/2077-0383/9/2/538/htm
  7. [https://primatreviglio.it/rubriche/topnewsregionali/istat-e-iss-svelano-le-caratteristiche-dei-pazienti-deceduti-per-covid-19-in-italia/]

Inserisci il tuo commento

L'indirizzo mail è privato e non verrà mostrato pubblicamente.
CAPTCHA
Riporta le lettere mostrate nel riquadro senza spazi. Non c'è differenza tra maiuscole e minuscole.
u
C
F
F
L
Non inserire spazi. E' indifferente l'uso del maiuscolo/minuscolo