Il mio sistema "personale" di monitoraggio dei dati ufficiali di incidenza di malati sintomatici

Che i dati comunicati tutte le sere al vespero dalla Protezione Civile siano solo una lontana proxy dei dati reali di diffusione del contagio da Covid-19 nella popolazione è cosa risaputa e per il momento difficilmente modificabile.
Ci sono rilevanti problemi di definizione di caso legati anche ad un decreto governativo che prevedeva di considerare caso solo i malati con sintomi rilevanti cui veniva fatto un tampone che dava esito positivo.
Questo esclude quindi sia gli asintomatici sia i paucisintomatici sia i deceduti senza effettuazione di tamponi. Ma oltre ad escluderli, il che non sarebbe dal punto di vista statistico un grave problema tranne che per la sola sottostima dei contagiati, fa si anche che il numero di casi diventa funzione delle scelte di politica sanitaria di diffusione dei test diagnostici.
Un altro problema è il tipo di comunicazione che vien fatta dalla Protezione Civile che è quasi esclusivamente interessata alla prevalenza dei malati ed in. particolare alla prevalenza dei malati che abbisognano delle terapie maggiori. In realtá quando tutti i media alla sera danno l’incremento di casi si riferiscono alla prevalenza e talvolta rischiano di far passare come positiva una diminuzione di prevalenza anche se determinata in larga quota prevalentemente dall’incremento della mortalità oltre che dalle guarigioni.
Per questi motivi mi sono creato un mio “cruscotto” di monitoraggio dell’incidenza dei “malati confermati” ipotizzando che grosso modo questi possano rappresentare una frazione costante dei contagiati, anche se, come prima detto, è probabile che costante non sia.
Per “sospettare” eventuali cambiamenti di queste politiche di estensione diagnostica cerco innanzitutto di vedere come si comporta a livello regionale il rapporto tra casi e tamponi, indice che può dipendere sia dal tasso diagnostico della popolazione (numero di tamponi per abitanti), sia dalla scelta di chi sottoporre a diagnosi in funzione dei suoi sintomi, dei suoi sospetti, del suo ruolo nella comunità.

Questo grafico, relativo alle Regioni con più abitanti, evidenzia come il rapporto tra casi e tamponi sia molto diverso tra Regioni e come all’interno della stessa Regione abbia subito importanti differenze.
Più l’incidenza è cresciuta e più, almeno nelle fasi immediate, il rapporto è cresciuto e la percentuale dei positivi sul totale dei tamponi è cresciuto. Si consideri che lo scopo precipuo del tampone è quello di confermare la diagnosi al momento dell’eventuale ricovero per evitare soprattutto di considerare positivo un soggetto con una patologia simile ma non da covid-19. E poi si consideri anche che la capacità di eseguire e analizzare i tamponi non è nelle diverse Regioni uguale e soprattutto non è proporzionale al probabile numero dei casi da diagnosticare.

Il mio “cruscotto” si compone dei seguenti tre grafici che aggiorno ogni sera per l’intera nazione e che talvolta, compatibilmente alle mie risorse di tempo, faccio anche per qualche selezionata Regione:

Tutti i tre grafici si basano sui nuovi casi di contagi comunicati dalla Protezione Civile seppur non direttamente in quanto vengono comunicati solo ogni giorno i totali, dall’inizio dell’epidemia, dei casi prevalenti, dei guariti, dei deceduti e della loro somma che è il totale dei casi incidenti; nuovi casi, ovviamente, sono gli incrementi giorno dopo giorno di quest’ultimo totale.

In tutti io cinque grafici viene anche usata come funzione di smoothing le medie mobili centrate a 3 e a 5 elementi; nel terzo viene utilizzata solo quella centrata a 5 elementi. La necessità di uno smoothing nasce non solo dalla variabilità dei valori reali ma anche dalla variabilità indotta dal sistema delle notificazioni soprattutto degli esiti dei tamponi che in alcuni casi a superato, ci è stato detto, anche i tre giorni.

Primo grafico: il trend dei nuovi cassi incidenti
In una ipotesi di crescita esponenziale dei casi, ipotesi confermata nelle prime fasi dell’epidemia, mi è sembrato meglio leggibile l’andamento dei nuovi casi leggendolo in una scala logaritmica che permette di evidenziarne la loglinearità. In effetti sinoi a circa il 20 marzo l’andamento appare lineare nella sua trasformazione logaritmica seppur leggermente calante; da quella data invece l’andamento rimane pressochè orrizzontale evidenziando quello che alcuni hanno chiamato picco ed altri forse più propriamente plateau, cioè un numero assoluto giornaliero costante di casi. La scala logaritmica permette di dare ugual valore grafico agli incrementi o decrementi percentuali e non alle corrispondenti differenze invece descritte nel secondo grafico.

Secondo grafico: le differenze di casi tra un giorno e l’altro.
Nel secondo grafico evidenzio gli incrementi e i decrementi di cassi tra un giorno ed il precedente in valore assoluto. Questo ad esempio mi permette di evidenziare una “curiosa” ciclicità settimanale con una crescita importante di casi a metà settimana nelle giornate di mercoledì o di giovedì. Questo andamento è di difficile interpretazione e se non fosse semplicemente casuale, potrebbe dipendere o da un ritardo di notifica dei casi o di produzione di tamponi nei giorni di sabato e domenica che poi si sommano a quelli di metà settimana, o invece ad una reale crescita di casi conseguenti a maggiori contagi avvenuti durante gli WE precedenti. Questa ipotesi sembra confermata dal fatto che durante l’ultimo WE non sembra si sia ripetuta, ma questo è stato il primo WE con misure di lockdown rigide.

Anche in questo grafico, comunque si riesce ad evidenziare come il numero giornaliero di nuovi casi abbia avuto una crescita dino a circa il 20 marzo per poi decrescere seppur in modo molto “ballerino”.

Terzo grafico: una stima semplice dell’indice di replicazione (Rt)
Per meglio esaminare questo grafico riporto un particolare degli ultimi giorni di epidemia.
Il significato di questo indice è l’intensità di espansione, o riduzione dell’epidemia, che può essere riferito al numero medio di nuovi casi prodotti da ciascun caso precedente.
Se ogni caso producesse un solo casso l’epidemia continuerebbe all’infinito mantenendo costante il numero dei contagiati; in questo caso il valore dell’indice Rt sarebbe pari ad 1 e nel grafico viene rappresentato con la linea orizzontale a punti gialli.
Tanto più il valore è alto tanto più l’epidemia si sviluppa più intensamente e viceversa accade se scende al di sotto dell’unità. Si consideri che rimanendo al di sotto dell’unità l’epidemia tende necessariamente ad annullarsi e però se si interrompe la decrescita rimanendo costante il numero di nuovi casi, l’indice allora ritorna a valori prossimi all’unità.

Nei primi giorni dell’epidemia quando non vi erano ancora misure di contenimento l’indice raggiungeva anche valori di 5 ed in alcune Regioni anche molto di più; in Italia attorno al 20 marzo l’indice era ancora di circa 1,5 e scendeva rapidamente ma poi attorno al 25 marzo risaliva nuovamente oltre l’unità per poi ridiscendere ed ancora risalire attorno al 3 di aprile.
Sembra infine che dopo tale data sia ripreso a diminuire e si spera senza più arrestarsi. Per una decrescita sostanziosa l’indice dovrebbe scendere almeno a valori di 0,5.

Come viene calcolato? Innanzitutto, come già detto, la serie delle frequenze nei nuovi casi viene lisciata con una media mobile centrata a 5 elementi. Questo determina un ritardo della stima dell’indice a due giorni precedenti l’ultimo con dati disponibili.
Vengono poi calcolati dei semplici rapporti tra la media mobile centrata su ciascun giorno e le media mobili centrate su 3, 4, 5 e 6  giorni precedenti. Considerando che la stima della replicazione di un caso dovrebbe avvenire dopo un periodo di incubazione stimato mediamente di 4,5 giorni, la stima dell’Rt più corretta dovrebbe situarsi tra i rapporti calcolati a 4 e a 5 giorni antecedenti, cioè tra le linee continue verde e rossa. Le linee tratteggiate, a 3 o 6 giorni antecedenti, danno un’idea di quello che potrebbe essere se la stima del periodo di incubazione fosse minore o maggiore.

Conclusione
Questo cruscotto io l’ho costruito per me stesso e lo ho condiviso con. Alcuni amici. A me sembra che sia in grado di monitorare bene l’andamento della epidemia senza introdurre complessi modelli matematici, interessanti ma molto spesso opinabili, soprattutto quando “pretendono” di volere fare delle previsioni e non solo di costruire possibili scenari dipendenti dai parametri introdotti.
Questo mio monitoraggio non si pone il problema di prevedere ma solo di descrivere le caratteristiche dell’evoluzione passata. Ho fatto dei grafici anche relativi a singole Regioni e sono risultati molto interessanti e molto diversi da una Regione all’altra. Quindi se a qualcuno questi cruscotto piace, lo può adattare magari anche migliorandolo.

Commenti

direttore UOC assistenza primaria e cronicità PA di Bolzano

Bravo Cesare, più chiaro di tante altre metodologie strane. Potresti fare la stessa cosa per Bolzano? Te ne sarei grata. E ti proporrei un incontro via Skype con la dirigenza. Ciao Isabella

Inserisci il tuo commento

L'indirizzo mail è privato e non verrà mostrato pubblicamente.
CAPTCHA
Riporta le lettere mostrate nel riquadro senza spazi. Non c'è differenza tra maiuscole e minuscole.
A
U
G
m
D
Non inserire spazi. E' indifferente l'uso del maiuscolo/minuscolo