supplemento
Epidemiol Prev 2019; 43 (4): 8-16
DOI: https://doi.org/10.19191/EP19.4.S2.P008.089

A Systematic Review of Case-Identification Algorithms for 18 Conditions Based on Italian Healthcare Administrative Databases: A Study Protocol

  • Cristina Canova1

  • Lorenzo Simonato1

  • Claudio Barbiellini Amidei1

  • Ileana Baldi1

  • Teresa Dalla Zuanna1

  • Dario Gregori1

  • Silvia Danieli1

  • Alessandra Buja1

  • Giulia Lorenzoni1

  • Gisella Pitter2

  • Giuseppe Costa3

  • Roberto Gnavi3

  • Giovanni Corrao4,5

  • Federico Rea4,5

  • Rosa Gini6

  • Giulia Hyeraci6

  • Giuseppe Roberto6

  • Andrea Spini7

  • Ersilia Lucenteforte8

  • Nera Agabiti9

  • Marina Davoli9

  • Riccardo Di Domenicantonio9

  • Giovanna Cappai9

  1. Department of Cardio-Thoraco-Vascular Sciences and Public Health, University of Padua, Padua (Italy)
  2. Local Health Unit “Azienda ULSS 2 Marca Trevigiana”, Veneto Region (Italy)
  3. Epidemiology Unit, ASL TO3, Piedmont Region, Grugliasco, Turin (Italy)
  4. National Centre for Healthcare Research and Pharmacoepidemiology, Milan (Italy)
  5. Laboratory of Healthcare Research & Pharmacoepidemiology, Department of Statistics and Quantitative Methods, University of Milano-Bicocca, Milan (Italy)
  6. Regional Agency for Healthcare Services of Tuscany, Epidemiology Unit, Florence (Italy)
  7. Department of Medicine, Surgery and Neuroscience, University of Siena, Siena (Italy)
  8. Department of Clinical and Experimental Medicine, University of Pisa, Pisa, (Italy)
  9. Department of Epidemiology, Lazio Regional Health Service, ASL Roma 1, Rome (Italy)
Riccardo Di Domenicantonio

FREE FULL TEXT (PDF)

ABSTRACT

BACKGROUND: there has been a long-standing, consistent use worldwide of Healthcare Administrative Databases (HADs) for epidemiological purposes, especially to identify acute and chronic health conditions. These databases are able to reflect health-related conditions at a population level through disease-specific case-identification algorithms that combine information coded in multiple HADs. In Italy, in the past 10 years, HAD-based case-identification algorithms have experienced a constant increase, with a significant extension of the spectrum of identifiable diseases. Besides estimating incidence and/or prevalence of diseases, these algorithms have been used to enroll cohorts, monitor quality of care, assess the effect of environmental exposure, and identify health outcomes in analytic studies. Despite the rapid increase in the use of case-identification algorithms, information on their accuracy and misclassification rate is currently unavailable for most conditions.

OBJECTIVES: to define a protocol to systematically review algorithms used in Italy in the past 10 years for the identification of several chronic and acute diseases, providing an accessible overview to future users in the Italian and international context.

METHODS: PubMed will be searched for original research articles, published between 2007 and 2017, in Italian or English.
The search string consists of a combination of free text and MeSH terms with a common part on HADs and a disease- specific part.
All identified papers will be screened for eligibility by two independent reviewers. All articles that used/defined an algorithm for the identification of each disease of interest using Italian HADs will be included. Algorithms with exclusive use of death certificates, pathology register, general practitioner or pediatrician data will be excluded. Pertinent papers will be classified according to the objective for which the algorithm was used, and only articles that used algorithms with “primary objectives” (I disease occurrence; II population/cohort selection; III outcome identification) will be considered for algorithm extraction. The HADs used (hospital discharge records, drug prescriptions, etc.), ICD-9 and ICD-10 codes, ATC classification of drugs, follow-back periods, and age ranges applied by the algorithms will be collected. Further information on specific accuracy measures from external validations, sensitivity analyses, and the contribution of each source will be recorded.
This protocol will be applied for 16 different systematic reviews concerning eighteen diseases (Hypothyroidism, Hyperthyroidism, Diabetes mellitus, Type 1 diabetes mellitus, Acute myocardial infarction, Ischemic heart disease, Stroke, Hypertension, Heart failure, Congenital heart anomalies, Parkinson’s disease, Multiple sclerosis, Epilepsy, Chronic obstructive pulmonary disease, Asthma, Inflammatory bowel disease, Celiac disease, Chronic kidney failure).

CONCLUSION: this protocol defines a standardized approach to extensively examine and compare all experiences of caseidentification algorithms in Italy, on the 18 abovementioned diseases. The methodology proposed may be applied to other systematic reviews concerning diseases not included in this project, as well as other settings, including international ones.
Considering the increasing availability of healthcare data, developing standard criteria to describe and update characteristics of published algorithms would be of great use to enhance awareness in the choice of algorithms and provide a greater comparability of results.

Keywords: healthcare administrative databases, algorithms, systematic review, protocol

RIASSUNTO

INTRODUZIONE: l’utilizzo di flussi amministrativi sanitari (FAS) a fini epidemiologici vanta una consistente esperienza in tutto il mondo, in particolare per identificare condizioni di salute acute e croniche. Questi database sono in grado di identificare patologie a livello di popolazione tramite algoritmi di identificazione di caso di malattia, che combinano informazioni codificate provenienti da più FAS. In Italia, negli ultimi 10 anni, gli algoritmi per l’identificazione di casi basati su FAS hanno registrato un costante aumento, con una significativa estensione dello spettro delle malattie identificabili.
Oltre alla stima dell’occorrenza delle malattie, questi algoritmi sono stati utilizzati anche per arruolare coorti di pazienti, valutare la qualità dell’assistenza, misurare l’effetto di esposizioni ambientali o identificare patologie in studio come esito. Nonostante il rapido incremento dell’utilizzo degli algoritmi di identificazione di casi di malattia, le informazioni sulla loro accuratezza e la possibile misclassificazione dei casi non sono attualmente disponibili per la maggior parte delle condizioni morbose.

OBIETTIVI: definire un protocollo per una revisione sistematica degli algoritmi utilizzati in Italia negli ultimi 10 anni per l’identificazione di diverse patologie croniche e acute, fornendo una panoramica accessibile ai futuri utenti in un contesto italiano e internazionale.

METODI: la revisione intende identificare tutti gli articoli originali pubblicati tra 2007 e il 2017 in inglese o in italiano, individuati su PubMed mediante una stringa di ricerca che combina testo libero con termini MeSH, in parte comune a tutte le patologie e in parte specifica per patologia.
Tutti gli articoli identificati saranno sottoposti a screening per l’elegibilità da parte di due revisori indipendenti. Verranno inclusi tutti gli articoli che hanno utilizzato/definito un algoritmo per l’identificazione di ciascuna malattia di interesse utilizzando i FAS italiani. Saranno esclusi gli algoritmi che presentano l’uso esclusivo di certificati di morte, dei registri patologici, dei medici di medicina generale o pediatri di libera scelta. Gli articoli pertinenti saranno classificati in base all’obiettivo per il quale è stato utilizzato l’algoritmo e solo gli articoli che hanno utilizzato algoritmi con “obiettivi primari” (I stima di occorrenza; II identificazione di coorti/popolazioni; III identificazione della patologia come esito) saranno presi in considerazione per l’estrazione delle informazioni sull’algoritmo. Verranno estratte le informazioni sulle fonti (schede di dimissione ospedaliera, prescrizioni farmaceutiche, ecc.), i codici ICD-9 e ICD-10, la classificazione ATC dei farmaci, il periodo di osservazione/follow-back e le fasce d'età applicate dagli algoritmi. Verranno registrate ulteriori informazioni su specifiche misure di accuratezza da validazioni esterne, le analisi di sensibilità e il contributo di ciascuna fonte. Questo protocollo sarà applicato a 16 diverse revisioni sistematiche riguardanti diciotto patologie (ipotiroidismo, ipertiroidismo, diabete mellito, diabete mellito di tipo 1, infarto miocardico acuto, cardiopatia ischemica, ictus, ipertensione, insufficienza cardiaca, anomalie congenite del cuore, morbo di Parkinson, sclerosi multipla, epilessia, broncopneumopatia cronica ostruttiva, asma, malattie infiammatorie intestinali, celiachia, insufficienza renale cronica).

CONCLUSIONE: questo protocollo definisce un approccio standardizzato per esaminare e confrontare ampiamente tutte le esperienze degli algoritmi di identificazione di casi delle 18 malattie sopra menzionate, applicati su dati italiani. La metodologia proposta può essere applicata ad altre revisioni sistematiche riguardanti malattie non incluse in questo progetto, così come in altri contesti, inclusi quelli internazionali.
Considerando la crescente disponibilità di FAS, lo sviluppo di criteri standard per descrivere e aggiornare le caratteristiche degli algoritmi pubblicati sarebbe di grande utilità al fine di migliorare la consapevolezza nella scelta degli algoritmi e fornire una maggiore comparabilità dei risultati.

Parole chiave: database amministrativi sanitari, algoritmi, revisione sistematica, protocollo