supplemento
Epidemiol Prev 2019; 43 (4): 88-96
DOI: https://doi.org/10.19191/EP19.4.S2.P088.095

A Systematic Review of Case-Identification Algorithms Based on Italian Healthcare Administrative Databases for Three Relevant Diseases of the Digestive and Genitourinary System: Inflammatory Bowel Diseases, Celiac Disease, and Chronic Kidney Disease

  • Riccardo Di Domenicantonio1

  • Giovanna Cappai1

  • Nera Agabiti1

  • Claudia Marino1

  • Lorenzo Simonato2

  • Cristina Canova2

  • Gisella Pitter3

  1. Department of Epidemiology, Lazio Regional Health Service, ASL Roma 1, Rome (Italy)
  2. Department of Cardiological, Thoracic and Vascular Sciences, University of Padua, Padua (Italy)
  3. Local Health Unit “Azienda ULSS 2 Marca Trevigiana”, Veneto Region, Treviso (Italy)
Riccardo Di Domenicantonio

FREE FULL TEXT (PDF)
SUPPLEMENTARY MATERIALS (PDF)

ABSTRACT

OBJECTIVES: to identify and describe all Inflammatory Bowel Disease (IBD), Celiac Disease (CD), and Chronic Kidney Disease (CKD) case-identification algorithms by means of Italian Healthcare Administrative Databases (HADs), through a review of papers published in the past 10 years.

METHODS: this study is part of a project that systematically reviewed case-identification algorithms for 18 acute and chronic conditions by means of HADs in Italy. PubMed was searched for original articles, published between 2007 and 2017, in Italian or English. The search string consisted of a combination of free text and MeSH terms with a common part that focused on HADs and a disease-specific part. All identified papers were screened by two independent reviewers; exclusion criteria were the following: no details of algorithms reported, algorithm not developed in the Italian context, exclusive use of data from the death certificate register, or from general practitioner or pediatrician databases. Pertinent papers were classified according to the objective for which the algorithm had been used, and only articles that used algorithms for primary objectives (I disease occurrence, II population/cohort selection, III outcome identification) were considered for algorithm extraction. The HADs used (hospital discharge records, drug prescriptions, etc.), ICD-9 and ICD-10 codes, ATC classification of drugs, followback periods, and age ranges applied by the algorithms have been reported. Further information on specific objective(s), accuracy measures, sensitivity analyses and the contribution of each HAD, have also been recorded.

RESULTS: the search string led to the identification of 98 articles for IBD, 42 articles for CD, and 390 for CKD. By screening the references, one paper for IBD was added. Finally, this led to 5, 9, and 8 pertinent papers respectively for IBD, CD, and CKD. Considering the papers on IBD and CD, specific age selections were applied to focus on children and young adult populations. When a selection on age was applied for CKD, instead, it mostly considered individuals aged more than 18 years. Three algorithms for IBD, 4 for CD, and 5 for CKD were extracted from papers and characterized. Drug prescription databases were used for both IBD and CKD algorithms, whereas the hospital discharge database and co-payment exemption database were used for IBD and CD. Pathology records and specialist visit databases were also used for CD and CKD, respectively. For each disease only one algorithm applied criteria for the exclusion of prevalent cases. External validation was performed only for Crohn’s disease among IBDs, in one algorithm.

CONCLUSIONS: the results of this review indicate that case identification for IBD and CD from routinely collected data can be considered feasible and can be used to perform different kinds of epidemiological studies. The same is not true for CKD, which requires further efforts, mainly to improve the detection of early stage patients.

Keywords: algorithms, healthcare administrative databases, inflammatory bowel disease, celiac disease, chronic kidney disease

RIASSUNTO

OBIETTIVI: identificare e descrivere tutti i lavori pubblicati negli ultimi 10 anni che, utilizzando flussi amministrativi sanitari (FAS) italiani, hanno elaborato almeno un algoritmo originale per l’identificazione di soggetti affetti da malattie infiammatorie croniche dell’intestino (MICI), malattia celiaca (MC) e malattia renale cronica (MRC).

METODI: questo studio si inserisce all’interno di un progetto di 16 revisioni sistematiche per la valutazione dello stato dell’arte degli algoritmi per l’identificazione di 18 patologie acute e croniche. La revisione, effettuata da due revisori indipendenti, mira a identificare articoli originali pubblicati tra il 2007 e il 2017 in inglese o italiano, individuati su PubMed mediante una stringa di ricerca costituita sia da testo libero che da termini MeSH, con una parte comune a tutte le patologie e una parte specifica per patologia. I lavori pertinenti sono stati classificati a seconda dell’obiettivo per cui ciascun algoritmo è stato utilizzato e si sono estratti i dati solo dagli algoritmi con obiettivi primari (I occorrenza di malattia, II selezione di coorti/popolazioni, III identificazione di esito). I criteri di esclusione sono stati i seguenti: assenza di una descrizione degli algoritmi riportati; sviluppo dell’algoritmo al di fuori del contesto italiano; uso esclusivo di: certificate di morte, registri di patologia, dati dei medici di medicina generali o dei pediatri di libera scelta. Le informazioni estratte per caratterizzare e confrontare gli algoritmi originali sono: i FAS utilizzati (schede di dimissione ospedaliera, prescrizioni farmaceutiche, etc.), i codici ICD-9 e ICD-10, la selezione dei farmaci secondo il sistema di classificazione ATC, i criteri di identificazione dei casi, il periodo di osservazione/followback, i criteri di selezione anagrafica applicati ed eventuali validazioni esterne con le relative misure di accuratezza (sensibilità, specificità, valori predittivi) riportate.

RISULTATI: la stringa di ricerca ha portato all’identificazione di 98, 42 e 390 articoli, rispettivamente per MICI, MC e MRC, con l’aggiunta dai riferimenti bibliografici di un articolo per le MICI. Alla fine del processo di selezione, sono stati identificati 5 lavori pertinenti per le MICI, 9 per la MC e 8 per la MCR. Nell’ambito degli articoli su MICI e MC sono stati applicati criteri specifici per la selezione della popolazione pediatrica e dei giovani adulti, mentre per la MRC la maggior parte dei lavori ha considerato la popolazione adulta. Sono stati estratti dagli articoli e caratterizzati tre algoritmi per MICI, 4 per la MC e 5 per la MRC. I dati relativi alle prescrizioni farmaceutiche sono stati utilizzati sia negli algoritmi per l’identificazione delle MICI che della MRC, mentre sono stati considerati sia le esenzioni che i ricoveri per MICI e MC. I referti di anatomia patologica e le prestazioni ambulatoriali sono state utilizzate, rispettivamente, per l’identificazione della MC e della MRC. Per ciascuna patologia, solamente in un algoritmo è stato applicato un criterio per l’esclusione dei casi prevalenti. Un solo algoritmo, sviluppato per la malattia di Crohn, nell’ambito delle MICI, è stato oggetto di validazione.

CONCLUSIONE: gli elementi emersi dalla revisione indicano che l’identificazione delle MICI e della MC attraverso l’uso dei FAS può essere ritenuta affidabile e può essere utilizzata per condurre diversi tipi di studi epidemiologici. Differentemente per la MRC, è necessario lo sviluppo di ulteriori approcci, mirati principalmente a migliorare la capacità di identificazione dei pazienti con forme precoci della patologia.

Parole chiave: algoritmi, dati amministrativi sanitari, malattie infiammatorie croniche, malattia celiaca, malattia renale cronica