supplemento
Epidemiol Prev 2019; 43 (4): 51-61
DOI: https://doi.org/10.19191/EP19.4.S2.P051.092

A Systematic Review of Case-Identification Algorithms Based on Italian Healthcare Administrative Databases for Three Relevant Diseases of the Cardiovascular System: Hypertension, Heart Failure, and Congenital Heart Diseases

  • Giulia Lorenzoni1

  • Ileana Baldi1

  • Marta Soattin2

  • Dario Gregori1

  • Alessandra Buja2

  1. Department of Cardio-Thoraco-Vascular Sciences and Public Health, University of Padua, Padua (Italy)
  2. Hygiene and Public Health Unit, Department of Cardio-Thoraco-Vascular Sciences and Public Health, University of Padua, Padua (Italy)
Dario Gregori -

FREE FULL TEXT (PDF)
SUPPLEMENTARY MATERIALS (PDF)

ABSTRACT

OBJECTIVES: to identify and describe all hypertension, heart failure (HF), and congenital heart disease case-identification algorithms by means of Italian Healthcare Administrative Databases (HADs), through the review of papers published in the past 10 years.

METHODS: this study is part of a project that systematically reviewed case-identification algorithms for 18 acute and chronic conditions by means of HADs in Italy. PubMed was searched for original articles, published between 2007 and 2017, in Italian or English. The search string consisted of a combination of free text and MeSH terms with a common part that focused on HADs and a disease-specific part. All identified papers were screened by two independent reviewers. Pertinent papers were classified according to the objective for which the algorithm had been used, and only articles that used algorithms for primary objectives (I disease occurrence; II population/cohort selection; III outcome identification) were considered for algorithm extraction. The HADs used (hospital discharge records, drug prescriptions, etc.), ICD-9 and ICD-10 codes, ATC classification of drugs, follow-back periods, and age ranges applied by the algorithms have been reported. Further information on specific objective(s), accuracy measures, sensitivity analyses, and the contribution of each HAD have also been recorded.

RESULTS: the search strategy identified 429 papers for hypertension, 479 for HF, and 138 for congenital heart diseases. After title/abstract and full-text screening, the review led to the inclusion of 21 articles for hypertension, 24 for HF, and only 1 for congenital heart diseases. Eighteen algorithms had a primary objective (5 hypertension, 12 HF, 1 congenital heart diseases). All the hypertension algorithms were based on the drug prescription database, except for one algorithm that also used the hospital discharge records and the exemption from co-payment database. As for HF, all the algorithms employed the hospital discharge record database and only two algorithms used another information source. The only algorithm identified for congenital heart diseases was based on the hospital discharge database. The algorithm identified for congenital heart diseases was validated, showing excellent performance. Conversely, only one hypertension algorithm was validated, and none of the HF algorithms were validated – even though 5 out of 12 algorithms were based on previous algorithms used at both national and international level.

CONCLUSION: the findings of the present study showed wide use of Italian administrative databases for the detection of hypertension and heart failure cases. However, the validity of the algorithms in most cases has not been tested, highlighting the need for introducing stricter requirements to enforce the assessment of the validity of the algorithms used.

Keywords: algorithms, healthcare administrative databases, hypertension, heart failure, congenital heart diseases

RIASSUNTO

OBIETTIVI: effettuare una revisione degli articoli scientifici pubblicati negli ultimi 10 anni al fine di identificare e descrivere gli algoritmi impiegati per l’identificazione di casi di ipertensione, scompenso cardiaco e cardiopatie congenite da flussi amministrativi sanitari (FAS) italiani.

METODI: il presente studio si colloca all’interno di un più ampio progetto finalizzato alla valutazione dello stato dell’arte degli algoritmi per l'identificazione dei casi di 18 patologie acute e croniche. La revisione ha riguardato gli articoli indicizzati in PubMed, pubblicati tra il 2007 e il 2017, in lingua italiana o inglese. La stringa di ricerca consisteva in una combinazione di testo libero e termini MeSH, con una parte comune riguardante i FAS e una parte specifica per le patologie di interesse. Gli articoli identificati sono stati esaminati da due revisori indipendenti. Gli articoli pertinenti sono stati classificati in base all’obiettivo per il quale era stato utilizzato l’algoritmo e solo gli articoli che utilizzavano algoritmi con “obiettivo primario” (I stima di occorrenza; II identificazione di popolazioni/coorti; III identificazione della patologia come esito) sono stati considerati per l’estrazione dell’algoritmo. Per ogni algoritmo sono state estratte informazioni riguardo i tipi di FAS utilizzati, i codici ICD versione 9 e 10, il sistema di classificazione ATC per i farmaci, i criteri di identificazione dei casi, il periodo di osservazione/follow-back e le fasce d'età considerate. Se disponibili, sono inoltre state estratte le informazioni relative ad eventuali processi di validazione esterna con le relative misure di accuratezza.

RISULTATI: la strategia di ricerca ha portato all’identificazione di 429 articoli per l’ipertensione, 479 per lo scompenso cardiaco e 138 per le cardiopatie congenite. Lo screening dei risultati ha portato all’inclusione di 21 articoli per l’ipertensione, 24 per lo scompenso cardiaco e di un solo articolo per le cardiopatie congenite. Diciotto algoritmi avevano un obiettivo primario (5 ipertensione, 12 scompenso cardiaco, 1 cardiopatie congenite). Tutti gli algoritmi riguardanti l’ipertensione erano basati sulle prescrizioni farmaceutiche, ad eccezione di un algoritmo che utilizzava anche le schede di dimissione ospedaliera (SDO) e le esenzioni ticket. Per quanto riguarda lo scompenso cardiaco, tutti gli algoritmi utilizzavano le SDO e solo due algoritmi utilizzavano un’altra fonte di informazioni oltre alle SDO. L’unico algoritmo identificato per le cardiopatie congenite era basato sulle SDO. L’algoritmo identificato per le cardiopatie congenite era stato sottoposto a un processo di validazione, mostrando un’ottima performance. Al contrario, solo uno degli algoritmi per l’identificazione dei casi di ipertensione era stato validato e nessuno degli algoritmi per l’identificazione dei casi di scompenso cardiaco era stato validato, anche se 5 su 12 algoritmi identificati per quest’ultima patologia erano basati su algoritmi utilizzati a livello nazionale e internazionale.

CONCLUSIONE: i risultati del presente studio mostrano che i FAS italiani sono ampiamente utilizzati per l’individuazione dei casi di ipertensione e scompenso cardiaco. Tuttavia, la validità degli algoritmi nella maggior parte dei casi non è stata testata, evidenziando la necessità di introdurre requisiti più severi per la valutazione della performance degli algoritmi utilizzati.

Parole chiave: algoritmi, flussi amministrativi sanitari, ipertensione, scompenso cardiaco, cardiopatie congenite