supplemento
Epidemiol Prev 2019; 43 (4): 17-36
DOI: https://doi.org/10.19191/EP19.4.S2.P017.090

A Systematic Review of Case-Identification Algorithms Based on Italian Healthcare Administrative Databases for Two Relevant Diseases of the Endocrine System: Diabetes Mellitus and Thyroid Disorders

  • Teresa Dalla Zuanna1

  • Gisella Pitter2

  • Cristina Canova1

  • Lorenzo Simonato1

  • Roberto Ganvi3

  1. Department of Cardiological, Thoracic and Vascular Sciences, University of Padua, Padua (Italy)
  2. Local Health Unit “Azienda ULSS 2 Marca Trevigiana”, Veneto Region, Treviso (Italy)
  3. Epidemiology Unit, ASL TO3, Piedmont Region, Grugliasco, Turin (Italy)
Teresa Dalla Zuanna -

FREE FULL TEXT (PDF)
SUPPLEMENTARY MATERIALS (PDF)

ABSTRACT

BACKGROUND: diabetes mellitus (DM) and thyroid disorders (TDs) are two of the most prevalent and relevant endocrine disorders worldwide, and determining their occurrence and their follow-up pathways is essential. In Italy, due to the presence of a universal health care system, administrative data can be effectively used to determine these measurements. DM is an ideal model for surveillance with administrative data, due to its specific pharmacologic treatment, high rate of hospitalization, and specific care units. The identification of TDs, conversely, is more challenging: they are less frequently managed in a hospital setting, and even if the treatment is highly specific, subclinical forms often do not need any pharmacological treatment.

OBJECTIVES: to identify and to describe all DM and TD case identification algorithms by means of Italian Healthcare Administrative Databases (HADs), through the review of papers published in the past 10 years.

METHODS: this study is part of a project that systematically reviewed case-identification algorithms for 18 acute and chronic conditions by means of HADs in Italy. PubMed was searched for original articles, published between 2007 and 2017, in Italian or English. The search string consisted of a combination of free text and MeSH terms with a common part that focused on HADs and a disease-specific part. All identified papers were screened by two independent reviewers. Pertinent papers were classified according to the objective for which the algorithm had been used, and only articles that used algorithms for “primary objectives” (I disease occurrence; II population/cohort selection; III outcome identification) were considered for algorithm extraction. The HADs used (hospital discharge records, drug prescriptions, etc.), ICD-9 and ICD-10 codes, ATC classification of drugs, follow-back periods, and age ranges applied by the algorithms have been reported. Further information on specific objective(s), accuracy measures, sensitivity analyses and the contribution of each HAD, have also been recorded. Algorithms were divided between those identifying type 2/not specified DM and type 1 DM, and those created to identify hypo- and hyperthyroidism.

RESULTS: of the 780 articles identified for DM, 77 were included and a further 14 papers were added by screening the references. For TD, 65 articles were identified through the search string and 5 of them were included. Of the selected articles, 64% and 80% were published after 2014 for DM and TD, respectively, and 33% (for DM) and 20% (for TD) used multicentric national or international data. Forty original algorithms for DM (29 for type 2 DM/not-specified DM, and 11 for type 1 DM) and 9 for TD (6 for hypo- and 3 for hyperthyroidism) were extracted. In 6 algorithms, specific selections were made so as not to include gestational diabetes. With regard to type 2 DM, the most commonly used sources were the drug prescription database (DPD, 27 cases), hospital discharge record database (HDD, 23 cases), and exemption from healthcare co-payment database (ECD, 19 cases). Other sources were the ambulatory care services database (ACD), birth register, and mortality record database (MRD). Among the 11 algorithms to identify type 1 DM, 9 used DPD, 7 ECD, and 6 HDD; in one case ACD codes were added, and all 11 algorithms but one was applied to a population of young people (always <35 years old). With regard to TDs, 2 algorithms from one paper for hypo and hyperthyroidism relied on DPD as the only source, the other 7 original algorithms combined DPD with HDD (5 cases), ECD (3 cases), and ACD (1 case). One paper identified autoimmune/iodine deficiency hypothyroidism by subtracting iatrogenic hypothyroidism cases (identified through records of previous procedures from HDD and ACD) from the whole hypothyroid population (identified through DPD). External validation was performed for two algorithms for DM and none for TD. The first algorithm for DM was obtained through HDD only and its sensitivity ranged from 61% to 70%, the second had a sensitivity of 71%.

CONCLUSION: Italian literature on the use of administrative healthcare data for case identification of diabetes is vast; the proposed algorithms are quite similar to one another, and the differences between them are rarely accompanied by clinical justification. On the contrary, the literature concerning thyroid disorders is relatively poor. Further validations of the proposed algorithms, as well as their further implementation, are needed.

Keywords: algorithms, healthcare administrative data, electronic health records, diabetes mellitus, thyroid disorders

RIASSUNTO

INTRODUZIONE: il diabete mellito (DM) e le patologie tiroidee (TD) sono i due gruppi di malattie endocrine a maggiore prevalenza e di maggiore impatto a livello mondiale, ed è essenziale stimarne l’occorrenza e valutarne i percorsi terapeutici e di follow-up. In Italia, grazie alla natura universalistica del sistema sanitario nazionale, è possibile ottenere tali misurazioni utilizzando i flussi amministrativi sanitari (FAS) in maniera integrata. Il DM rappresenta la patologia ideale per una sorveglianza con dati correnti, in virtù del trattamento farmacologico specifico, degli elevati tassi di ospedalizzazione e dei servizi ambulatoriali dedicati. Al contrario, l’identificazione delle TD è più complessa: raramente richiedono l'ospedalizzazione e, nonostante il trattamento farmacologico sia molto specifico, spesso le forme subcliniche non vengono identificate perché non richiedono alcun trattamento.

OBIETTIVI: identificare e descrivere tutti i lavori pubblicati negli ultimi 10 anni che, utilizzando FAS italiani, hanno elaborato almeno un algoritmo originale per l'identificazione di pazienti affetti da DM o TD.

METODI: questo studio si inserisce all’interno di un progetto di 16 revisioni sistematiche per la valutazione dello stato dell’arte degli algoritmi per l’identificazione di 18 condizioni acute e croniche. La revisione, effettuata in doppio, mira a identificare articoli originali pubblicati tra il 2007 e il 2017 in inglese o italiano, individuati su Pubmed mediante una stringa di ricerca che combina testo libero con termini MeSH, in parte comune a tutte le patologie e in parte patologia-specifica. Gli articoli pertinenti sono stati classificati secondo l’obiettivo di utilizzo degli algoritmi e solo gli articoli con obiettivo ‘primario (I stima di occorrenza; II identificazione di popolazioni/coorti; III identificazione della patologia come esito) sono stati inclusi nella revisione. Per ogni algoritmo sono state estratte informazioni sui FAS utilizzati (schede di dimissione ospedaliera – SDO, esenzioni ticket – ET, prescrizioni farmaceutiche – PF), i criteri di identificazione dei casi, il periodo di osservazione/follow-back e le fasce d'età considerate. Sono state inoltre riportate eventuali validazioni esterne. Per il DM, gli algoritmi che identificavano il DM di tipo 2 (o senza specifica) sono stati distinti da quelli che identificavano il DM di tipo 1, per la tiroide sono stati separati gli algoritmi creati per identificare ipo- ed ipertiroidismo.

RISULTATI: per il DM la stringa di ricerca ha identificato 780 articoli, di cui 77 sono stati inclusi e 14 ulteriori lavori sono stati aggiunti dalla revisione delle voci bibliografiche. Per la tiroide, sono stati inclusi 5 dei 65 lavori identificati dalla stringa. Tra i lavori selezionati, il 64% per il DM e l’80% per le TD erano stati pubblicati tra il 2014 e il 2017, e il 33% e il 20% utilizzavano dati multicentrici nazionali o internazionali. Dai lavori inclusi sono stati identificati 40 algoritmi originali per il DM (29 per il DM di tipo 2/non specificato e 11 per il DM di tipo 1) e 9 per le TD (6 per l’ipo- e 3 per l'ipertiroidismo). In 6 algoritmi per il DM erano state aggiunte selezioni per escludere i casi di diabete gestazionale. Nel caso del DM di tipo 2, i FAS più utilizzati erano le PF (27 casi), le SDO (23 casi), e le ET (19 casi). Altre fonti utilizzate erano le visite ambulatoriali e i registri di nascita e di mortalità. Tra gli 11 algoritmi identificati per il DM di tipo 1, 9 usavano le PF, 7 le ET, 6 le SDO e uno il flusso ambulatoriale. Tutti erano applicati a popolazioni di meno di 35 anni. Per quanto riguarda le TD, 2 algoritmi dello stesso lavoro utilizzavano solo le PF per ipo- e ipertiroidismo, gli altri 7 utilizzavano una combinazione di: PF e SDO (5 casi), ET (3 casi) e in un caso flusso ambulatoriale. Un lavoro identificava l’ipotiroidismo autoimmune o da carenza di iodio sottraendo i casi di ipotiroidismo iatrogeno (identificato dai record di procedure dalle SDO e dall’ambulatoriale) dall’intera popolazione ipotiroidea, identificata con le PF; 2 algoritmi per il DM (e nessuno per TD) sono stati validati.

CONCLUSIONI: in letteratura sono stati proposti numerosi algoritmi per l’identificazione di DM con l’utilizzo di FAS, abbastanza simili fra loro e le differenze sono raramente accompagnate da giustificazione clinica. Al contrario, gli algoritmi proposti per le patologie tiroidee sono ancora pochi. Sono necessari ulteriori studi di validazione sugli algoritmi proposti e un’ulteriore implementazione degli stessi.

Parole chiave: algoritmi, database amministrativi sanitari, diabete mellito, ipotiroidismo, ipertiroidismo