5. Sperimentare una nuova valutazione dell’invalidità in quattro regioni italiane

La valutazione dell’invalidità civile in Italia, che determina i diritti e le prestazioni di una persona, è obsoleta e incompleta perché si limita all’identificazione di una condizione medica o di un deficit della funzionalità che determina la percentuale di invalidità civile, senza prendere in considerazione l’effettiva esperienza di disabilità della persona e il contesto in cui vive. Con l’approvazione della legge delega nel 2021 (Legge 227/2021), l’Italia ha compiuto un primo passo verso la riforma della sua politica sulla disabilità. I decreti attuativi della legge delega, che sono attualmente in fase di elaborazione e che beneficeranno anche del contributo del progetto presentato in questa relazione, prevederanno la valutazione della condizione di disabilità e la revisione delle procedure di valutazione di base da effettuare in conformità con le disposizioni della Convenzione delle Nazioni Unite sui diritti delle persone con disabilità, anche attraverso l’adozione della Scheda per la valutazione della disabilità dell’OMS (WHODAS) – il fulcro del progetto pilota realizzato in Italia – all’interno del nuovo sistema di valutazione di base previsto dalla legge.

Per preparare il terreno alla riforma, lo strumento WHODAS è stato sperimentato in quattro regioni italiane – Campania, Lombardia, Regione Autonoma della Sardegna e Provincia Autonoma di Trento – per testare la fattibilità dell’inclusione di informazioni funzionali nell’attuale valutazione dell’invalidità civile. WHODAS è stata sviluppata dall’OMS come strumento per identificare la natura e il tipo di problemi che le persone affrontano nella loro vita, in linea con la Classificazione Internazionale del Funzionamento, della Disabilità e della Salute (ICF). WHODAS è stata testata con successo in molti Paesi e contesti. Se da un lato l’Italia può attingere all’esperienza di altri Paesi, dall’altro era importante testare la validità e l’affidabilità dello strumento in Italia e la capacità degli operatori sociali di implementarlo. Questo capitolo riassume i risultati del pilota, che si è svolto da ottobre 2022 ad aprile 2023.

Nel quadro ICF, le informazioni sulle categorie di Attività e Partecipazione possono essere raccolte sia dal punto di vista dell’abilità (che riflette esclusivamente la capacità prevista di una persona di svolgere le attività considerando le sue condizioni di salute e le sue ridotte funzionalità), sia dal punto di vista della performance (che riflette l’effettivo svolgimento delle attività nelle circostanze ambientali reali in cui vive una persona). Le informazioni sull’abilità rappresentano in genere i risultati di un’inferenza o di un giudizio clinico basato su informazioni mediche, mentre le performance sono una descrizione reale di ciò che accade nella vita di una persona. Le due prospettive sono pertanto molto diverse, anche se l’abilità costituisce un fattore determinante della performance.

L’ICF intende per “disabilità” qualsiasi livello di problema o difficoltà di funzionamento in un qualche ambito, dal punto di vista delle performance. L’OMS ha sviluppato, testato e raccomandato WHODAS come strumento in grado di acquisire informazioni in merito alle performance delle attività di una persona nella sua vita quotidiana e nel suo ambiente reale. L’“ambiente reale” è rappresentato nell’ICF in termini di fattori ambientali che agiscono come facilitatori (ad esempio, dispositivi di assistenza, supporti, modifiche alla casa) o come barriere (ad esempio, case, strade ed edifici pubblici inaccessibili, stigma e discriminazione). Il questionario WHODAS è strutturato intorno a sei domini di funzionamento di base: attività cognitive, mobilità, cura di sé, interagire con le persone, attività della vita quotidiana e partecipazione.

La versione “clinica” del questionario WHODAS raccoglie informazioni sui problemi di funzionamento, vale a dire la disabilità, mediante un’intervista faccia a faccia condotta da un intervistatore qualificato che pone una serie di domande standardizzate e, se necessario, domande di approfondimento. WHODAS utilizza una scala di risposta a 5 livelli (1 = Nessuna, 2 = Poca, 3 = Moderata, 4 = Molta, 5 = Moltissima o Non ho potuto farlo) per valutare ogni domanda. In circostanze straordinarie (ad esempio, lockdown causa COVID-19), WHODAS può essere somministrata in un’intervista telefonica o video da parte di professionisti prepararti. Agli intervistati viene detto che le loro risposte a ciascun dominio di funzionamento devono essere date tenendo in considerazione le performance, devono cioè descrivere ciò che fanno, tenendo conto delle esperienze nella loro vita quotidiana e delle barriere e dei facilitatori ambientali che incontrano. Per il progetto pilota è stata scelta la versione a 36 item di WHODAS, per creare un quadro completo della disabilità vissuta dall’intervistato nella sua vita quotidiana.

In totale, 3.307 persone hanno partecipato al pilota. I dati di 65 persone non sono stati inclusi nell’analisi a causa del numero elevato di valori mancanti nelle loro risposte. Le caratteristiche socio-demografiche dei restanti N = 3.242 persone sono mostrate in Tabella 5.1, regione per regione. La percentuale di partecipanti maschi era inferiore al 50% in tutte e quattro le regioni. L'età media variava notevolmente tra le regioni: 52,2 anni in Campania, 49,8 anni in Lombardia, 50,7 anni in Sardegna e 48,8 anni in Trentino. In tutte le regioni è stata riportata una media di circa 11 anni di istruzione. La maggior parte dei partecipanti ha dichiarato il proprio stato civile come sposato e la maggior parte degli intervistati ha vissuto in modo indipendente nella comunità. La percentuale di persone che vivono in condizioni di vita assistita è stata più alta in Trentino.

I dati sull’occupazione sono stati raccolti in modi diversi, per cui per alcuni dei dati raccolti in Campania mancano informazioni dettagliate, ad esempio non è stato possibile determinare se la disoccupazione fosse legata alla salute o meno, o se l’attività lavorativa fosse per un datore di lavoro o autonoma. Nel complesso, i partecipanti hanno indicato di avere un lavoro retribuito (39,7%) o di essere disoccupati per motivi di salute (21,6%) o per altri motivi (15,6%). La quota di lavoro retribuito era particolarmente alta in Lombardia (47,7%) e in Trentino (48,2%).

La Tabella 5.2 presenta la frequenza e le percentuali dei capitoli diagnostici ICD-11 osservati, con l’avvertenza che i dati sulle patologie sono stati raccolti in modo diverso nelle quattro regioni. I codici delle patologie sono stati collegati al capitolo ICD-11 più vicino, l’ultima versione della Classificazione internazionale delle malattie dell’OMS (ICD-11). Molte persone nel set di dati hanno più di una diagnosi. Se diverse diagnosi si collegano a un solo capitolo ICD, il capitolo è stato riportato solo una volta. La situazione è diversa per le persone con più di una patologia afferenti a capitoli ICD diversi. Le informazioni relative alla priorità delle diverse diagnosi non erano disponibili per la maggior parte dei dati. Si è quindi deciso di includere nelle analisi per patologie tutte le diagnosi del capitolo ICD registrate per una persona. Pertanto, il numero totale di patologie presentate nella Tabella 5.2 è maggiore del campione totale, in quanto una persona con due patologie diverse viene contata due volte. Questo non dovrebbe influire sui risultati per patologie.

La Figura 5.1 visualizza come sono state valutate le 36 voci del questionario WHODAS. La percentuale di valori mancanti era più alta, vale a dire circa il 50%, per gli item da D5.5 a D5.8 che valutano le difficoltà sul lavoro (o a scuola). Queste quattro domande sono state eliminate dalla costruzione del punteggio WHODAS a causa dell’elevata percentuale di valori mancanti. Oltre il 30% dei valori mancanti è stato riscontrato anche per altre due domande, D5.1 (Occuparsi della casa e della famiglia) e D5.2 (Svolgere le attività domestiche più importanti), poiché queste due domande non sono state valutate in modo coerente in tutte le regioni all’inizio del progetto pilota.

La Figura 5.2 mostra la distribuzione dei punteggi grezzi totali ottenuti sommando i 32 elementi di WHODAS. Il punteggio totale grezzo di WHODAS va da 32 a 160, anche se sono possibili alcuni punteggi totali inferiori a 32, poiché i punteggi sono calcolati sui dati grezzi con alcuni valori mancanti (meno del 20%). I segmenti in Figura 5.2 indicano la posizione e il valore del 1°, 2° e 3° quartile, con un punteggio mediano (2° quartile) di 75. Le linee di densità in Figura 5.3 mostrano la densità dei punteggi osservati (linea nera) e la corrispondente distribuzione normale con la stessa media e deviazione standard (linea tratteggiata). I punteggi in questo campione per l’Italia sono distribuiti in modo relativamente normale, un dato comune anche ad altri Paesi in cui WHODAS è stato testato (tra cui Bulgaria, Grecia, Lettonia, Lituania, Romania e Seychelles).

Le distribuzioni dei punteggi grezzi WHODAS nelle quattro regioni che hanno partecipato al progetto pilota presentano piccole differenze (Figura 5.4). Il punteggio mediano WHODAS più alto (linea tratteggiata blu) si trova in Campania (Q2 = 84) e il punteggio mediano più basso in Trentino (Q2 = 70). I punteggi grezzi WHODAS più alti indicano livelli di disabilità più elevati tra coloro che vengono sottoposti a una valutazione di disabilità. Per il resto, tuttavia, le figure mostrano punteggi grezzi WHODAS distribuiti in modo piuttosto normale per tutte e quattro le regioni partecipanti.

Un obiettivo della valutazione pilota era quello di valutare la validità e l’affidabilità dello strumento WHODAS in Italia. Ciò è stato fatto attraverso l’analisi di Rasch, un metodo statistico del campo della misurazione probabilistica introdotto per la prima volta dal matematico danese George Rasch (Rasch, 1960[1]). L’analisi Rasch consiste essenzialmente nel testare diverse ipotesi di misurazione (Bond, 2015[2]; Tennant and Conaghan, 2007[3]): (1) il targeting di una scala, (2) l’affidabilità del modello, (3) l’ordinamento delle opzioni di risposta degli item, (4) l’assenza di correlazione tra gli item (le cosiddette dipendenze locali degli item, o LID dall’inglese Local Item Dependencies), (5) l’adattamento degli item al modello di Rasch, (6) l’assenza di effetti di fattori personali come il sesso e l’età sulle risposte degli item (il cosiddetto funzionamento differenziale dell’item, o DIF dall’inglese Differential Item Functioning), e (7) l’unidimensionalità del questionario. Se questi presupposti di misurazione possono essere soddisfatti, un questionario può essere considerato psicometricamente valido e i punteggi totali derivati possono essere dunque considerati a scala intervallare e validi per la misurazione.

Per un questionario ben funzionante, ci si aspetta che la difficoltà degli item sia abbinata al livello di abilità della popolazione misurata, vale a dire che il questionario non dovrebbe essere troppo facile o troppo difficile. Statisticamente, un buon targeting (ipotesi #1) si ottiene se la difficoltà media degli item e l’abilità media della persona si avvicinano a zero. Un Indice di separazione della persona (PSI, dall’inglese Person Separation Index) superiore a 0,8 indica una buona affidabilità della scala e valori superiori a 0,9 indicano un’ottima affidabilità (ipotesi #2). Il PSI indica la capacità della scala di discriminare i livelli di funzionamento nella popolazione. Il valore Cronbach α, che di solito viene riportato, è una misura classica della coerenza interna dei dati, ossia quanto gli item funzionano per descrivere un costrutto (Nunnally and Bernstein, 1994[4]). In presenza di opzioni di risposta disordinate (ipotesi #3), l’analisi delle curve di probabilità di risposta consente di determinare quali opzioni di risposta causano problemi e di decidere le strategie per aggregare le opzioni di risposta disordinate. Ad esempio, se per un item le opzioni di risposta 2 e 1 appaiono invertite e indicano che non è possibile discriminare un aumento di difficoltà, le risposte dell’item possono essere ricodificate in modo che queste opzioni rappresentino un solo livello di risposta. Le LID si verificano spesso quando gli item sono ridondanti e misurano approssimativamente lo stesso aspetto di un costrutto (ipotesi #4). La statistica più diffusa per le dipendenze degli item è la matrice di correlazione dei residui di Rasch (Yen, 1984[5]). Le correlazioni residue superiori a 0,2 sono considerate non accettabili e un modo per gestire queste dipendenze locali degli item, senza eliminare gli item, è quello di aggregare (cioè sommare) gli item correlati nei cosiddetti testlet, ossia un gruppo di domande sullo stesso argomento (Yen, 1993[6]). Nei testlet di item, l’ordine delle soglie non è più previsto. Per un buon adattamento degli item (ipotesi #5), i valori di infit e outfit dovrebbero essere inferiori a 1,2 (Smith, Schumacker and Bush, 1998[7]). La statistica outfit è più sensibile agli outlier rispetto alla statistica infit. Idealmente, gli item di un questionario dovrebbero essere equi e non favorire sottogruppi del campione. L’analisi del DIF permette di segnalare le variabili esogene, o variabili DIF (ipotesi #6), che conducono a una mancanza di invarianza della difficoltà degli item (Holland and Wainer, 1993[8]).. Vale la pena notare che un’analisi DIF non indica sempre una distorsione metrica, ma può anche semplicemente rappresentare sottogruppi con capacità di base diseguali (Boone, Staver and Yale, 2014[9]). L’analisi DIF è stata condotta per età e sesso, per determinare gli item sensibili a queste covariate esterne. Infine, un questionario dovrebbe misurare un solo costrutto. Se un questionario mostra di avere diverse dimensioni separate, la validità di un punteggio totale riassuntivo non è supportata. L’unidimensionalità (ipotesi #7) è stata valutata con un’analisi delle componenti principali dei residui di Rasch (Smith, 2002[10]). In genere, un primo autovalore inferiore a 1,8 è considerato indicativo di unidimensionalità. Sulla base di analisi di simulazione, Smith e Miao (1994[11]) hanno suggerito di considerare invece la dimensione della seconda componente, con valori inferiori a 1,4 indicativi di unidimensionalità.

L’analisi Rasch per il set di dati italiano ha mostrato che la scala è multidimensionale, con una forte tendenza degli item a correlarsi con altre variabili all’interno dei domini WHODAS. Solo pochi item si correlavano tra i domini e, allo stesso modo, solo pochi item erano privi di dipendenze. Per risolvere i problemi di multidimensionalità e di dipendenza locale degli item, gli item correlati sono stati aggregati tenendo conto della struttura del dominio del questionario WHODAS. I risultati possono essere riassunti come segue:

  1. 1. La popolazione inclusa in questa analisi ha presentato un ottimo targeting alla scala.

  2. 2. L’affidabilità degli articoli era elevata, ma anche gonfiata all’inizio dell’analisi a causa delle dipendenze degli item (PSI=0,95, Cronbach α=0,95). L’affidabilità è risultata ancora buona anche dopo gli aggiustamenti apportati (PSI=0,88, Cronbach α=0,89).

  3. 3. Le soglie di risposta di 23/32 item del questionario WHODAS presentavano disordine. Gli item dipendenti localmente possono essere una spiegazione del disordine, così come la mancanza di discriminazione tra le due prime opzioni di risposta, ossia le categorie di risposta “Nessuna” e “Poca”.

  4. 4. L’analisi delle dipendenze residue ha mostrato forti dipendenze locali tra la maggior parte degli item del questionario WHODAS, con la tendenza degli item del questionario dello stesso dominio ad associarsi. Per gestire queste dipendenze, gli item sono stati aggregati considerando la struttura del dominio dello strumento. Non si prevede che le soglie dei testlet siano ordinate.

  5. 5. L’adattamento dell’item è buono se i valori di infit e outfit sono inferiori a 1,2. Tre dei 32 item hanno mostrato un misfit con infit o outfit al di sopra del cut-off: D1.5 (Capire quello che dicono gli altri), D6.4 (Quanto tempo ha dedicato al suo problema di salute o alle sue conseguenze) e D6.6 (Quanto la sua salute ha prosciugato le risorse economiche sue o della sua famiglia). Dopo l’aggregazione degli item per dominio, tutti i testlet hanno mostrato buoni valori di infit e di outfit, inferiori a 1,2.

  6. 6. L’analisi DIF ha indicato che tutti i domini WHODAS sono sensibili all’età. Le risposte al dominio 1 (Attività cognitive – comprendere e comunicare) e al dominio 5(1) (Attività della vita quotidiana) sono influenzate anche dal sesso dell’intervistato.

  7. 7. L’analisi delle componenti principali ha indicato che gli item si raggruppano per domini, il che si traduce in una multidimensionalità, con un 1° autovalore di 5,29 e un 2° autovalore di 2,87. Dopo gli aggiustamenti, ossia l’aggregazione degli item per domini WHODAS, il 1° autovalore è sceso a 1,93 e il 2° autovalore a 1,29, indicando l’unidimensionalità secondo i criteri definiti.

In conclusione, i test psicometrici statistici hanno confermato la validità e l’affidabilità dello strumento WHODAS nel contesto italiano. L’analisi statistica delle proprietà psicometriche di WHODAS con i dati del pilota in Italia mostra che i dati di funzionamento raccolti con WHODAS presentano solide proprietà psicometriche. È importante tenere presente che l’OMS ha sviluppato WHODAS esplicitamente per acquisire statisticamente il costrutto di funzionamento dalla prospettiva della performance, ossia l’esperienza di svolgere attività da parte di una persona con un problema di salute di base nel suo ambiente di vita quotidiano. Sulla base di proprietà psicometriche soddisfacenti, si può concludere con certezza che le informazioni raccolte con il questionario WHODAS sono solide, valide e pertinenti e che rappresentano validamente il costrutto di disabilità come inteso nell’ICF e nella Convenzione delle Nazioni Unite sui diritti delle persone con disabilità (UNCRPD). L’inclusione del questionario WHODAS nella valutazione dello stato di disabilità in Italia (i) rafforzerebbe in modo significativo il metodo di valutazione attualmente in uso (che è una valutazione medica basata sull’esistenza di deficit della funzionalità) e lo allineerebbe all’approccio generale dell’Italia alla disabilità; (ii) lo avvicinerebbe all’intendimento della disabilità dell’ICF e della UNCRPD; e (iii) armonizzerebbe l’approccio alla valutazione con l’approccio basato sul funzionamento dell’ICF utilizzato nelle successive valutazioni dei bisogni individuali.

Non sono disponibili cut-off concordati e pubblicati per il punteggio WHODAS, applicabili a una popolazione con condizioni di salute diverse per classificare la gravità della loro disabilità. Avere dei cut-off stabiliti permetterebbe di individuare le persone con disabilità significative e di riflettere, ed eventualmente riconsiderare, le percentuali di invalidità civile attribuite. Alcuni studi riportano il 90° o il 95° percentile della distribuzione dei punteggi WHODAS come il miglior cut-off per diagnosticare una grave disabilità o disfunzionalità in alcuni gruppi specifici, come le donne post-partum (Mayrink et al., 2018[12]) o la popolazione anziana (Ferrer et al., 2019[13]). Non è stata ancora stabilita una differenza minima clinicamente importante nei punteggi di WHODAS (Federici et al., 2016[14]). Tuttavia, sulla base di diversi progetti pilota precedenti e comparabili condotti dalla Banca Mondiale utilizzando il questionario WHODAS in Grecia, Lettonia, Lituania e Bulgaria, i punti di cut-off significativi della disabilità WHODAS per il punteggio 0-100 basato sull’analisi di Rasch sono suggeriti come segue:

  • Punteggio 0-25: nessuna limitazione funzionale (cioè nessuna difficoltà nelle performance/disabilità)

  • Punteggio 26-40: limitazioni funzionali moderate (cioè difficoltà moderate nelle performance/disabilità)

  • Punteggio 41-60: limitazioni funzionali gravi (cioè gravi difficoltà nelle performance/disabilità).

  • Punteggio 61-100: limitazioni funzionali molto gravi (cioè difficoltà molto gravi nelle performance/disabilità)

Un punteggio di 40 sarebbe quindi un cut-off centrale per determinare la presenza di una disabilità e, quindi, l’idoneità ai servizi. In totale, il campione presentava N = 74 (2,3%) di individui senza limitazioni funzionali, N = 972 (30,0%) di individui con limitazioni funzionali moderate, N = 2.120 (65,4%) di individui con limitazioni funzionali gravi e N = 76 (2,3%) di individui con limitazioni funzionali molto gravi.

Più avanti in questo capitolo, vengono introdotti ulteriori cut-off per dividere i due gruppi mediani in cui si concentra la maggior parte delle persone, distinguendo così le limitazioni funzionali moderate inferiori e superiori (con punteggi WHODAS rispettivamente di 26-34 e 35-40) e le limitazioni funzionali gravi inferiori e superiori (con punteggi WHODAS rispettivamente di 41-48 e 49-60).

Le percentuali di invalidità civile attribuite alle persone con problemi di salute in Italia, a seguito della valutazione, possono essere suddivise in diverse categorie in vari modi. Sebbene non esistano punti di cut-off per una valutazione discrezionale, il diritto a varie prestazioni e supporti suggerisce la seguente suddivisione significativa:

  • 0-33%: nessuna invalidità

  • 34-66%: invalidità moderata, di cui

    • 34-45%: invalidità moderata inferiore

    • 46-66%: invalidità moderata superiore

  • 67-99%: invalidità grave, di cui

    • 67-73%: invalidità grave inferiore

    • 74-99%: invalidità grave superiore

  • 100%: invalidità molto grave

In totale, il campione pilota ha presentato N = 81 (2,8%) di persone senza invalidità civile, N = 1.129 (38,8%) di persone con invalidità civile moderata, N = 1.076 (37%) con invalidità civile grave e N = 623 (21,4%) di persone con invalidità civile molto grave valutata al 100%. Nel set di dati c’erano N = 333 (10,3%) persone senza alcuna percentuale di invalidità civile riportata. I diversi livelli di invalidità sono fondamentali per ottenere il supporto del sistema di protezione sociale italiano. Ad esempio, con una percentuale di invalidità civile superiore al 46% le persone possono richiedere un sostegno all’occupazione, con più del 67% le protesi sono fornite gratuitamente e con più del 74% le persone possono ricevere un assegno di invalidità non contributivo.

La Tabella 5.3 presenta le caratteristiche socio-demografiche del campione disaggregate per livello di disabilità in base al punteggio WHODAS. Con il 68,9%, la percentuale di uomini era più alta nel gruppo senza disabilità e vicina o inferiore al 50% negli altri casi. Vi è un aumento statisticamente significativo dell’età media (valore p < 0,001) tra i livelli di disabilità, da 45,7 anni con nessuna disabilità a 53,5 anni con disabilità molto grave. Il numero medio di anni di istruzione diminuisce significativamente con l’aumentare dello stato di disabilità (valore p < 0,001), da circa 12 anni con nessuna disabilità a circa 11 anni con disabilità molto grave. Per quanto riguarda la situazione di vita, il 77,3% dei partecipanti con disabilità molto grave vive in modo indipendente nella comunità, con quote superiori al 90% per tutti gli altri gruppi. La percentuale di persone che svolgono un lavoro retribuito è diminuita dal 56,8% del gruppo senza disabilità al 21,1% di quelli con disabilità molto grave.

La Tabella 5.4 presenta le caratteristiche socio-demografiche del campione disaggregate in base al livello di invalidità civile, seguendo le categorie di cut-off sopra proposte. La percentuale di uomini è più alta e superiore al 50% solo nel gruppo di persone senza invalidità civile. Anche in questo caso, c’è un aumento statisticamente significativo dell’età media (valore p < 0,001) tra i vari gradi di invalidità civile, da 45,2 anni nel gruppo senza invalidità a 52,9 anni nel gruppo con invalidità civile molto grave. Il numero medio di anni di istruzione è leggermente superiore a 11 anni in tutti i livelli di invalidità. La percentuale di persone che vivono in modo indipendente nella comunità è di circa l’85,2% tra le persone con un’invalidità molto grave e superiore al 90% per gli altri gruppi. Infine, la percentuale di persone che svolgono un lavoro retribuito diminuisce da circa il 44,4% nel gruppo di persone con invalidità civile nulla o moderata al 32,4% nel gruppo di persone con invalidità molto grave.

La Tabella 5.5 presenta il punteggio medio WHODAS, sulla scala 0-100, disaggregato per patologia, e la distribuzione della popolazione tra i capitoli dell’ICD-11. Gli individui con “Sintomi, segni o riscontri clinici, non classificati altrove” hanno presentato il punteggio WHODAS medio più alto, pari a 46,66. Le patologie meno invalidanti misurate da WHODAS sono le anomalie di sviluppo con un punteggio medio di 40,8. Tra le quattro patologie più frequenti, la categoria “Disturbi mentali, comportamentali o del sviluppo neurologico” ha il punteggio medio WHODAS più alto (44,95), mentre le altre tre limitazioni funzionali principali (neoplasie, malattie dell’apparato circolatorio e malattie dell’apparato muscolo-scheletrico) hanno tutte punteggi medi intorno a 43.

La Tabella 5.6 disaggrega il campione per patologia e grado di invalidità civile. In generale, i risultati mostrano che i punteggi WHODAS medi tendono ad aumentare con il grado di invalidità per la maggior parte delle patologie, anche se i risultati devono essere interpretati con cautela, a causa del numero ridotto di casi nel gruppo senza invalidità (N = 81). Non è la stessa patologia a ricevere regolarmente il punteggio WHODAS più alto nei diversi gruppi di grado di invalidità civile. Considerando solo le quattro patologie principali, per le quali la dimensione del campione è sufficientemente ampia per trarre conclusioni affidabili, si può osservare quanto segue:

  • Le malattie del sistema muscolo-scheletrico sono la patologia dominante tra le persone con un livello di invalidità civile moderato (25,5% di quelle con percentuale del 34-66%). Per queste malattie, i punteggi WHODAS medi aumentano chiaramente e gradualmente con il grado di invalidità, da circa 38,1 a 49,8.

  • Le neoplasie sono la patologia dominante tra le persone con livelli di invalidità molto gravi (38,5% di quelle con percentuale del 100%). I punteggi medi WHODAS sono più bassi rispetto alle altre patologie principali, in tutti i livelli di invalidità con percentuale superiore al 33%.

  • Le malattie dell’apparato circolatorio sono particolarmente frequenti nelle due categorie di invalidità intermedie, invalidità moderata e grave (cioè, percentuale del 34-99%). I punteggi medi WHODAS si collocano generalmente tra quelli delle neoplasie e delle malattie dell’apparato muscolo-scheletrico.

  • La percentuale di disturbi mentali, comportamentali o dello sviluppo neurologico aumenta leggermente con l’aumentare del grado di invalidità, con una media WHODAS elevata rispetto alle altre patologie principali.

  • I punteggi medi WHODAS aumentano con il grado di invalidità per tutte e quattro le patologie principali.

La Tabella 5.7 esamina il punteggio medio WHODAS e la percentuale media di invalidità civile per capitolo ICD, confrontando la situazione quando il capitolo della patalogia collegato appariva come informazione diagnostica a sé stante rispetto a quando veniva riportato in aggiunta ad altri capitoli della patalogia; in tal modo si confrontano i casi di morbilità singola con i casi di comorbilità. Il punteggio medio WHODAS per capitolo ICD non cambia quasi mai sia che si tratti di una diagnosi singola o di una parte di diagnosi multiple. Al contrario, la percentuale media di invalidità civile è in molti casi più alta quando a una persona vengono diagnosticate più patologie. In altre parole, il punteggio WHODAS per capitolo ICD varia significativamente meno della percentuale di invalidità civile: sembra che la comorbilità abbia un’influenza sulla percentuale di invalidità civile, ma non sul punteggio WHODAS. I dati non consentono di interpretare questo risultato, ma la discrezionalità nella valutazione dell’invalidità civile potrebbe avere parte in causa, ossia i valutatori percepiscono le persone con comorbilità come più disabili, un risultato che non è corroborato dai punteggi WHODAS corrispondenti.

Le figure seguenti proseguono il confronto tra il punteggio di invalidità basato sul questionario WHODAS e il risultato della valutazione dell’invalidità civile. La Figura 5.5 esamina la distribuzione dei punteggi WHODAS rispetto alla distribuzione delle percentuali di invalidità civile. Mentre i punteggi di disabilità WHODAS sono distribuiti normalmente intorno a una media di 43,2, con una deviazione standard di 8,5, le percentuali di invalidità civile sembrano essere distribuite in modo irregolare, con frequenze più elevate in punti distinti del continuum, collegati a cut-off critici per l’ammissibilità a prestazioni e servizi sociali specifici. Il metodo discrezionale di assegnazione delle percentuali di invalidità, con linee guida e standard limitati, potrebbe spiegare la concentrazione in corrispondenza dei cut-off. In pratica, questo trasforma la scala di invalidità in una scala ordinale con pochi risultati possibili.

La Tabella 5.8 mostra i quattro gruppi di invalidità civile disaggregati per gruppi di disabilità WHODAS. Nell’interpretare questi risultati, è importante tenere presente che un livello di invalidità civile moderato non deve essere necessariamente inteso come uguale a un livello di disabilità moderato. Si tratta di due prospettive diverse, correlate solo in minima parte: WHODAS misura l’esperienza vissuta della disabilità nell’ambiente quotidiano della persona; l’invalidità civile valuta la disabilità in base alla limitazione funzionale della persona (approccio medico). La tabella mostra che il numero di persone che rientrano in gruppi di gravità opposti è trascurabile: c’è solo una persona con una disabilità WHODAS molto grave ma senza invalidità civile e nessuna con invalidità civile molto grave e senza disabilità WHODAS. Tuttavia, i casi meno estremi e apparentemente contraddittori sono più frequenti: ci sono, ad esempio, 94 persone con un’invalidità civile molto grave e una disabilità WHODAS solo moderata. Allo stesso modo, i dati includono 40 persone con disabilità WHODAS grave ma senza invalidità civile.

La Figura 5.6 confronta anche la distribuzione delle percentuali individuali di invalidità civile e dei punteggi WHODAS. La figura mostra la distribuzione completa dei punti dati per il punteggio WHODAS (asse y) e la percentuale di invalidità civile (asse x). Le linee orizzontali rappresentano i cut-off per il punteggio WHODAS, da nessuna disabilità a disabilità moderata, grave e molto grave, e le linee verticali rappresentano i cut-off per la percentuale di invalidità civile (di nuovo, nessuna, moderata, grave e molto grave). I due punteggi mostrano una correlazione positiva, ma solo a un livello molto moderato (R = 0,33). Questo è previsto perché l’invalidità non può essere dedotta solo dalle condizioni mediche o dalle limitazioni funzionali: a due persone con la stessa diagnosi medica verrà assegnata la stessa percentuale di invalidità in base ai criteri medici per la valutazione. Tuttavia, potrebbero sperimentare diversi livelli di disabilità (limitazione funzionale e restrizioni alla partecipazione o performance nell’intendimento della disabilità ICF) a seconda del loro ambiente.

Nel grafico si possono osservare alcune eccezioni degne di nota, come ad esempio persone che hanno lo 0% di invalidità civile pur riportando una disabilità da moderata a molto grave secondo il questionario WHODAS che esamina i loro livelli di funzionamento in diversi domini di vita. Allo stesso modo, alcuni individui con una percentuale di invalidità civile superiore al 66% (cioè con un’invalidità grave o molto grave) risultano non avere alcuna disabilità in base al loro punteggio WHODAS.

I punteggi di funzionamento WHODAS in base agli attuali livelli di invalidità civile dimostrano che la valutazione medica da sola non differenzia bene i diversi livelli di disabilità, suggerendo anche un’affidabilità e una precisione piuttosto basse delle classi di invalidità civile in Italia oggi. La Figura 5.7 mostra le linee di densità dei punteggi WHODAS per i quattro livelli di invalidità civile. Mentre i punteggi WHODAS per le limitazioni funzionali molto gravi spiccano almeno un po’ (linea rossa), la differenza tra il livello grave e moderato di invalidità civile (rispettivamente linea arancione e verde chiaro) sembra essere molto piccola. Queste linee di densità suggeriscono la presenza di falsi positivi (casi con alta percentuale di invalidità e basso punteggio WHODAS) e falsi negativi (casi con bassa percentuale di invalidità e alto punteggio WHODAS). Inoltre, una valutazione più accurata mostrerebbe la linea di densità del gruppo con un livello di invalidità civile nullo o molto basso (linea verde scuro) posizionata più verso il lato sinistro della figura. Anche in questo caso, ciò suggerisce che le informazioni mediche da sole possono travisare la reale portata della disabilità individuale sperimentata nella vita quotidiana.

I risultati riportati nella Figura 5.7 non sorprendono in quanto WHODAS è stata progettata esplicitamente per valutare la cosiddetta disabilità complessiva della persona, mentre l’approccio medico alla valutazione della disabilità utilizzato in Italia non valuta direttamente la disabilità, ma la deduce dalla patalogia o dalla limitazione funzionale sottostante. A volte vi è una stretta correlazione tra la gravità delle condizioni di salute e la gravità della disabilità risultante; ma a volte non vi è alcuna correlazione. Quest’ultimo caso è più evidente nel caso dei problemi di salute mentale, dove l’impatto dell’ambiente in cui la persona vive può aumentare notevolmente l’impatto dell’esperienza, ad esempio, della depressione. Questo è il problema di base della validità della valutazione della disabilità su base medica. Come sottolineato in precedenza, sebbene la presenza di una patalogia e di una limitazione funzionale associata sia un prerequisito per la disabilità, dedurre il livello di disabilità dalla presenza della patalogia sottostante è scientificamente problematico. Il livello di disabilità di cui un individuo fa esperienza, come sostiene l’ICF, è determinato dall’interazione tra la condizione di salute della persona e le limitazioni funzionali associate e l’ambiente in cui la persona vive. WHODAS è stato progettato per acquisire direttamente questa esperienza di disabilità, mentre la valutazione della disabilità fondata esclusivamente su basi mediche non può farlo in modo valido o affidabile.

Il progetto pilota WHODAS in Italia ha dimostrato che è in grado di rilevare l’esperienza reale della disabilità. La questione è come includere al meglio le informazioni sul funzionamento acquisite da WHODAS nel sistema di valutazione della condizione di disabilità in Italia. Le informazioni mediche rimarranno rilevanti per la valutazione della disabilità; l’ICF chiarisce che senza una patologia sottostante e le limitazioni funzionali ad essa associate, la disabilità non esiste. Le informazioni sullo stato di salute forniscono la base per identificare specifiche dimensioni fisiche e mentali delle attività e delle aree di partecipazione vulnerabili alla disabilità, che possono poi essere confermate direttamente dai risultati ottenuti dal questionario WHODAS. Le informazioni mediche forniscono una guida essenziale sulla traiettoria di disabilità a medio e lungo termine che l’individuo sperimenterà, compreso se la persona dovrà affrontare un declino progressivo della capacità di salute con conseguente aumento della disabilità, o il contrario, un miglioramento progressivo. Sebbene le informazioni mediche rimangano una componente essenziale della valutazione della disabilità, anche la revisione medica deve cambiare con una migliore standardizzazione e linee guida metodologiche e possibilmente utilizzando le funzioni e le strutture corporee dell’ICF.

Poiché le informazioni mediche sono essenziali, questa sezione del rapporto discute le possibili opzioni per combinare le informazioni mediche e di funzionamento nella valutazione della disabilità in Italia – piuttosto che sostituire completamente l’attuale approccio medico con il questionario WHODAS. Per rispondere a tale domanda, sono stati testati diversi metodi sul set di dati del progetto pilota. Tali metodi possono essere raggruppati in tre strategie principali: (1) averaging, ossia fare una media tra la percentuale di valutazione medica e il punteggio WHODAS per ottenere un punteggio finale di valutazione della disabilità, (2) flagging, ossia contrassegnare le persone il cui punteggio WHODAS e la gravità della disabilità sono diversi dal gruppo di gravità basato sulla percentuale determinata dalle sole informazioni mediche, e (3) scaling, ossia bilanciare la percentuale di invalidità civile con un certo coefficiente ‘x’ quando il punteggio WHODAS supera o scende al di sotto di una certa soglia o valore di riferimento. Più in dettaglio, tali approcci funzionano come segue:

  1. 1. Averaging: fare una media in un modo predeterminato della percentuale di invalidità civile attribuita e del punteggio WHODAS. Questo approccio si basa sulla teoria che, insieme, le informazioni mediche e i punteggi di funzionamento contribuiscono, in misura diversa, a una valutazione realistica e valida della disabilità.

  2. 2. Flagging: identificare le persone il cui raggruppamento di gravità WHODAS differisce dal raggruppamento di gravità determinato clinicamente e contrassegnare queste persone per richiedere loro ulteriori informazioni o addirittura una nuova valutazione completa. Quando un individuo ha un punteggio WHODAS superiore o inferiore a un certo valore di cut-off, ciò suggerisce che il punteggio medico da solo non rileva adeguatamente l’esperienza di disabilità e dovrebbe essere condotta una valutazione di secondo livello.

  3. 3. Scaling: la percentuale di invalidità civile può essere modificata (cioè aumentata o diminuita) per riflettere il punteggio WHODAS mediante un coefficiente basato sul punteggio. Questo approccio presuppone che al centro della valutazione della disabilità e dell’invalidità civile ci sia il problema medico di cui l’individuo fa esperienza, ma allo stesso tempo che la performance sia modificata (in una certa misura) da fattori ambientali che devono essere compresi per aumentare o diminuire il punteggio medico.

Averaging, flagging e scaling sono tre dei diversi approcci potenziali per riunire due punteggi che misurano fenomeni diversi ma che, insieme, costituiscono la migliore valutazione della disabilità a nostra disposizione. Ciascun approccio si basa sull’intendimento della disabilità secondo l’ICF quale risultato di un’interazione tra la condizione di salute di base e la limitazione funzionale di una persona, da un lato, e l’ambiente fisico, umano, interpersonale, attitudinale, sociale, economico e politico in cui la persona vive, dall’altro. I tre approcci differiscono, tuttavia, nel modo in cui ponderano l’impatto dei rispettivi determinanti medici e ambientali della disabilità. La prossima sezione descrive i risultati dell’applicazione delle strategie testate utilizzando diverse combinazioni di ponderazione.

Questa sezione presenta in modo più dettagliato le tre opzioni per includere il funzionamento nella valutazione della disabilità in Italia. Ciascuna opzione segue l’ICF nel raccomandare una combinazione di valutazione medica e del funzionamento (con quest’ultimo fornito da WHODAS). L’opzione A rappresenta la situazione in cui i punteggi WHODAS vengono considerati, o ignorati, in modo puramente discrezionale. Le opzioni B (strategie di averaging), C (strategie di flagging) e D (strategie di scaling) sono quantitative. Ciascuna opzione presenta vantaggi e svantaggi.

Il quadro per valutare i pro e i contro di ogni approccio si basa sui principi scientifici chiave che determinano la credibilità di qualsiasi processo di valutazione della disabilità: validità (la misura in cui l’opzione si basa su una vera valutazione della disabilità); affidabilità (la capacità dell’opzione di arrivare alla stessa valutazione dello stesso caso da parte di valutatori diversi); trasparenza (il grado in cui il processo di valutazione e i risultati possono essere descritti e compresi da tutti i portatori d'interesse); e standardizzazione (la misura in cui il processo resiste alla distorsione o all’alterazione nel tempo e nei diversi luoghi).

L’opzione A è quella in cui un individuo o una commissione esamina i punteggi medici e i punteggi WHODAS ed esprime un giudizio sull’entità dell’invalidità come l’individuo o la commissione ritiene opportuno. Si tratta di un’opzione puramente discrezionale, sorprendentemente comune nella pratica. Tale approccio è soggetto a manipolazione, manca di validità e affidabilità ed è assolutamente non trasparente. L’opzione è qui riportata in contrapposizione alle altre opzioni B, C e D, ma anche, per correttezza, perché alcuni Paesi continuano ad affidarsi a questa opzione per la valutazione della disabilità (strategia #1). Gli autori del presente rapporto non raccomandano questa opzione.

Averaging, flagging e scaling sono opzioni condotte quantitativamente, molto diverse dall’opzione A. In modi diversi e per ragioni diverse, soddisfano non solo i presupposti psicometrici di base della validità e dell’affidabilità, ma ognuna, in misura diversa, cerca di raggiungere la trasparenza e la standardizzazione.

Nel set di dati WHODAS del progetto pilota italiano, vi è una percentuale relativamente bassa di persone che non indicano alcun problema di funzionamento (solo il 2,3%), tra le quali la maggior parte aveva un grado moderato o grave di invalidità civile. La ponderazione della percentuale di invalidità civile con il punteggio WHODAS aggiusterebbe i livelli di invalidità tenendo conto in qualche misura del livello di disabilità osservato e sperimentato valutato dal questionario WHODAS. Per avere un’idea completa della gamma di approcci possibili nell’ambito dell’opzione B, vengono mostrati quattro schemi di ponderazione: (i) 75% di percentuale di invalidità civile e 25% di punteggio WHODAS; (ii) 50% ciascuno; (iii) 25% di percentuale di invalidità civile e 75% di punteggio WHODAS; e (iv) 0% di percentuale di invalidità civile e 100% di punteggio WHODAS (rappresentati dalle strategie da #2 a #5). L’opzione #5 mostra il risultato della sola WHODAS.

Vantaggi dell’averaging: (i) la valutazione del livello di funzionamento svolge un ruolo significativo nella determinazione dell’idoneità alle prestazioni di invalidità, in modo tale che l’idoneità alle prestazioni non si basi esclusivamente su criteri puramente medici. (ii) L’approccio di averaging minimizza l’impatto dei problemi psicometrici intrinseci alla percentuale di invalidità civile basata sulla valutazione medica con tabella di Barème. (iii) La valutazione del livello di funzionamento è verificata empiricamente e statisticamente. (iv) Questa opzione offre alti livelli di validità e affidabilità. (v) La combinazione dei risultati di due valutazioni bilanciate mediante “medie ponderate” è completamente oggettiva, trasparente e non discrezionale. (vi) Il metodo non dipende dal campione.

Svantaggi dell’averaging: (i) esiste potenzialmente un numero infinito di combinazioni di schemi di ponderazione (cioè di “strategie”), ognuna delle quali influisce in modo diverso sull’insieme dei richiedenti idonei e ha conseguenze politiche e di bilancio diverse. Si tratta di un fatto inevitabile, legato alla natura della disabilità come continuum e al fatto che non esistono ancora cut-off scientificamente verificati o oggettivi per la gravità su un continuum di 0-100. (ii) Qualsiasi strategia selezionata sarà discutibile per le persone che, in base a tale strategia, non saranno certificate come disabili e non potranno dunque beneficiare di alcuna prestazione. Ciò indica la necessità di una divulgazione chiara e trasparente delle informazioni e di un solido sistema di ricorso che potrebbe includere l’uso di strumenti per i test clinici e la determinazione del funzionamento.

Sei diverse strategie di flagging vengono rappresentate dalle strategie da #6 a #11. L’idea di questa strategia è di evidenziare le persone la cui percentuale di invalidità civile è inaspettata in base al punteggio WHODAS. Un approccio conservativo sarebbe quello di contrassegnare le persone con punteggi agli estremi superiori (o inferiori) della distribuzione dei punteggi WHODAS del campione, che hanno una percentuale di invalidità civile molto bassa (o alta) (#6). I quattro approcci successivi non utilizzano la distribuzione del campione, ma la distribuzione dei punteggi all’interno dei gruppi di grado di invalidità civile per aumentare o diminuire la percentuale di invalidità. L’approccio #11 combina le strategie #7-10 e considera tutti i casi che rientrano in uno di questi gruppi.

Vantaggi del flagging: (i) scientificamente valido e basato su dati reali. (ii) Dimostra che l’approccio puramente medico alla valutazione della disabilità può non valutare accuratamente la disabilità in molti casi – in cui, come riportato nel punteggio WHODAS, una persona sperimenta più o meno problemi di funzionamento nella sua vita rispetto a ciò che la patalogia si pensa implichi. (iii) Alti livelli di validità e affidabilità.

Svantaggi del flagging: (i) i cut-off di WHODAS per i diversi gradi di problemi di funzionamento si basano sulle esperienze dei precedenti progetti pilota e su alcune evidenze della letteratura scientifica. Le analisi di sensibilità non sono disponibili al momento. Valori di cut-off più precisi e specifici per l’Italia potrebbero essere introdotti in momenti successivi, quando saranno raccolte maggiori informazioni sul funzionamento (supponendo che WHODAS venga introdotto nel sistema esistente). (ii) Dovranno essere sviluppate istruzioni metodologiche e procedurali tecnicamente solide per guidare il processo di rivalutazione e garantire la trasparenza.

Anche con l’avvertenza dei punti di cut-off per la gravità dell’invalidità, il metodo del flagging può essere introdotto attraverso una procedura amministrativa in due fasi specificamente progettata.

L’approccio di scaling, rappresentato dalle strategie #12 e #13, riproduce un approccio in qualche modo utilizzato in alcuni Paesi (ad esempio, la Lituania), anche se generalmente in modo poco trasparente, ossia modificando la percentuale di invalidità civile assegnata da una commissione per la valutazione dell’invalidità per mezzo di un coefficiente che rappresenta informazioni sul funzionamento (ad esempio, generato da un punteggio WHODAS). L’idea alla base di tale approccio è di evitare di affidarsi esclusivamente alla decisione medica della disabilità, in quanto tale approccio sottovaluta l’impatto effettivo delle condizioni di salute sulla vita e sulla performance di funzionamento di una persona.

Vengono utilizzate due strategie per illustrare l’approccio di scaling (ci sono, in teoria, molte altre possibilità). La prima strategia prevede che i soggetti con disabilità elevata, in base al loro punteggio WHODAS, al di sopra dei cut-off WHODAS di 40 e 60, aumentino la loro percentuale di invalidità civile con un coefficiente di 1,25 (con punteggi WHODAS superiori a 40) o di 1,5 (con punteggi WHODAS superiori a 60). Inversamente, nella seconda strategia utilizzata, gli individui con una disabilità molto bassa in base al loro punteggio WHODAS, al di sotto dei cut-off WHODAS di 40 e 25, vengono selezionati per ridurre la loro percentuale di invalidità civile con un coefficiente di 0,95 (con punteggi WHODAS inferiori a 40) o 0,9 (con punteggi WHODAS inferiori a 25). Qui la scelta dei coefficienti è in qualche misura guidata dall’obiettivo di ottenere un impatto simile in entrambe le direzioni.

Vantaggi dello scaling: (i) l’utilizzo di un valore di coefficiente generato statisticamente è un approccio comune e ampiamente utilizzato. (ii) Un approccio basato sul coefficiente (aumentando o riducendo la percentuale di invalidità civile determinata clinicamente considerando il corrispondente punteggio di funzionamento) è il modo più intuitivo per combinare i punteggi di valutazioni molto diverse – mediche e di funzionamento – in un unico punteggio. (iii) Questa opzione tiene conto del fatto che una decisione medica da sola può spesso non tenere conto dei casi in cui le persone hanno un livello solo moderato o molto alto di esigenze di disabilità. (iv) Questa opzione, grazie alle proprietà psicometriche di WHODAS, avrebbe alti livelli di validità e affidabilità.

Svantaggi dello scaling: (i) come per altre opzioni, esistono molte possibili varianti dell’approccio D con risultati diversi – nel presente rapporto vengono presentate solo due possibilità, come esempio illustrativo. Sebbene l’approccio di scaling in sé sia intuitivamente comprensibile e possa essere reso trasparente al pubblico, la giustificazione scientifica e statistica dell’opzione D è in qualche modo tecnica e potrebbe non essere facilmente comprensibile da un pubblico non esperto.

La Figura 5.9 fornisce una panoramica delle strategie di verifica prese in considerazione e mostra il numero di persone che avrebbero una disabilità moderata, grave o molto grave dopo l’aggiustamento per il punteggio WHODAS. Inoltre, ed è forse l’aspetto più importante, la tabella mostra anche il numero di persone la cui classificazione di gravità dell’invalidità civile cambierebbe in un grado più alto (totale di aumenti) o più basso (totale di diminuzioni). In breve, i risultati sono i seguenti:

  • Le quattro strategie di averaging mostrano che l’uso di WHODAS genera normalmente più spostamenti verso gradi di invalidità più elevati che spostamenti verso il basso. Dare a WHODAS un peso del 25% (strategia #2) cambia poco, in quanto interessa solo il 2,5% del campione e di questi la maggior parte vedrebbe una diminuzione – si tratta di persone appena al di sopra di una delle soglie di invalidità che sembrano funzionare bene, forse perché l’ambiente è di supporto e i loro bisogni vengono soddisfatti. Maggiore è il peso di WHODAS, più persone sono interessate e più si verificano spostamenti verso l’alto. Con un peso del 50% sia per WHODAS che per l’invalidità civile (strategia #3), si verrebbe interessato l’8,5% del campione, con un numero uguale di spostamenti verso l’alto e verso il basso. Con il solo WHODAS (strategia #5), il 42% del campione subirebbe un cambiamento nella gravità dell’invalidità, con due terzi che vedrebbero un aumento. La maggior parte degli aumenti consiste in un passaggio da un’invalidità moderata a una grave, generando potenzialmente una maggiore idoneità all’assegno di invalidità. Al contrario, il numero di persone con un’invalidità molto grave, considerate non autosufficienti e quindi bisognose di assistenza costante, diminuirebbe drasticamente, passando da oltre il 20% a solo il 2% del campione. Ciò suggerisce che l’attuale valutazione dell’disabilità su base medica potrebbe sovrastimare il grado di invalidità e che le politiche potrebbero stabilire priorità e incentivi errati.

  • Le sei strategie di flagging mostrano che attualmente pochissime persone ricevono una classe di invalidità che è drasticamente diverso dalla loro effettiva esperienza di disabilità, come misurata da WHODAS. Solo il 2% del campione ha punteggi WHODAS estremamente bassi o estremamente alti (strategia #6) e solo il 5,5% del campione verrebbe segnalato come avente una classe di invalidità molto diversa dal proprio punteggio WHODAS (strategia #11). Di questo 5,5%, due terzi vedrebbero potenzialmente una riduzione della loro attuale classe di gravità a seconda del risultato della seconda valutazione indicata e la maggior parte di loro sarebbero persone classificate con un’invalidità civile del 100%, pur sperimentando una disabilità molto minore. (Per le varianti di flagging supplementari, vedere la sezione 6.3).

  • I coefficienti scelti per le due strategie di scaling generano una situazione in cui oltre l’8% del campione vedrebbe aumentare la propria classe di invalidità a causa di una disabilità (molto) grave secondo WHODAS (strategia #12) e, allo stesso modo, quasi l’8% vedrebbe la propria classe di invalidità ridotta a causa di un’esperienza di disabilità nulla o solo moderata secondo WHODAS (strategia #13). La grande differenza nell’entità dei coefficienti è il risultato dell’attuale valutazione e classe dell’invalidità, con molte persone che si trovano appena al di sopra della soglia di invalidità successiva. Un chiaro svantaggio della strategia #12 è che aumenta il numero già elevato di persone con una classe di invalidità molto grave. Combinando la strategia #12 e la strategia #13, il 16% vedrebbe modificata la propria classe.

La valutazione pilota suggerisce che l’attuale sistema di valutazione della disabilità in Italia trarrebbe beneficio dall’inclusione delle informazioni sul funzionamento nel metodo di valutazione in almeno tre modi:

  • la valutazione della disabilità sarebbe più precisa e accurata, riflettendo l’esperienza reale della disabilità e individuando alcune persone che non sono ben individuate da un approccio puramente medico;

  • la valutazione sarebbe in linea con l’odierno intendimento interdisciplinare della disabilità, al quale l’Italia si è impegnata già 14 anni fa, quando ha ratificato la Convenzione delle Nazioni Unite; e

  • la valutazione sarebbe armonizzata con, e fornirebbe un contributo più prezioso a qualsiasi successiva valutazione individuale delle effettive esigenze di assistenza delle persone con disabilità.

L’approccio suggerito per la valutazione della disabilità è quello di combinare le informazioni mediche e di funzionamento in un qualche modo trasparente. Sebbene in linea di principio esistano molte opzioni metodologiche alternative per farlo, per l’Italia segnalare tramite algoritmo di flagging la necessità di una seconda valutazione sembra essere la strada più significativa e realistica. Questo perché l’attuale processo di valutazione dell’invalidità civile, attraverso il quale ai richiedenti viene assegnato un grado di invalidità, o percentuale, è fortemente influenzato e condizionato dalle varie soglie in vigore per l’ammissibilità a vari diritti, prestazioni e servizi. Pertanto, mentre in teoria alle persone potrebbe essere assegnata qualsiasi percentuale, in pratica alla maggior parte dei richiedenti una valutazione dell’invalidità civile viene assegnato un grado vicino o corrispondente a una delle soglie critiche. Tecnicamente parlando, l’attuale valutazione restituisce gradi di invalidità a scala ordinale determinati dalle soglie esistenti, piuttosto che gradi a scala intervallare che riflettono il grado di limitazione funzionale della persona. La conseguenza di ciò è che gli approcci quantitativi come lo scaling o l’averaging possono generare risultati indesiderati su entrambi i lati dello spettro. Le persone che si trovano proprio in prossimità di una soglia potrebbero facilmente scendere al di sotto di essa e, quindi, perdere diritti di invalidità critici; le persone lontane da una soglia potrebbero ricevere una percentuale di invalidità significativamente più alta, ma senza alcun cambiamento nel tipo di servizio o prestazione a cui hanno diritto.

Un motivo correlato alla limitata applicabilità in Italia, soprattutto dell’approccio di averaging, è la natura discrezionale della valutazione dell’invalidità civile in Italia. Sebbene la valutazione sia intrinsecamente di natura medica, i valutatori possono prendere in considerazione la reale situazione delle persone, se lo desiderano: in modo discrezionale e non trasparente, possono aumentare la percentuale di invalidità assegnata in linea con eventuali limitazioni funzionali “percepite” – percepite, perché questo viene fatto senza alcuna base o strumento per valutare il funzionamento. Questo problema è legato al problema che le soglie del sistema sembrano influenzare il risultato della valutazione. Al contrario, l’averaging sarebbe un approccio molto promettente e adeguato se fosse utilizzato per calcolare la media di due informazioni indipendenti: gli aspetti medici e funzionali della disabilità. Una situazione del genere potrebbe essere raggiunta anche in Italia, se le informazioni su questi due aspetti venissero raccolte in modo indipendente e la parte medica della valutazione venisse eseguita in modo standardizzato con linee guida metodologiche applicabili in tutto il Paese.

Se l’Italia sceglie di procedere con l’introduzione di un algoritmo di flagging, è necessario affrontare due aspetti: il peso attribuito alle informazioni sul funzionamento rispetto alle informazioni mediche e la struttura dell’intero processo di valutazione. La prima domanda sulla rilevanza attribuita al funzionamento, ossia il punteggio WHODAS, equivale a chiedere quanti casi “dovrebbero” essere segnalati. Anche con la strategia #11, il risultato combinato delle strategie #7-#10, solo il 5,5% circa di tutti i richiedenti verrebbe preso in considerazione per una seconda valutazione – mentre il restante 94,5% non sarebbe interessato da tale riforma. Si tratta di una quota molto bassa che (i) non rende giustizia all’importanza dell’effettiva esperienza di disabilità delle persone, (ii) difficilmente giustifica una riforma generale, (iii) probabilmente fallirebbe nel cambiare la mentalità di tutti verso una visione moderna della disabilità e del funzionamento e, infine, (iv) difficilmente influenzerebbe l’adeguatezza e l’efficacia dei supporti per la disabilità.

Pertanto, è utile pensare a come aumentare il numero di casi segnalati, non solo interrogando e quindi rivalutando le differenze estreme tra la percentuale di invalidità civile e il punteggio WHODAS, ma anche le differenze minori tra la visione medica e quella funzionale. A tal fine, è utile utilizzare la griglia più dettagliata delle soglie di invalidità civile, che distingue anche l’invalidità moderata inferiore da quella superiore e l’invalidità grave inferiore da quella superiore, creando così sei diverse categorie di invalidità. Allo stesso modo, l’esercizio seguente divide i gruppi di disabilità moderata e grave, come misurata dal punteggio WHODAS, in due sottocategorie ciascuna, creando così sei diverse categorie di disabilità. Le due strategie supplementari seguenti mostrano la gamma di opzioni di cui dispone l’Italia.

La prima strategia supplementare seleziona tutti i casi per una seconda valutazione per i quali la percentuale di invalidità civile determinata clinicamente sulla scala di invalidità a sei categorie differisce dal punteggio di invalidità determinata dal punto di vista funzionale sulla scala WHODAS a sei categorie. Figura 5.8 mostra il risultato corrispondente: i casi contrassegnati in rosso e verde sono quelli per i quali il punteggio WHODAS implicherebbe una nuova valutazione, con un potenziale spostamento verso il basso per i casi contrassegnati in rosso e uno spostamento verso l’alto per quelli contrassegnati in verde. Circa uno su quattro del campione pilota totale rientra nella stessa categoria in entrambe le scale (casi contrassegnati in grigio), mentre tutti gli altri verrebbero presi in considerazione per una nuova valutazione, con due terzi dei casi segnalati potenzialmente considerati per uno spostamento verso il basso a una classe di invalidità inferiore e un terzo per uno spostamento verso l’alto. La maggior parte dei potenziali spostamenti verso il basso riguarda persone con una classe di invalidità civile del 100% (molto grave) o una classe tra il 74% e il 99% (grave superiore). Al contrario, la maggior parte dei potenziali spostamenti verso l’alto riguarda persone con una classe di invalidità moderata superiore (46%-66%).

La seconda strategia supplementare è meno rigorosa e consente deviazioni nelle due scale di una categoria e seleziona solo i casi per una seconda valutazione per i quali la percentuale di invalidità civile determinata clinicamente differisce dal punteggio di invalidità determinata dal punto di vista funzionale di almeno due categorie. La Figura 5.9 mostra il risultato di questa strategia intermedia, contrassegnando anche in questo caso in rosso e verde i casi con una discrepanza negativa o positiva tra la classe di invalidità civile e il punteggio WHODAS. In circa il 70% del campione pilota totale, la differenza tra le due scale è così piccola che la classe di invalidità civile assegnata rimarrebbe inalterata, mentre il 30% verrebbe selezionato per una nuova valutazione. Di questo 30%, ancora una volta, circa due terzi sono candidati a un potenziale spostamento verso il basso e un terzo a un potenziale spostamento verso l’alto. In questo caso, la maggior parte dei potenziali spostamenti verso il basso riguarda persone con una classe di invalidità civile del 100% (molto grave), mentre i potenziali spostamenti verso l’alto riguardano persone con una classe di invalidità moderata inferiore o superiore (34-45% o 46-66%).

Non c’è una scelta giusta o sbagliata nell’adottare l’algoritmo di flagging ma, maggiore è l’importanza attribuita al punteggio WHODAS, più casi saranno considerati per una nuova valutazione. Mentre le due strategie supplementari sono di natura illustrativa, il 30% identificato nella seconda strategia supplementare potrebbe essere una via di mezzo significativa da considerare per il Governo italiano. Le soglie alla base della selezione dei casi da valutare nuovamente sono inizialmente un po’ arbitrarie, ma diventeranno sempre più solide nel tempo, man mano che verranno raccolti sempre più dati attraverso il nuovo processo di valutazione.

Il secondo aspetto da considerare per l’introduzione di un algoritmo di flagging è la struttura del processo di valutazione, ossia la questione di chi valuta e decide in quale fase del processo. In questo contesto, il sistema italiano ha un grande vantaggio iniziale, in quanto la classe definitiva di invalidità viene approvata e assegnata dall’INPS già oggi. Questo si presta a un processo naturale. In una prima fase, le informazioni mediche vengono valutate dalla commissione di valutazione regionale, proprio come avviene oggi, e le informazioni sul funzionamento dagli operatori sociali locali, come è stato fatto nei progetti pilota regionali. Queste due informazioni raccolte in modo indipendente – il punteggio di limitazione funzionale della persona e il punteggio WHODAS della persona – vengono trasmesse all’INPS (o a qualsiasi altra autorità di supervisione), che valuta e confronta i risultati e decide in quali casi è necessaria una nuova valutazione. Questo processo riprende quello odierno, tranne per il fatto che verrebbe compiuto in modo più trasparente e deve includere tutti coloro per i quali il punteggio medico e funzionale si discostano più di quanto consentito dalla legislazione. Se i due punteggi sono abbastanza vicini, la decisione è sostanzialmente automatica e viene emessa una decisione sull’invalidità da parte dell’INPS. Le persone per le quali i due punteggi si discostano vengono prese in considerazione per una seconda valutazione. In questo caso, i valutatori medici e gli operatori sociali devono sedersi insieme, esaminare il caso e fare una nuova proposta congiunta all’INPS. Potrebbero farlo i valutatori medici e gli operatori sociali responsabili della valutazione iniziale, oppure i valutatori medici e gli operatori sociali dell’INPS (o dell’autorità di supervisione).

Naturalmente, ci sono ulteriori aspetti da considerare all’interno dei vari componenti. Per esempio, sarebbero necessarie migliori linee guida tecniche e metodologiche per i medici valutatori su come tradurre le limitazioni funzionali (attraverso le funzioni e le strutture corporee) in percentuali di invalidità, per eliminare l’attuale livello di discrezionalità e garantire che le persone con lo stesso tipo e livello di limitazione funzionale ricevano sempre la stessa percentuale di invalidità da parte dei valutatori. Allo stesso modo, si potrebbe considerare di abbandonare la scala intervallare e considerare invece solo gruppi di livelli di limitazione funzionale, come quelli utilizzati nel presente rapporto.

L’Italia ha certamente la capacità amministrativa per implementare senza problemi un tale cambiamento. L’Italia dispone di un gruppo di operatori sociali esperti, sia nel settore sanitario che in quello sociale, che potrebbero essere impegnati nella somministrazione di WHODAS. La maggior parte delle regioni italiane dispone anche di un sistema informativo avanzato che potrebbe facilmente accogliere la raccolta e l’utilizzo delle informazioni sul funzionamento, derivate da un questionario WHODAS, oltre alle informazioni sulla limitazione funzionale. Se invece di un approccio di flagging, che comporterà una seconda valutazione medico-funzionale combinata in casi selezionati, si scegliesse come metodo per il futuro un approccio averaging o scaling, la procedura sarebbe ancora più semplice, in quanto gran parte del processo potrebbe essere automatico. Qualunque sia la scelta finale, il risultato è che le informazioni sul funzionamento saranno sistematicamente incluse nella valutazione dell’invalidità, utilizzando un approccio standardizzato, e il processo amministrativo stesso diventerà più rigoroso, standardizzato e obiettivo.

Nell’implementare il cambiamento, il Governo italiano dovrà considerare due ulteriori aspetti politici. In primo luogo, qualsiasi nuovo metodo adottato dovrebbe probabilmente essere applicato solo ai nuovi richiedenti, per assicurarsi che il cambiamento venga accettato dalla popolazione. In tutta l’OCSE, solo pochissimi Paesi (in particolare Paesi Bassi e Regno Unito) hanno scelto di valutare nuovamente gli attuali beneficiari in base a un nuovo metodo di valutazione riformato. La maggior parte dei Paesi OCSE, in tali situazioni, sceglierebbe di mantenere i beneficiari esistenti; in genere, si ritiene più equo lasciare invariati i diritti esistenti, nonostante l’apparente disuguaglianza che tale approccio crea tra coloro che sono stati valutati prima e dopo la riforma.

In secondo luogo, sarà importante anticipare e gestire l’esito di qualsiasi riforma. Qualunque sia l’approccio scelto, ci saranno alcuni individui che beneficeranno della riforma e altri che perderanno diritti rispetto alla situazione attuale. Poiché una delle condizioni per la riforma è la neutralità dei costi, questo problema è inevitabile. L’importanza attribuita alla componente di funzionamento, rispetto alle informazioni mediche, determinerà la dimensione dei due gruppi. Invece, l’Italia potrebbe anche scegliere di produrre solo vincitori e di utilizzare le informazioni sul funzionamento solo per identificare le persone per le quali il sistema attuale non riesce ad accertare adeguatamente le loro esigenze. Un approccio di questo tipo garantirebbe che nessuno venga lasciato indietro, ma non sarebbe neutrale dal punto di vista dei costi.

In conclusione, questa valutazione dimostra che il concetto di disabilità basato sul funzionamento (tramite WHODAS) e il concetto di invalidità civile attualmente in uso in Italia basato sulla limitazione funzionale sono estremamente diversi. Ciò non sorprende perché un approccio cerca di valutare il livello di attività e partecipazione e il tipo e la natura dei problemi delle persone in modo scientificamente testato, mentre l’altro si limita a valutare l’esistenza, o l’esistenza discrezionalmente percepita, di una condizione medica. La notevole differenza tra i due concetti dimostra l’importanza critica dell’inclusione del funzionamento nella valutazione della disabilità in Italia. Ciò contribuirà a una migliore identificazione del gruppo di persone che necessitano di assistenza, a un migliore orientamento delle prestazioni e dei servizi costosi e a un migliore collegamento con le valutazioni dei bisogni regionali e locali. Il progetto pilota ha dimostrato che le regioni italiane sono assolutamente in grado di attuare il cambiamento necessario.

Riferimenti

[2] Bond, T. (2015), Applying the Rasch Model, Routledge, https://doi.org/10.4324/9781315814698.

[9] Boone, W., J. Staver and M. Yale (2014), Rasch Analysis in the Human Sciences, Springer Netherlands, Dordrecht, https://doi.org/10.1007/978-94-007-6857-4.

[14] Federici, S. et al. (2016), “World Health Organization disability assessment schedule 2.0: An international systematic review”, Disability and Rehabilitation, Vol. 39/23, pp. 2347-2380, https://doi.org/10.1080/09638288.2016.1223177.

[13] Ferrer, M. et al. (2019), “WHODAS 2.0-BO”, Revista de Saúde Pública, Vol. 53, p. 19, https://doi.org/10.11606/s1518-8787.2019053000586.

[8] Holland, P. and H. Wainer (1993), Differential item functioning, Lawrence Erlbaum Associates, Inc.

[12] Mayrink, J. et al. (2018), “Reference ranges of the WHO Disability Assessment Schedule (WHODAS 2.0) score and diagnostic validity of its 12-item version in identifying altered functioning in healthy postpartum women”, International Journal of Gynecology & Obstetrics, Vol. 141, pp. 48-54, https://doi.org/10.1002/ijgo.12466.

[4] Nunnally, J. and I. Bernstein (1994), Psychometric Theory (3rd edition), McGraw-Hill, New York.

[1] Rasch, G. (1960), Probabilistic Model for Some Intelligence and Achievement Tests, Danish Institute for Educational Research, Copenhagen.

[10] Smith, E. (2002), “Detecting and Evaluating the Impact of Multidimensionality Using Item Fit Statistics and Principal Component Analysis of Residuals”, Journal of Applied Measurement, Vol. 3/2, pp. 205-31.

[11] Smith, R. and C. Miao (1994), “Assessing Unidimensionality for Rasch Measurement”, in Objective Measurement: Theory into Practice: Volume 2, Greenwich, Ablex.

[7] Smith, R., R. Schumacker and M. Bush (1998), “Using item mean squares to evaluate fit to the Rasch model”, Journal of Outcome Measurement, Vol. 2/1, pp. 66-78.

[3] Tennant, A. and P. Conaghan (2007), “The Rasch measurement model in rheumatology: What is it and why use it? When should it be applied, and what should one look for in a Rasch paper?”, Arthritis Care & Research, Vol. 57/8, pp. 1358-1362, https://doi.org/10.1002/art.23108.

[6] Yen, W. (1993), “Scaling Performance Assessments: Strategies for Managing Local Item Dependence”, Journal of Educational Measurement, Vol. 30/3, pp. 187-213, https://doi.org/10.1111/j.1745-3984.1993.tb00423.x.

[5] Yen, W. (1984), “Effects of Local Item Dependence on the Fit and Equating Performance of the Three-Parameter Logistic Model”, Applied Psychological Measurement, Vol. 8/2, pp. 125-145, https://doi.org/10.1177/014662168400800201.

Menzioni legali e diritti

Il presente documento, così come tutti i dati e tutte le mappe geografiche che esso comprende, non pregiudica lo status o la sovranità su ogni territorio, con riferimento alla delimitazione delle frontiere e dei confini internazionali e alla denominazione di ogni territorio, città o area. Gli estratti delle pubblicazioni possono essere soggetti a clausole di esclusione della responsabilità aggiuntive, illustrate nella versione integrale della pubblicazione disponibile al link fornito.

© OECD 2023

L’uso della presente opera, in formato sia digitale che cartaceo, è disciplinato dalle condizioni e dalle modalità consultabili al seguente indirizzo: https://www.oecd.org/termsandconditions.