21.2 Lo sviluppo dello strumento
Una volta selezionati gli indicatori empirici del costrutto, deve essere scelta una modalità di presentazione che consenta la raccolta efficiente dei dati. Ciascuno strumento può essere descritto in base a sei caratteristiche: (1) formato, (2) composizione tipografica, (3) istruzioni ai soggetti, (4) la costruzione degli item, (5) formato di risposta, e (6) numero di item.
21.2.1 Formato
I formati di scala più usati sono lo scaling Thurstoniano, lo scaling di Guttman, le scale a differenziale semantico, le scale di valutazione grafica, semantic differential scales, graphic rating scales, le scale visive di tipo analogico (visual analog scales) e le scale Likert. Ci concentriamo qui sulle scale Likert per la loro importanza nei test psicometrici basati sull’analisi fattoriale.
21.2.1.1 Scala Likert
Sviluppata nel 1932 da Rensis Likert per misurare gli atteggiamenti, una scala Likert è una scala ordinale usata dai rispondenti per valutare il grado di accordo o disaccordo con l’affermazione che viene loro proposta. Di solito le alternative di risposta sono cinque o sette, da “molto d’accordo” a “fortemente contrario.”
Essendo una scala ordinale, le risposte possono essere ordinate, ma le distanze tra i livelli della scala non sono quantificabili. Quindi le distanze tra i livelli “sempre,” “spesso” e “talvolta” non sono necessariamente uguali. In altri termini, non possiamo assumere che le differenze tra i livelli di risposta siano equidistanti anche se le differenze tra i valori numerici assegnati ai livelli della scala lo sono.
C’è una lunga controversia sulla possibilità di trattare i valori numerici di una scala ordinale come se essi provenissero da una scala ad intervalli. In altri termini, ci si è chiesti se sia appropriato usare statistiche descrittive quali la media e la deviazione standard per i dati a questo livello di scala, e ci si è chiesti se sia appropriato usare i test parametrici per dati a livello di scala Likert. È risaputo che i test non parametrici, i quali non fanno assunzioni sulla forma della distribuzione della popolazione da cui abbiamo campionato i dati, hanno una potenza statistica nettamente inferiore ai test parametrici. Inoltre, concetti quali quelli di media e varianza non hanno senso se i livelli di una scala Likert non vengono considerati a livello di scala ad intervalli. Per queste ragioni alcuni autori ritengono problematico non potere trattare i dati provenienti da scale di tipo Likert come se fossero a livello di scala ad intervalli.
È stato risposto a tali difficoltà che sufficienti evidenze mostrano come risulti giustificato trattare i dati a livello di scala Likert come se fossero a livello di scala ad intervalli quando la numerosità campionaria è sufficientemente grande e quando i dati si distribuiscono in maniera approssimativamente normale. Altri autori (es. Jöreskog & Sörbom, 1996) ritengono invece che le scale tipo Likert vadano considerate in ogni caso come ordinali, e debbano essere analizzate di conseguenza. Nel caso dell’analisi fattoriale e dei modelli di equazioni strutturali questo significa semplicemente che l’analisi si deve basare sul calcolo delle correlazioni policoriche.
In conclusione, la procedura che sta alla base delle scale Likert consiste nella somma dei punti attribuiti ad ogni singola domanda. I vantaggi della scala Likert consistono nella sua semplicità e applicabilità, mentre i suoi svantaggi sono il fatto che i suoi elementi vengono trattati come scale cardinali pur essendo ordinali e il fatto che il punteggio finale non rappresenta una variabile cardinale.
21.2.2 Composizione tipografica
Criteri da considerare nella formattazione tipografica del test di un test psicometrico sono la facilità di lettura, la chiarezza e l’organizzazione. La formattazione dovrebbe tenere in considerazione l’età dei rispondenti e la potenziale difficoltà di lettura.
21.2.3 Istruzioni ai soggetti
Le istruzioni devono essere chiare e concise. Oltre ad illustrare la consegna, esse forniscono una cornice di riferimento che deve essere comune a tutti i rispondenti. Le istruzioni seguono un formato simile al seguente:
Lo studio ha come obiettivo generale … In particolare, con la ricerca che qui presentiamo, si intendono ottenere dati relativi a … Nel caso tu decida di partecipare allo studio, questa ricerca prevede l’attuazione dei seguenti trattamenti … La ricerca durerà … e vi parteciperanno … individui. Dalla partecipazione a questa ricerca sono prevedibili i seguenti benefici … La partecipazione allo studio non comporta alcun rischio. Sei del tutto libero/a di non partecipare allo studio. La tua adesione a questo programma di ricerca è completamente volontaria e potrà essere ritirata in qualsiasi momento.
Ai sensi del Decreto Legislativo 30 giugno 2003 n. 196 in materia di protezione dei dati personali, tratteranno i tuoi dati esclusivamente in funzione della realizzazione dello studio. Lo psicologo che ti seguirà nello studio ti identificherà con un codice: i dati che ti riguardano raccolti nel corso dello studio, ad eccezione del nominativo, saranno registrati, elaborati e conservati unitamente a tale codice, alla data di nascita, al genere. Soltanto il supervisore del progetto di ricerca potrà collegare questo codice al tuo nominativo. I dati, trattati mediante strumenti anche elettronici, saranno diffusi solo in forma rigorosamente anonima, ad esempio attraverso pubblicazioni scientifiche, statistiche e convegni scientifici. La tua partecipazione allo studio implica che il gruppo di ricerca che organizza lo studio e il Comitato etico potranno conoscere i dati che ti riguardano solo attraverso modalità tali da garantire la riservatezza della tua identità.
Potrai esercitare i diritti di cui all’art. 7 del Codice in materia di protezione dei Dati Personali (es. accedere ai tuoi dati personali, integrarli, aggiornarli, rettificarli, opporsi al loro trattamento per motivi legittimi, ecc.) rivolgendoti direttamente al responsabile della ricerca. Potrai interrompere in ogni momento e senza fornire alcuna giustificazione la tua partecipazione allo studio: in tal caso, i dati raccolti verranno distrutti.
Se lo richiederai, alla fine dello studio potranno esserti comunicati i risultati ottenuti in generale e, in particolare, quelli che ti riguardano. Per ulteriori informazioni e comunicazioni durante la ricerca puoi rivolgerti a …
Potrai segnalare qualsiasi fatto che riterrai opportuno evidenziare, relativamente alla ricerca che ti riguarda, al Comitato Etico dell’Università degli Studi di Firenze. La segnalazione dovrà essere inoltrata all’attenzione di …
È inoltre necessario che i partecipanti completino una dichiarazione di assenso (consenso informato). Ad esempio:
Io sottoscritto … dichiaro di aver ricevuto dal Dottor … esaurienti spiegazioni in merito alla richiesta di partecipazione alla ricerca in oggetto, secondo quanto riportato nella scheda informativa qui allegata, copia della quale mi è stata prima d’ora consegnata (indicare data e ora della consegna).
Dichiaro altresì di aver potuto discutere tali spiegazioni, porre tutte le domande che ho ritenuto necessarie e di aver ricevuto risposte soddisfacenti, come pure di aver avuto la possibilità di informarmi in merito ai particolari dello studio con persona di mia fiducia.
Accetto dunque liberamente di partecipare alla ricerca, avendo compreso completamente il significato della richiesta e i rischi e benefici che possono derivare da questa partecipazione. Acconsento al trattamento dei miei dati personali per gli scopi della ricerca nei limiti e con le modalità indicate nell’informativa fornitami con il presente documento.
Sono stato informato/a, inoltre, del mio diritto ad avere libero accesso alla documentazione relativa alla ricerca ed alla valutazione espressa dal Comitato Etico dell’Università degli Studi di Firenze.
21.2.4 La costruzione degli item
La scelta di item tecnicamente adeguati sul piano strutturale e linguistico non è un problema statistico. La formulazione verbale degli item è molto importante in quanto essa contribuisce all’errore di misura. Per ridurre gli errori di misura, gli item devono essere formulati nella forma più chiara e meno ambigua possibile. È ovviamente necessario impiegare contenuti coerenti con la definizione del costrutto, ma non ci sono regole semplici per generare item che fanno emergere il costrutto che si cerca di misurare. Vanno certamente evitati contenuti che inducano atteggiamenti difensive e/o ostili nei rispondenti. La formulazione verbale deve inoltre essere appropriata al livello di scolarità dei rispondenti. Pett, Lackey e Sullivan (2003) forniscono le raccomandazioni seguenti.
- Evitare affermazioni che si riferiscono al passato a meno che il costrutto faccia direttamente riferimento al passato.
- Evitare affermazioni fattuali. Evitare affermazioni su cui quasi tutti (o quasi nessuno) sono d’accordo.
- Evitare l’uso di pronomi personali con un significato ambiguo.
- Selezionare item che potenzialmente possano coprire l’intera gamma delle possibili risposte concernenti il costrutto di interesse.
- Se viene fatto riferimento ad argomenti sensibili, la formulazione verbale deve essere la più neutra possibile.
- Utilizzare un linguaggio chiaro, semplice, diretto. Utilizzare frasi corte, altrimenti non ne è chiaro il senso.
- Evitare affermazioni ambigue o interpretabili in più modi.
- Evitare formulazioni sintattiche complesse.
- Evitare l’uso di parole a bassa frequenza o l’uso di una terminologia che potrebbe non essere capita dai rispondenti.
- Disporre gli item aventi un contenuto sensibile verso la fine dello strumento.
- Fare riferimento a comportamenti specifici e non generali.
- Evitare la duplicazione delle domande.
21.2.4.2 Item marker
Quando si anticipa la presenza di più costrutti latenti, è utile utilizzare nell’insieme degli item alcuni item marker, ovvero item che correlano molto con un solo fattore e pochissimo con altri. Questo facilità l’interpretazione dei fattori. I marker consentono infatti di attribuire ai fattori un nome (etichetta) coerente con l’area semantica cui i maker fanno riferimento.
21.2.4.3 Campionamento del dominio
Il campionamento del dominio può essere inteso sia come campionamento del contenuto o come campionamento del comportamento. L’adeguatezza del campionamento del contenuto riguarda il fatto che l’insieme degli item sia o meno in grado di rappresentare il dominio di contenuto di interesse. Questa caratteristica è un indice dell’adeguatezza del test nel misurare ciò che intende misurare e dovrebbe garantire che le risposte agli item possano rappresentare una stima della quantità di costrutto posseduta dal rispondente.
Il campionamento del comportamento riguarda invece il grado in cui le risposte a un test costituiscono un campione adeguato dei comportamenti che il test intende misurare. In questo caso ci si chiede se il test riflette i comportamenti che intende valutare e possiede dunque un valore descrittivo del comportamento del rispondente.
Un item mal formulato determina una distorsione delle risposte e non può essere considerato rappresentativo di nessun dominio di contenuto né di nessun universo di comportamenti.
Per la generazione iniziale degli item è molto importante considerare il parere della popolazione target e degli esperti. Interviste accuratamente strutturate e a risposta aperta con esperti o potenziali soggetti permettono non solo di verificare che gli item siano rappresentativi o rilevanti per il costrutto, ma anche che siano formulati correttamente. Questo processo può anche suggerire sfaccettature ulteriori rispetto a quelle progettate inizialmente e la necessità di raffinare il costrutto. Nello sviluppo di un test è molto utile ascoltare il parere di persone inserite nel contesto applicativo del test anche per sapere qual è la terminologia specifica da utilizzare nella formulazione degli item, o se gli item sono chiari, o se la scala di risposta è di facile compilazione.
È anche utile rivolgersi a giudici esterni aventi una conoscenza approfondita del dominio di contenuto per ottenere una prospettiva esterna e autorevole che aiuti nell’individuazione degli item da eliminare e di quelli che richiedono un raffinamento.
Gli item di un test dovrebbero essere distribuiti in modo che riflettano la relativa importanza delle varie sfaccettature del costrutto target (Nunnally & Bernstein, 1994). Se gli item per una certa sfaccettatura sono troppi o troppo pochi, i punteggi e le inferenze ottenute da questi punteggi saranno distorte.