Capitolo 21 Tipologie dei test psicometrici
Prima di iniziare lo sviluppo di un test psicometrico, il ricercatore deve decidere quale tipologia di strumento sia più utile per affrontare il problema che ha di fronte. Possiamo infatti distinguere tra test orientati al criterio e test riferiti alla norma.
21.0.1 Test orientati al criterio
I test orientati al criterio hanno quale scopo il confronto fra gruppi precostituiti di individui. Gli item del test vengono selezionati in base alla loro capacità empirica di discriminare fra gruppi criterio, ad esempio, malati/sani, bocciati/promossi, schizofrenici/depressi. I test orientati al criterio sono costruiti utilizzando metodi empirici e non teorici. Al vantaggio di una chiara utilità pratica si accompagna il grande svantaggio di identificare fattori aventi una scarsa validità di costrutto, i quali risultano inutili per la comprensione dei processi psicologici.
Il processo di sviluppo della scala è semplice, in quanto si devono selezionare gli item che mostrano punteggi differenti in gruppi-criterio noti. Se i gruppi criterio possono essere individuati con chiarezza è sempre teoricamente possibile sviluppare test in grado di discriminarli.
Tuttavia, non sempre i gruppi possono essere definiti in modo attendibile; oppure, la definizione dei gruppi criterio potrebbe avere senso solo all’interno di una teoria, ma non sia generalizzabile ad altre tradizioni teoriche. In questo caso, il test rischia di essere eccessivamente specifico, dimostrandosi utile solo nelle condizioni per cui è stato sviluppato, ma con scarsa capacità di potere essere utilizzato in condizioni diverse.
Lo svantaggio principale dei test orientati al criterio è che il significato psicologico dei punteggi è ignoto. Non avendo una teoria sulle variabili psicologiche che distinguono due gruppi, un buon test discriminante non ci aiuta a capire perché tali gruppi siano diversi. Non è possibile sapere quanti costrutti siano coinvolti nella determinazione di un punteggio. Inoltre, due punteggi uguali non implicano la presenza dei medesime meccanismi psicologici. Date queste ambiguità, utilizzando questi test non è possibile neppure aumentare le nostre conoscenze in maniera incrementale.
Il problema maggiore per lo sviluppo di questi strumenti è la definizione del criterio: qual è la variabile numerica che discrimina nella maniera maggiore tra i gruppi in esame (malati/sani)?
La batteria di item iniziale deve essere sufficientemente grande e non è necessario che gli item abbiano validità di contenuto o validità di facciata. In generale, la batteria di item deve essere più grande di quelle usate per il metodo fattoriale o di analisi degli item: mancando criteri teorici per la scelta degli item, la scelta iniziale degli item è molto arbitraria ed è dunque necessario partire da un numero molto elevato di item. Ciò è meno vero quando gli item hanno una certa validità di facciata o di contenuto. In seguito, semplicemente si selezionano gli item che discriminano efficacemente fra i gruppi, o gli item fortemente associati con il punteggio criterio. È necessario poi replicare su un diverso campione la capacità discriminativa degli item selezionati.
21.0.2 Test basati sulla norma
Le misure riferite ad una norma indicano la posizione del rispondente in riferimento alla distribuzione di punteggi ottenuti nello stesso test da un campione di grandi dimensioni e rappresentativo della popolazione di riferimento. La maggioranza dei test di personalità, attitudinali e cognitivi sono test basati sulla norma.
La metrica utilizzata per tale confronto può avere caratteristiche diverse. I punteggi standardizzati (con media \(0\) e varianza unitaria) calcolati rispetto al gruppo di riferimento sono spesso convertiti in una scala diversa, per esempio aventi media pari a \(500\) e deviazione standard di \(100\) (punteggi SAT), o aventi media pari a \(100\) e deviazione standard di \(15\) (es. punteggi WAIS-VI). È facile operare tale trasformazione. Il punteggio \(Y\) di un rispondente può essere trasformato nel modo seguente in un punteggio standard \(X_i\), avente una media target pari a \(\mu_s\) e una deviazione standard \(\sigma_s\)
\[X_i = \mu_s + z_i \sigma_s\notag\]
dove \(z\) è il punteggio standardizzato \(z=\frac{Y-\bar{Y}}{s_Y}\).