9.3 Le due componenti del punteggio osservato

CTT si occupa delle relazioni tra \(X\), \(T\) ed \(E\). La CTT si basa su un modello relativamente semplice in cui il punteggio osservato, il punteggio vero (cioè l’abilità inosservabile del rispondente) e l’errore aleatorio di misurazione sono legati da una relazione lineare. Indicati con \(T_{\nu j}\) (true score) l’abilità latente da misurare dell’individuo \(\nu\) nella prova \(j\), con \(X_{\nu j}\) la variabile osservata (observed score) per l’individuo \(\nu\) nella prova \(j\) e con \(E_{\nu j}\) l’errore aleatorio di misurazione, il modello è

\[\begin{equation} X_{\nu j} = T_{\nu} + E_{\nu j}. \tag{9.1} \end{equation}\]

Dunque, in base alla (9.1) il punteggio osservato \(X_{\nu j}\) differisce da quello vero \(T_{\nu j}\) a causa di una componente di errore casuale la quale viene assunta essere \(E_{\nu j} \sim \mathcal{N}(0, \sigma_E)\). Uno degli obiettivi centrali della CTT è quello di quantificare l’entità di tale errore (ovvero, di stimare \(\sigma_E\)). Vedremo come questa quantificazione verrà fornita in due forme: l’attendibilità del test e la stima dell’errore standard della misurazione. Si notino le similarità tra queste due misure della CTT e le misure di bontà di adattamento del modello di regressione lineare.

  • L’attendibilità (o affidabilità) rappresenta l’accuratezza con cui un test può misurare il punteggio vero (Coaley, 2014) e corrisponde al rapporto tra la varianza dei punteggi veri e la varianza dei punteggi osservati:
    • se l’attendibilità è grande, \(\sigma_E\) è piccolo – \(X\) ha un piccolo errore di misurazione e sarà vicino a \(T\).
    • se l’attendibilità è piccola, \(\sigma_E\) è grande – \(X\) presenta un grande errore di misurazione e si discosterà molto da \(T\).
  • La stima dell’errore standard della misurazione è una stima della deviazione standard della variabile casuale \(E\) (ovvero \(\sigma_E\)) che corrompe i punteggi veri.

Vedremo in seguito in che senso l’attendibilità della CTT possa essere messa in relazione con il coefficiente di determinazione del modello statistico della regressione lineare e come l’errore standard della misurazione della CTT possa essere messo in relazione con l’errore standard della regressione.

9.3.1 Il punteggio vero

La (9.1) ci dice che il punteggio osservato è dato dalla somma di due componenti: una componente sistematica (il punteggio vero) e una componente aleatoria (l’errore di misurazione). Ma che cos’è il punteggio vero? CTT attribuisce diverse interpretazioni al punteggio vero.

  • La CTT considera un reattivo psicologico come una selezione casuale di item da un universo/popolazione di item attinenti al costrutto da misurare (Nunnally 1994; Kline 2013). Se il reattivo psicologico viene concepito in questo modo, il punteggio vero diventa il punteggio che un rispondente otterrebbe se fosse misurato su tutto l’universo degli item del costrutto. In questo senso, l’errore di misurazione riflette il grado in cui gli item che costituiscono il test non riescono a rappresentare l’intero universo degli item attinenti al costrutto.
  • In maniera equivalente, il punteggio vero può essere concepito come il punteggio non “distorto” da componenti estranee al costrutto, ovvero da effetti di apprendimento, fatica, memoria, motivazione, eccetera. Essendo concepita come del tutto casuale (ovvero, priva di qualunque natura sistematica), la componente aleatoria non introduce alcun bias nella tendenza centrale della misurazione (la media di \(E\) viene assunta essere uguale a 0).
  • In termini puramente statistici, il punteggio vero è un punteggio inosservabile che corrisponde al valore atteso di infinite realizzazioni del punteggio ottenuto:

\[ T = \mathbb{E}(X) \equiv \mu_X \equiv \mu_{T}. \]

Combinando la seconda e la terza definizione presentate sopra, Lord and Novick (1968) concepiscono il punteggio vero come la media dei punteggi che un soggetto otterrebbe se il test venisse somministrato ripetutamente nelle stesse condizioni, in assenza di effetti di apprendimento e/o fatica.

9.3.2 Somministrazioni ripetute

Nella formulazione del modello della CTT si possono distinguere due tipi di esperimenti aleatori: uno che considera l’unità di osservazione (l’individuo) come campionaria, l’altro che considera il punteggio, per un determinato individuo, come una variabile casuale. Un importante risultato è dato dall’unione di questi due esperimenti casuali, ovvero dalla dimostrazione che i risultati della CTT, la quale è stata sviluppata ipotizzando ipotetiche somministrazioni ripetute del test allo stesso individuo sotto le medesime condizioni, si generalizzano al caso di una singola somministrazione del test ad un campione di individui (Allen and Yen 2001). In base a questo risultato, se consideriamo la somministrazione del test ad una popolazione di individui, allora diventa più facile assegnare un contenuto empirico alle quantità discusse dalla CTT:

  • \(\sigma^2_X\) è la varianza del punteggio osservato nella popolazione,
  • \(\sigma^2_T\) è la varianza dei punteggio vero nella popolazione,
  • \(\sigma^2_E\) è la varianza della componente d’errore nella popolazione.

9.3.3 Le assunzioni sul punteggio ottenuto

La CTT assume che la media del punteggio osservato \(X\) sia uguale alla media del punteggio vero,

\[ \mu_X \equiv \mu_{T}, \tag{9.2} \]

in altri termini, assume che il punteggio osservato fornisca una stima statisticamente corretta dell’abilità latente (punteggio vero).

In pratica, il punteggio osservato non sarà mai uguale all’abilità latente, ma corrisponde solo ad uno dei possibili punteggi che il soggetto può ottenere, subordinatamente alla sua abilità latente. L’errore della misura è la differenza tra il punteggio osservato e il punteggio vero:

\[E \equiv X - T.\]

In base all’assunzione secondo cui il valore atteso dei punteggi è uguale alla media del valore vero, segue che

\[ \mathbb{E}(E) = \mathbb{E}(X - T) = \mathbb{E}(X) - \mathbb{E}(T) = \mu_{T} - \mu_{T} = 0, \]

ovvero, il valore atteso degli errori è uguale a zero.

References

Allen, Mary J, and Wendy M Yen. 2001. Introduction to Measurement Theory. Waveland Press.
Kline, Paul. 2013. Handbook of Psychological Testing. Routledge.
Lord, Frederic M, and Melvin R Novick. 1968. Statistical Theories of Mental Test Scores. Addison-Wesley.
Nunnally, Jum C. 1994. Psychometric Theory. McGraw-Hill.