11.2 L’errore standard della stima
Il modello di regressione di Kelley non solo ci permette di ottenere una stima del punteggio vero a partire dal punteggio osservato, ma ci fornisce anche una misura di precisione di tale stima: l’errore standard della stima.
Immaginiamo di poter somministrare il test ad un rispondente più volte, in condizioni identiche, e di ottenere in ogni somministrazione una stima del valore vero ˆT. A causa dell’errore di misurazione, il punteggio osservato varierà in ogni somministrazione del test, e quindi anche la stima di ˆT varierà. La deviazione standard di queste stime ipotetiche di ˆT è chiamata errore standard della stima, indicato con σˆT.
Calcolare l’errore standard della stima è importante poiché ci dà un’indicazione della precisione della stima del punteggio vero. Più piccolo è l’errore standard della stima, più precisa sarà la stima del punteggio vero. L’errore standard della stima si calcola con la formula seguente:
σˆT=σX√ρXX′(1−ρXX′).
Dimostrazione. Per ricavare la (11.3) si definisce ε l’errore che si commette quando si stima il punteggio vero ˆT con il punteggio osservato T (si veda Lord and Novick 1968):
ε=T−ˆT.
Si presti attenzione alla notazione: E=X−T indica l’errore della misurazione, ovvero la differenza tra il punteggio osservato e il punteggio vero. Invece ε=T−ˆT indica la differenza tra il punteggio vero e la stima del punteggio vero.
Avendo che ˆT=ˉX+ρXX′(X−ˉX), la varianza di ε=T−ˆT si può scrivere come
V(ε)=V(T−ˆT)=V(T−ˉX−ρXX′X+ρXX′ˉX).
Dato che la varianza di una variabile aleatoria non cambia sommando a tale variabile una costante, dobbiamo semplicemente calcolare
V(ε)=V(T−ρXX′X).
Dobbiamo trovare la varianza della somma di due variabili aleatorie, una delle quali moltiplicata per una costante. Dunque:
V(ε)=V(T)+ρ2XX′V(X)−2ρXX′Cov(X,T),
ovvero, semplificando la notazione,
σ2ε=σ2T+ρ2XX′σ2X−2ρXX′σXT.
La quantità ρXX′ è il coefficiente di attendibilità. Quindi
σ2ε=σ2T+(σ2Tσ2X)2σ2X−2σ2Tσ2XσXT.
Semplificando otteniamo
σ2ε=σ2T+σ4Tσ4Xσ2X−2σ2Tσ2XσXT=σ2T+σ2Tσ2Tσ2X−σ2T2σXTσ2X=σ2T(1+σ2Tσ2X−2σXTσ2X).
Dato che σXT=σ2T, l’equazione precedente diventa uguale a
σ2ε=σ2T(1+σ2Tσ2X−2σ2Tσ2X)=σ2T(1−σ2Tσ2X).
L’errore standard della stima è dunque uguale a
σε=σT√1−σ2Tσ2X=σT√σ2X−σ2Tσ2X=σTσX√σ2X−σ2T.
Dato che σ2X=σ2T+σ2E, abbiamo
σε=σTσX√σ2E=σTσXσE=√ρXX′σE.
Ricordando che l’errore standard della misurazione è σE=σX√1−ρXX′, possiamo scrivere
σε=√ρXX′σE=√ρXX′σX√1−ρXX′=σX√ρXX′(1−ρXX′).
Per dati campionari, l’errore standard della stima si calcola nel modo seguente:
sˆT=sX√rXX′(1−rXX′),
dove sX è deviazione standard del campione e rXX′ è il coefficiente di attendibilità.