11.3 Intervallo di confidenza per il punteggio vero

Siamo ora finalmente nelle condizioni di potere calcolare l’intervallo di confidenza per il punteggio vero. Conoscendo l’errore standard della stima \(\sigma_{\hat{T}}\), l’intervallo di confidenza per il punteggio vero è dato da:

\[ \hat{T} \pm z \sigma_{\hat{T}}, \]

laddove \(\hat{T}\) è la stima del punteggio vero e \(z\) è il quantile della normale standardizzata al livello di probabilità desiderato. Se il campione è piccolo (minore di 30) è opportuno usare \(t\) anziché \(z\).

11.3.1 Interpretazione

Notiamo che l’intervallo \(\hat{T} \pm z \sigma_{\hat{T}}\) è centrato sulla stima puntuale del valore vero e la sua ampiezza dipende sia dal livello di confidenza desiderato (rappresentato dal quantile \(z_{\frac{\alpha}{2}}\)), sia dal grado di precisione dello stimatore, misurato dall’errore standard della stima, \(\sigma_{\hat{T}} = \sigma_X \sqrt{\rho_{XX^\prime} (1 -\rho_{XX^\prime})}\). È importante notare che l’errore standard della stima diventa sempre più grande man mano che diminuisce l’attendibilità \(\rho_{XX^\prime}\) del test.

L’intervallo di confidenza indica quanto l’imprecisione della misura influisce sull’interpretazione dei dati. Più l’intervallo di confidenza è ampio, maggiore è l’incertezza nella valutazione dei risultati.

Esercizio 11.2 Charter (1996) ha esaminato l’effetto della variazione dell’attendibilità del test sull’ampiezza dell’intervallo di confidenza per il punteggio vero. Utilizzando come esempio i punteggi di QI (\(\mu\) = 100, \(\sigma\) = 15), Charter ha immaginato di variare il coefficiente di attendibilità del test utilizzato per la misurazione del QI. I valori presi in considerazione sono 0.55, 0.65, 0.75, 0.85 e 0.95. Ad esempio, supponiamo di avere un punteggio osservato pari a QI = 120 e un coefficiente di attendibilità del test \(\rho_{xx^\prime}\) pari a 0.65. In tali circostanze, la stima del punteggio vero è pari a

\[ \begin{equation} \begin{aligned} \hat{T} &= \bar{X} + r_{XX^\prime} (X - \bar{X}) \notag\\ &= 100 + 0.65 (120 - 100)\notag\\ &= 113.\notag \end{aligned} \end{equation} \]

L’errore standard della stima è uguale a

\[ \begin{equation} \begin{aligned} \sigma_{\hat{T}} &= \sigma_{X} \sqrt{r_{XX^\prime} (1 - r_{XX^\prime})} \notag\\ &= 15 \sqrt{0.65 (1 - 0.65)}\notag\\ &= 7.15.\notag \end{aligned} \end{equation} \]

L’intervallo di confidenza al 95% per la stima del punteggio vero diventa pertanto uguale a

\[ 113 \pm 1.96 \cdot 7.15 = [98.98, 127.02]. \]

Si noti che si può calcolare l’errore standard della stima con la funzione SE.Est() del pacchetto psychometric.

suppressWarnings(suppressMessages(library("psychometric")))

SE.Est(15, .65)
#> [1] 7.154544

Inoltre, la funzione CI.tscore() restituisce sia la stima del punteggio vero sia l’intervallo di fiducia al livello desiderato di significatività.

CI.tscore(120, 100, 15, 0.65, level = 0.95)
#>     SE.Est      LCL T.Score      UCL
#> 1 7.154544 98.97735     113 127.0226

References

Charter, Richard A. 1996. “Revisiting the Standard Errors of Measurement, Estimate, and Prediction and Their Application to Test Scores.” Perceptual and Motor Skills 82 (3): 1139–44.