11.6 Conclusioni

La teoria classica del punteggio vero prevede un modello additivo. Un punteggio osservato \(X\) è la somma di due componenti: un punteggio vero stabile \(T\) e un punteggio di errore casuale \(E\). Si suppone che i punteggi di errore in un test non siano correlati con i punteggi veri in quel test e con i punteggi veri e di errore in tutti gli altri test. I test paralleli hanno gli stessi punteggi veri e le stesse varianze di errore. Si definiscono sostanzialmente equivalenti (\(\tau\)-equivalenti) i test che presentano punteggi veri che differiscono solamente per una costante additiva. Le assunzioni per la teoria classica del punteggio vero possono essere violate da diverse condizioni che influenzano i punteggi del test. Tuttavia, poiché non possiamo determinare direttamente \(T\) ed \(E\), non possiamo verificare direttamente l’appropriatezza delle assunzioni e possiamo solo supporre quando sarebbero appropriate.

I punteggi veri e i punteggi di errore sono costrutti teorici non osservabili. Possiamo osservare solo i punteggi \(X\). Quando parliamo di punteggi veri, è necessario ricordare che un punteggio vero, ovvero un punteggio medio preso su ripetuti test indipendenti con lo stesso test, è un’idea teorica. Questo punteggio non rifletterà completamente la caratteristica “vera” di interesse a meno che il test non abbia una attendibilità perfetta, ovvero a meno che il test misuri esattamente ciò che afferma di misurare.

11.6.1 Vantaggi della CTT

Ci sono numerosi vantaggi nel lavorare nel framework della teoria classica dei test (CTT) durante lo sviluppo di test. In primo luogo, i concetti della CTT sono ampiamente insegnati e compresi. In secondo luogo, i concetti della CTT sono relativamente facili da imparare, usare e spiegare. Le statistiche descrittive dei test (ad esempio, la media, la deviazione standard, l’intervallo, ecc.) e le statistiche relative alle analisi degli item (in particolare la facilità e la discriminazione degli item) possono essere calcolate facilmente. In terzo luogo, il modello CTT soddisfa molte esigenze di misurazione, in particolare per lo sviluppo di misure di competenza e di collocazione che possono aiutare nelle decisioni di ammissione, nei confronti tra programmi e nelle decisioni di collocazione in vari contesti lavorativi. In quarto luogo, giusto o sbagliato, il modello CTT consente e permette l’interpretazione dei punteggi degli esaminati del 0% e del 100% e delle stime di facilità degli item di 0.0 e di 1.0 - risultati che si verificano nel mondo reale. Tali punteggi degli esaminati (detti anche stime di abilità personale) e stime di facilità degli item sono generalmente considerati non adatti nei modelli di teoria di risposta agli item (IRT).

11.6.2 Svantaggi della CTT

Tuttavia, lavorare all’interno del quadro CTT presenta anche alcuni svantaggi. In primo luogo, i test CTT tendono ad essere lunghi e necessariamente composti da elementi omogenei. In secondo luogo, gli esaminandi che completano test sviluppati attraverso i metodi CTT potrebbero dover affrontare numerosi item che sono troppo facili o troppo difficili per loro come individui. In terzo luogo, i risultati sui test CTT si applicano solo al campione preso in considerazione o a campioni molto simili. In quarto luogo, i risultati CTT si applicano solo alla selezione corrente di item. In quinto luogo, a causa della sua dipendenza dalla distribuzione normale, i CTT sono utili solo per lo sviluppo di test normativi. In sesto luogo, a causa della natura correlativa della discriminazione degli elementi, dell’affidabilità e di alcune stime di validità, gli item e i test CTT finiscono spesso per essere sensibili alle differenze tra gli estremi della scala. In settimo luogo, sebbene in realtà gli errori di misurazione su un test varino lungo tutto il range dei possibili punteggi in un test CTT (vale a dire, l’errore standard di misurazione è minore vicino alla media e diventa sempre più grande man mano che i punteggi si allontanano dalla media in entrambe le direzioni), l’errore standard di misurazione stimato nei CTT è una media su tutto questo intervallo.