23 Estimandi teorici e estimandi empirici
- distinguere tra estimando teorico e estimando empirico;
- capire i benefici dell’utilizzo di estimandi chiaramente definiti.
- Leggere What Is Your Estimand? Defining the Target Quantity Connects Statistical Evidence to Theory di Lundberg et al. (2021).
23.1 Introduzione
Nei capitoli precedenti, abbiamo esaminato tecniche di analisi esplorativa dei dati, strumenti essenziali per sintetizzare informazioni e descrivere relazioni tra variabili. Tuttavia, queste metodologie presuppongono che le variabili siano misurate in modo coerente con la domanda teorica di ricerca. Emerge così un problema centrale: come collegare validamente i costrutti teorici ai dati osservati? La risposta risiede nella definizione rigorosa dell’estimando, il parametro che funge da ponte tra astrazione teorica e realtà empirica.
23.1.1 Che Cos’è l’Estimando?
L’estimando rappresenta la quantità specifica che l’analisi statistica mira a stimare, definendo il “bersaglio” dell’inferenza. Nelle scienze psicologiche, dove fenomeni come intelligenza, emozioni o atteggiamenti sono costrutti latenti, questa definizione è cruciale per evitare discrepanze tra ipotesi teoriche e risultati empirici.
23.1.1.1 Due Dimensioni dell’Estimando
Per garantire rigore metodologico, è necessario distinguere due livelli:
- Estimando teorico: il costrutto astratto definito dalla teoria, non direttamente osservabile (es. ansia di tratto, autostima).
- Estimando empirico: la misura operazionale derivata da strumenti concreti (es. punteggi di questionari).
Esempio.
Consideriamo l’ansia di tratto, definita teoricamente come una tendenza stabile a sperimentare stati ansiosi. Pur essendo un costrutto centrale nella psicologia della personalità, non è osservabile direttamente. Per stimarla, si ricorre a strumenti come lo State-Trait Anxiety Inventory (STAI-T), un questionario che include item come “Mi sento spesso nervoso senza motivo apparente”. Le risposte aggregate generano un punteggio totale, che costituisce l’estimando empirico. Tuttavia, questo punteggio è solo una proxy del costrutto teorico: misura un aspetto specifico (es. autovalutazione soggettiva) senza esaurire la complessità dell’ansia di tratto.
23.1.2 Rischi dello Story-Telling e Strategie di Mitigazione
In molte pubblicazioni psicologiche, il legame tra teoria e dati è costruito attraverso narrative persuasive (story-telling), approccio che sostituisce il rigore metodologico con metafore suggestive. Questa pratica espone a tre rischi principali:
- circolarità argomentativa: interpretare i dati in modo coerente con la teoria, senza verificarne i limiti.
- falsi positivi: selezionare misure empiriche che “sembrano” supportare l’ipotesi, ignorando proxy più appropriate.
- generalizzazioni indebite: estendere conclusioni valide per un contesto specifico a costrutti teorici più ampi.
Per contrastare questi problemi, Lundberg et al. (2021) propone strategie chiave:
- preregistrazione dell’estimando: specificare a priori come il costrutto teorico viene tradotto in variabili osservabili (munafo2017manuscript?).
- modelli statistici espliciti: utilizzare framework (es. modelli strutturali) che mappino trasparentemente le relazioni teoria-dati.
- validità convergente: verificare che diverse misure dello stesso costrutto producano risultati coerenti.
23.1.3 Impatto sulla Replicabilità Scientifica
La mancata definizione dell’estimando contribuisce alla crisi di replicabilità nelle scienze sociali. Studi che confondono stimande empirici ristretti con costrutti teorici ampi generano risultati non riproducibili in contesti diversi. Come evidenzia (oberauer2019inferential?), una dichiarazione esplicita dell’estimando riduce l’ambiguità interpretativa e facilita la verifica indipendente, pilastro del metodo scientifico.
23.1.4 Sintesi delle Differenze
La tabella seguente riassume le distinzioni critiche tra stimandi teorici ed empirici:
Aspetto | Estimando Teorico | Estimando Empirico |
---|---|---|
Natura | Costrutto latente, astratto | Misura quantitativa, osservabile |
Esempi | Intelligenza, resilienza | Punteggi a test STAI-T, tempi di reazione |
Misurabilità | Inferito indirettamente | Derivato da dati strumentali |
Fonte | Teoria psicologica | Strumenti di rilevazione |
Definire formalmente l’estimando non è un mero esercizio tecnico, ma un atto di trasparenza intellettuale. Abbandonando lo story-telling a favore di una pianificazione rigorosa, la psicologia può rafforzare il dialogo tra teoria e dati, elevando la sua credibilità come disciplina scientifica. Come dimostrano i casi discussi, solo attraverso questa chiarezza concettuale è possibile costruire evidenze replicabili e avanzare nella comprensione dei fenomeni mentali.
23.2 Le Sfide della Stima degli Estimandi
L’uso di estimandi empirici per inferire estimandi teorici presenta diverse sfide metodologiche:
- Validità della Misura
- Il test STAI-T misura veramente l’ansia di tratto o cattura solo un aspetto superficiale dell’ansia?
- Indicatori fisiologici come il cortisolo o la conduttanza cutanea possono offrire altre proxy dell’ansia, ma con significati differenti.
- Affidabilità della Misura
- Il punteggio ottenuto è stabile nel tempo?
- Se un soggetto compila il test in momenti diversi, ottiene risultati simili?
- Distorsioni e Errori di Misura
- Gli item del questionario potrebbero influenzare le risposte?
- I soggetti rispondono in modo onesto o sono condizionati da desiderabilità sociale?
- Modelli Statistici e Inferenza Bayesiana
- I modelli fattoriali, le equazioni strutturali (SEM) e i modelli bayesiani sono strumenti essenziali per inferire estimandi teorici dai dati empirici.
23.3 Il Modello Fattoriale Latente
L’ansia di tratto (\(\theta\)) può essere modellata come una variabile latente tramite l’analisi fattoriale. Il modello assume la seguente forma:
\[ y_i = \lambda_i \theta + \epsilon_i , \tag{23.1}\]
dove:
- \(y_i\) è la risposta osservabile al singolo item (estimando empirico),
- \(\theta\) è il livello latente di ansia di tratto (estimando teorico),
- \(\lambda_i\) è il peso fattoriale dell’item, che indica quanto l’item misura il costrutto latente.
- \(\epsilon_i\) è l’errore di misurazione.
L’analisi fattoriale permette di:
- identificare la struttura del costrutto,
- quantificare il contributo di ciascun item attraverso i pesi fattoriali (\(\lambda_i\)),
- separare la variabilità spiegata dalla variabilità attribuibile all’errore (\(\epsilon_i\)).
23.4 Framework di Lundberg et al. (2021): Il Collegamento tra Teoria e Dati
Lundberg et al. (2021) propongono un approccio metodologico in tre fasi:
- definire l’estimando teorico, ancorandolo esplicitamente alla teoria di riferimento,
- tradurre l’estimando teorico in un estimando empirico, ovvero una misura osservabile,
- stimare l’estimando empirico, applicando procedure statistiche adeguate.
Esempio 23.1 Un esempio concreto è fornito dal modello di Rescorla-Wagner, applicato a compiti di Probabilistic Reversal Learning (PRL): l’estimando empirico potrebbe corrispondere a parametri come il tasso di apprendimento \(\alpha\) o la temperatura inversa \(\beta\). Questi parametri riflettono quanto i partecipanti modifichino i valori associati agli stimoli o regolino la strategia di scelta (esplorazione rispetto a sfruttamento).
È importante notare che l’estimando empirico può essere stimato in modi diversi, utilizzando modelli, metodi di stima e disegni sperimentali vari. Il modello di Rescorla-Wagner è solo una possibile rappresentazione dell’apprendimento associativo, e i suoi parametri possono essere ricavati con procedure differenti. Di conseguenza, il valore numerico che descrive la capacità di apprendimento associativo dipende dal modello, dalla tecnica di stima e dal contesto sperimentale.
23.5 Conclusioni
Definire chiaramente l’estimando teorico è un passo fondamentale per garantire la validità delle inferenze scientifiche. Il framework di Lundberg et al. (2021) fornisce un metodo rigoroso per legare teoria e dati, migliorando la replicabilità e la coerenza degli studi psicologici.
L’adozione di un approccio strutturato nella definizione degli estimandi consente di:
- chiarire gli obiettivi della ricerca,
- garantire la coerenza tra teoria e dati,
- migliorare la qualità e l’interpretazione delle inferenze statistiche.
In questo modo, la ricerca quantitativa può produrre risultati più solidi e generalizzabili.
Esercizi
Esercizio 1: Distinguere Estimando Teorico ed Empirico
Obiettivo: Comprendere la differenza tra costrutti latenti e misure osservabili.
Attività: Scegli tre costrutti psicologici (es. autostima, ansia di tratto, empatia). Per ciascuno:
- Descrivi l’estimando teorico (cioè il costrutto latente).
- Identifica un possibile estimando empirico (es. punteggio a un questionario).
- Spiega in che modo il passaggio dal costrutto latente alla misura osservabile potrebbe introdurre errori o distorsioni.
- Descrivi l’estimando teorico (cioè il costrutto latente).
Esercizio 2: Validità e Affidabilità di una Scala di Misura
Obiettivo: Riflettere sugli aspetti di validità (contenuto, costrutto) e affidabilità (stabilità delle misure) di uno strumento.
Attività: Immagina di dover stimare il costrutto “ansia di prestazione” in atleti. Proponi:
- Un questionario o scala con 5 item, descrivendo i contenuti di ciascun item.
- Una strategia per valutare la validità (es. confrontare con un altro test già validato, definire i criteri di inclusione degli item).
- Una procedura per valutare l’affidabilità (es. test-retest, consistenza interna).
- Una breve discussione su possibili fonti di errore di misurazione (desiderabilità sociale, bias di risposta).
- Un questionario o scala con 5 item, descrivendo i contenuti di ciascun item.
Esercizio 3: Modello Fattoriale Latente
Obiettivo: Comprendere come un modello fattoriale colleghi risposte osservate a un costrutto latente.
Attività: Supponi di avere 4 item che misurano il costrutto “senso di autoefficacia”. I punteggi di ogni item vanno da 1 (per niente d’accordo) a 5 (molto d’accordo). Ti vengono forniti dati fittizi per 10 persone (es. risposte in tabella).
- Prova a ipotizzare come si potrebbe rappresentare l’equazione di un modello fattoriale (simile all’esempio nel testo con \(y_i = \lambda_i \theta + \epsilon_i\)).
- Indica in parole semplici che cosa rappresentano \(\theta\), \(\lambda_i\) ed \(\epsilon_i\) nel tuo esempio.
- Elenca due vantaggi che un modello fattoriale offre rispetto al calcolo semplice di una media su tutti gli item.
- Prova a ipotizzare come si potrebbe rappresentare l’equazione di un modello fattoriale (simile all’esempio nel testo con \(y_i = \lambda_i \theta + \epsilon_i\)).
Esercizio 4: Definire l’Estimando per un Compito di Apprendimento
- Obiettivo: Legare un esperimento e un modello a un preciso estimando teorico ed empirico.
- Attività: Immagina uno studio sperimentale di apprendimento in cui i partecipanti devono imparare la regola di associazione tra uno stimolo visivo e una ricompensa. Hai deciso di usare il modello di Rescorla-Wagner per stimare il tasso di apprendimento (\(\alpha\)) di ciascun partecipante.
- Descrivi l’estimando teorico che ti interessa (es. “capacità di aggiornare le aspettative in base al feedback”).
- Spiega in che modo l’estimando empirico (\(\alpha\)) è derivato dai dati osservati (scelte del partecipante, errori, risposte corrette).
- Elenca due possibili ragioni per cui il valore di \(\alpha\) ottenuto può essere diverso in base alla procedura di stima (es. tipo di algoritmo, impostazioni iniziali).
- Descrivi l’estimando teorico che ti interessa (es. “capacità di aggiornare le aspettative in base al feedback”).
Esercizio 5: Criticità nell’Interpretazione degli Estimandi
Obiettivo: Riflettere sui possibili fattori che rendono complessa l’interpretazione del punteggio stimato.
Attività: Scegli un qualsiasi costrutto psicologico (es. impulsività, motivazione al successo, stile di attaccamento). Immagina di avere uno strumento (questionario, test computerizzato o altro) che fornisce un punteggio finale come estimando empirico.
- Spiega come l’errore di misurazione (rumore, bias di risposta, item poco chiari) può influire sull’interpretazione del punteggio.
- Descrivi una situazione in cui il punteggio osservato potrebbe non riflettere correttamente il costrutto latente (es. persona che risponde in modo poco sincero).
- Proponi due strategie per migliorare la validità della misura (es. aggiungere item, utilizzare misurazioni multiple, integrazione con misure fisiologiche, controlli statistici, ecc.).
- Spiega come l’errore di misurazione (rumore, bias di risposta, item poco chiari) può influire sull’interpretazione del punteggio.
Esercizio 1: Distinguere Estimando Teorico ed Empirico
Autostima
- Estimando teorico: L’idea di “auto-valutazione globale positiva o negativa di sé” (construct della psicologia della personalità). Non si misura direttamente, ma è un concetto chiave per spiegare comportamenti di auto-efficacia, soddisfazione, ecc.
- Estimando empirico: Punteggio ottenuto dal Rosenberg Self-Esteem Scale (RSES), una scala di 10 item con punteggi da 0 a 30.
- Errori/distorsioni: Possibile desiderabilità sociale: il partecipante potrebbe tendere a rispondere in modo da apparire migliore; eventuale variazione linguistica nella comprensione degli item.
- Estimando teorico: L’idea di “auto-valutazione globale positiva o negativa di sé” (construct della psicologia della personalità). Non si misura direttamente, ma è un concetto chiave per spiegare comportamenti di auto-efficacia, soddisfazione, ecc.
Ansia di tratto
- Estimando teorico: Tendenza stabile a sperimentare preoccupazione, nervosismo, e tensione in varie situazioni (componente relativamente stabile).
- Estimando empirico: Punteggio della sezione Trait (T) del State-Trait Anxiety Inventory (STAI-T).
- Errori/distorsioni: Bias di risposta (es. risposte casuali, eccessiva fretta), scarsa onestà, influenza dell’umore momentaneo (che dovrebbe riflettere l’ansia di stato, non di tratto).
- Estimando teorico: Tendenza stabile a sperimentare preoccupazione, nervosismo, e tensione in varie situazioni (componente relativamente stabile).
Empatia
- Estimando teorico: Capacità di comprendere e condividere lo stato emotivo altrui, distinta in componente cognitiva e affettiva.
- Estimando empirico: Punteggio al Davis Interpersonal Reactivity Index (IRI) o un’altra scala self-report sull’empatia.
- Errori/distorsioni: Limitazione del formato self-report nel catturare l’aspetto empatico reale in situazioni quotidiane, possibili misunderstanding di alcuni item.
- Estimando teorico: Capacità di comprendere e condividere lo stato emotivo altrui, distinta in componente cognitiva e affettiva.
Esercizio 2: Validità e Affidabilità di una Scala di Misura
Questionario a 5 item (risposte su scala Likert 1–5):
- “Prima di una gara, mi preoccupo di non riuscire a gestire la pressione.”
- “Penso spesso a come potrei sbagliare durante la competizione.”
- “Mi sento nervoso/a e teso/a molto tempo prima di iniziare la performance.”
- “Ho la sensazione di non essere all’altezza di ciò che ci si aspetta da me.”
- “Faccio fatica a concentrare l’attenzione sui miei obiettivi sportivi.”
- “Prima di una gara, mi preoccupo di non riuscire a gestire la pressione.”
Strategia per valutare la validità
- Validità di contenuto: confrontare gli item con la letteratura specialistica sull’ansia di prestazione (chiedere feedback a esperti in psicologia dello sport).
- Validità concorrente: somministrare il questionario insieme a un altro strumento già validato per l’ansia di prestazione (o con una misura fisiologica di stress, come frequenza cardiaca a riposo).
- Validità di costrutto: correlare i punteggi con scale simili (es. STAI) e verificare che siano più alti in atleti di sport ad alta pressione (es. gare individuali).
- Validità di contenuto: confrontare gli item con la letteratura specialistica sull’ansia di prestazione (chiedere feedback a esperti in psicologia dello sport).
Procedura per valutare l’affidabilità
- Test-retest: somministrare la scala a un gruppo di atleti a distanza di 2 settimane, verificando la correlazione tra i punteggi.
- Consistenza interna: calcolare l’α di Cronbach per stimare in che misura gli item misurano un costrutto coerente.
- Test-retest: somministrare la scala a un gruppo di atleti a distanza di 2 settimane, verificando la correlazione tra i punteggi.
Possibili fonti di errore
- Bias di desiderabilità sociale (l’atleta potrebbe minimizzare la propria ansia).
- Stato emotivo contingente (per es., stress esterno non legato allo sport).
- Situazione specifica dell’atleta il giorno della compilazione (stanchezza, problemi personali, ecc.).
- Bias di desiderabilità sociale (l’atleta potrebbe minimizzare la propria ansia).
Esercizio 3: Modello Fattoriale Latente
Equazione di un modello fattoriale (semplificata)
\[ y_i = \lambda_i \,\theta + \epsilon_i \quad\quad (i=1,2,3,4), \]
dove
- \(y_i\) è la risposta all’item \(i\),
- \(\theta\) è il livello latente di autoefficacia,
- \(\lambda_i\) è il peso fattoriale per l’item \(i\),
- \(\epsilon_i\) è l’errore di misurazione per l’item \(i\).
- \(y_i\) è la risposta all’item \(i\),
Descrizione dei termini:
- \(\theta\): il “vero” senso di autoefficacia che non possiamo osservare direttamente.
- \(\lambda_i\): indica quanto ciascun item riflette il costrutto; se \(\lambda_i\) è alto, l’item è molto rappresentativo.
- \(\epsilon_i\): comprende errori casuali, interpretazioni errate, ecc.
- \(\theta\): il “vero” senso di autoefficacia che non possiamo osservare direttamente.
Due vantaggi del modello fattoriale:
- Gestione dell’errore: il modello separa la parte di variabilità dovuta al costrutto da quella dovuta all’errore (mentre la media “mescola” entrambe).
- Indagine del peso di ciascun item: possiamo capire se un item è fortemente o debolmente collegato al costrutto, migliorando la validità dello strumento.
- Gestione dell’errore: il modello separa la parte di variabilità dovuta al costrutto da quella dovuta all’errore (mentre la media “mescola” entrambe).
Esercizio 4: Definire l’Estimando per un Compito di Apprendimento
Estimando teorico
- L’“abilità di adeguare il comportamento in funzione degli esiti passati” corrisponde al grado di plasticità dell’apprendimento. Non osserviamo “direttamente” questa abilità, che resta un costrutto astratto.
Estimando empirico (\(\alpha\))
- Nel modello di Rescorla-Wagner, dopo ogni prova la stima del valore dello stimolo si aggiorna in base all’errore di predizione.
- Dati osservati: scelte del partecipante, premio o penalità ricevuti, differenze tra aspettative e risultati effettivi.
- \(\alpha\) si stima applicando un metodo di ottimizzazione (per es. regressione non lineare, massima verosimiglianza, o un approccio bayesiano) che riduce lo scarto tra le previsioni del modello e il comportamento (scelte corrette/errate) del partecipante.
- Nel modello di Rescorla-Wagner, dopo ogni prova la stima del valore dello stimolo si aggiorna in base all’errore di predizione.
Due ragioni per cui \(\alpha\) varia
- Differenti procedure di ottimizzazione: alcuni algoritmi convergono a un valore locale invece che globale, oppure usano penali diverse per la complessità del modello.
- Varie formulazioni del modello: si potrebbero introdurre parametri addizionali (ad es. \(\beta\) per la “temperatura inversa” o funzioni di apprendimento leggermente diverse) che modificano il valore ottimale di \(\alpha\).
- Differenti procedure di ottimizzazione: alcuni algoritmi convergono a un valore locale invece che globale, oppure usano penali diverse per la complessità del modello.
Esercizio 5: Criticità nell’Interpretazione degli Estimandi
- Costrutto: Impulsività
- Strumento: Una scala di autovalutazione (es. Barratt Impulsiveness Scale)
- Influenza dell’errore di misurazione
- Se un individuo compila la scala in un momento di forte stress o fretta, le sue risposte possono enfatizzare un aspetto temporaneo invece che stabile.
- Piccoli errori (item poco chiari, interpretazioni ambigue) si sommano, distorcendo il punteggio finale.
- Se un individuo compila la scala in un momento di forte stress o fretta, le sue risposte possono enfatizzare un aspetto temporaneo invece che stabile.
- Situazione in cui il punteggio non rispecchia il costrutto latente
- Una persona tende a presentarsi in modo socialmente desiderabile, dunque minimizza i comportamenti impulsivi. Di fatto, il punteggio osservato sarà basso, ma non rappresenta il vero livello di impulsività.
- Due strategie per migliorare la validità
- Aggiungere item e fonti multiple: utilizzare più item su diverse sfaccettature dell’impulsività e integrare dati osservazionali o indicatori oggettivi (per es. tempi di reazione in un test computerizzato).
- Ridurre la desiderabilità sociale: rendere le risposte anonime, istruendo i partecipanti sull’importanza di risposte autentiche, o aggiungere un indice di tendenza alla risposta “socialmente accettabile”.
- Aggiungere item e fonti multiple: utilizzare più item su diverse sfaccettature dell’impulsività e integrare dati osservazionali o indicatori oggettivi (per es. tempi di reazione in un test computerizzato).