23 Estimandi teorici e estimandi empirici
- distinguere tra estimando teorico e estimando empirico;
- capire i benefici dell’utilizzo di estimandi chiaramente definiti.
- Leggere What Is Your Estimand? Defining the Target Quantity Connects Statistical Evidence to Theory di Lundberg et al. (2021).
23.1 Introduzione
Nei capitoli precedenti abbiamo esplorato diverse tecniche di analisi esplorativa dei dati, strumenti fondamentali per sintetizzare informazioni, rappresentare le distribuzioni delle variabili e descriverne le relazioni. Tuttavia, queste tecniche presuppongono che le variabili siano state misurate in modo appropriato rispetto alla domanda teorica di ricerca. È quindi essenziale chiarire il legame tra le quantità che intendiamo stimare (estimandi) e il quadro teorico che guida l’analisi.
Per approfondire questa relazione tra teoria e misurazione, esamineremo il contributo di Lundberg et al. (2021), What Is Your Estimand? Defining the Target Quantity Connects Statistical Evidence to Theory. Questo lavoro evidenzia l’importanza di una precisa definizione dell’estimando in uno studio e della distinzione tra estimando teorico ed estimando empirico, cruciale per interpretare correttamente i risultati statistici nel contesto della teoria sottostante.
23.2 Definizione di Estimando
In epistemologia e metodologia della ricerca, il concetto di estimando si riferisce alla quantità che desideriamo stimare attraverso l’osservazione e l’inferenza. Nelle scienze psicologiche, dove molti fenomeni di interesse non sono direttamente osservabili, è fondamentale distinguere tra:
- Estimando teorico – il costrutto latente definito dalla teoria.
- Estimando empirico – la misura numerica ottenuta da dati osservabili.
23.2.1 Estimando Teorico: Il Costrutto Latente
L’estimando teorico è la quantità di interesse che un modello teorico definisce, ma che non può essere direttamente osservata. Nelle scienze psicologiche, la maggior parte dei costrutti – come intelligenza, ansia, personalità, autoefficacia – rientra in questa categoria.
Esempio 23.1 Consideriamo il livello di ansia di tratto di un individuo, ovvero la sua tendenza stabile a sperimentare stati ansiosi in diverse situazioni:
- L’ansia di tratto è un costrutto teorico formulato nella teoria della personalità.
- Non possiamo osservarla direttamente, né esiste un singolo indicatore oggettivo che la rappresenti perfettamente.
- L’ansia di tratto è quindi un estimando teorico, inferibile solo tramite indicatori osservabili.
23.2.2 Estimando Empirico: La Misura Osservabile
L’estimando empirico è la misura quantitativa che usiamo per approssimare l’estimando teorico. È ottenuto attraverso strumenti di misurazione come test psicometrici, scale di valutazione o indicatori fisiologici.
Esempio 23.2 Per stimare l’ansia di tratto, possiamo utilizzare il State-Trait Anxiety Inventory (STAI-T), un questionario i cui item includono affermazioni come:
- “Mi sento spesso nervoso senza motivo apparente.”
- “Tendo a preoccuparmi molto anche per piccole cose.”
Le risposte fornite dal soggetto vengono aggregate in un punteggio complessivo, che rappresenta un estimando empirico dell’ansia di tratto. Tuttavia:
- Questo punteggio è solo una proxy quantitativa dell’ansia di tratto.
- Non corrisponde all’ansia di tratto in sé, ma è una stima basata su dati osservabili.
23.2.3 Differenze tra Estimando Teorico ed Empirico
Aspetto | Estimando Teorico | Estimando Empirico |
---|---|---|
Definizione | Costrutto latente, concettuale | Misura osservabile, numerica |
Esempi | Intelligenza, ansia, personalità | Punteggi a test, risposte a questionari |
Misurabilità | Non direttamente osservabile | Derivato da dati empirici |
Dipendenza dai dati | Definito dalla teoria | Derivato da strumenti di misura |
23.3 Le Sfide della Stima degli Estimandi
L’uso di estimandi empirici per inferire estimandi teorici presenta diverse sfide metodologiche:
- Validità della Misura
- Il test STAI-T misura veramente l’ansia di tratto o cattura solo un aspetto superficiale dell’ansia?
- Indicatori fisiologici come il cortisolo o la conduttanza cutanea possono offrire altre proxy dell’ansia, ma con significati differenti.
- Affidabilità della Misura
- Il punteggio ottenuto è stabile nel tempo?
- Se un soggetto compila il test in momenti diversi, ottiene risultati simili?
- Distorsioni e Errori di Misura
- Gli item del questionario potrebbero influenzare le risposte?
- I soggetti rispondono in modo onesto o sono condizionati da desiderabilità sociale?
- Modelli Statistici e Inferenza Bayesiana
- I modelli fattoriali, le equazioni strutturali (SEM) e i modelli bayesiani sono strumenti essenziali per inferire estimandi teorici dai dati empirici.
23.4 Il Modello Fattoriale Latente
L’ansia di tratto (\(\theta\)) può essere modellata come una variabile latente tramite l’analisi fattoriale. Il modello assume la seguente forma:
\[ y_i = \lambda_i \theta + \epsilon_i , \tag{23.1}\]
dove:
- \(y_i\) è la risposta osservabile al singolo item (estimando empirico),
- \(\theta\) è il livello latente di ansia di tratto (estimando teorico),
- \(\lambda_i\) è il peso fattoriale dell’item, che indica quanto l’item misura il costrutto latente.
- \(\epsilon_i\) è l’errore di misurazione.
L’analisi fattoriale permette di:
- identificare la struttura del costrutto,
- quantificare il contributo di ciascun item attraverso i pesi fattoriali (\(\lambda_i\)),
- separare la variabilità spiegata dalla variabilità attribuibile all’errore (\(\epsilon_i\)).
23.5 Framework di Lundberg et al. (2021): Il Collegamento tra Teoria e Dati
Lundberg et al. (2021) propongono un approccio metodologico in tre fasi:
- definire l’estimando teorico, ancorandolo esplicitamente alla teoria di riferimento,
- tradurre l’estimando teorico in un estimando empirico, ovvero una misura osservabile,
- stimare l’estimando empirico, applicando procedure statistiche adeguate.
Esempio 23.3 Un esempio concreto è fornito dal modello di Rescorla-Wagner, applicato a compiti di Probabilistic Reversal Learning (PRL): l’estimando empirico potrebbe corrispondere a parametri come il tasso di apprendimento \(\alpha\) o la temperatura inversa \(\beta\). Questi parametri riflettono quanto i partecipanti modifichino i valori associati agli stimoli o regolino la strategia di scelta (esplorazione rispetto a sfruttamento).
È importante notare che l’estimando empirico può essere stimato in modi diversi, utilizzando modelli, metodi di stima e disegni sperimentali vari. Il modello di Rescorla-Wagner è solo una possibile rappresentazione dell’apprendimento associativo, e i suoi parametri possono essere ricavati con procedure differenti. Di conseguenza, il valore numerico che descrive la capacità di apprendimento associativo dipende dal modello, dalla tecnica di stima e dal contesto sperimentale.

@RexDouglass
.
23.6 Conclusioni
Definire chiaramente l’estimando teorico è un passo fondamentale per garantire la validità delle inferenze scientifiche. Il framework di Lundberg et al. (2021) fornisce un metodo rigoroso per legare teoria e dati, migliorando la replicabilità e la coerenza degli studi psicologici.
L’adozione di un approccio strutturato nella definizione degli estimandi consente di:
- Chiarire gli obiettivi della ricerca.
- Garantire la coerenza tra teoria e dati.
- Migliorare la qualità e l’interpretazione delle inferenze statistiche.
In questo modo, la ricerca quantitativa può produrre risultati più solidi e generalizzabili.
Esercizi
Esercizio 1: Distinguere Estimando Teorico ed Empirico
Obiettivo: Comprendere la differenza tra costrutti latenti e misure osservabili.
Attività: Scegli tre costrutti psicologici (es. autostima, ansia di tratto, empatia). Per ciascuno:
- Descrivi l’estimando teorico (cioè il costrutto latente).
- Identifica un possibile estimando empirico (es. punteggio a un questionario).
- Spiega in che modo il passaggio dal costrutto latente alla misura osservabile potrebbe introdurre errori o distorsioni.
- Descrivi l’estimando teorico (cioè il costrutto latente).
Esercizio 2: Validità e Affidabilità di una Scala di Misura
Obiettivo: Riflettere sugli aspetti di validità (contenuto, costrutto) e affidabilità (stabilità delle misure) di uno strumento.
Attività: Immagina di dover stimare il costrutto “ansia di prestazione” in atleti. Proponi:
- Un questionario o scala con 5 item, descrivendo i contenuti di ciascun item.
- Una strategia per valutare la validità (es. confrontare con un altro test già validato, definire i criteri di inclusione degli item).
- Una procedura per valutare l’affidabilità (es. test-retest, consistenza interna).
- Una breve discussione su possibili fonti di errore di misurazione (desiderabilità sociale, bias di risposta).
- Un questionario o scala con 5 item, descrivendo i contenuti di ciascun item.
Esercizio 3: Modello Fattoriale Latente
Obiettivo: Comprendere come un modello fattoriale colleghi risposte osservate a un costrutto latente.
Attività: Supponi di avere 4 item che misurano il costrutto “senso di autoefficacia”. I punteggi di ogni item vanno da 1 (per niente d’accordo) a 5 (molto d’accordo). Ti vengono forniti dati fittizi per 10 persone (es. risposte in tabella).
- Prova a ipotizzare come si potrebbe rappresentare l’equazione di un modello fattoriale (simile all’esempio nel testo con \(y_i = \lambda_i \theta + \epsilon_i\)).
- Indica in parole semplici che cosa rappresentano \(\theta\), \(\lambda_i\) ed \(\epsilon_i\) nel tuo esempio.
- Elenca due vantaggi che un modello fattoriale offre rispetto al calcolo semplice di una media su tutti gli item.
- Prova a ipotizzare come si potrebbe rappresentare l’equazione di un modello fattoriale (simile all’esempio nel testo con \(y_i = \lambda_i \theta + \epsilon_i\)).
Esercizio 4: Definire l’Estimando per un Compito di Apprendimento
- Obiettivo: Legare un esperimento e un modello a un preciso estimando teorico ed empirico.
- Attività: Immagina uno studio sperimentale di apprendimento in cui i partecipanti devono imparare la regola di associazione tra uno stimolo visivo e una ricompensa. Hai deciso di usare il modello di Rescorla-Wagner per stimare il tasso di apprendimento (\(\alpha\)) di ciascun partecipante.
- Descrivi l’estimando teorico che ti interessa (es. “capacità di aggiornare le aspettative in base al feedback”).
- Spiega in che modo l’estimando empirico (\(\alpha\)) è derivato dai dati osservati (scelte del partecipante, errori, risposte corrette).
- Elenca due possibili ragioni per cui il valore di \(\alpha\) ottenuto può essere diverso in base alla procedura di stima (es. tipo di algoritmo, impostazioni iniziali).
- Descrivi l’estimando teorico che ti interessa (es. “capacità di aggiornare le aspettative in base al feedback”).
Esercizio 5: Criticità nell’Interpretazione degli Estimandi
Obiettivo: Riflettere sui possibili fattori che rendono complessa l’interpretazione del punteggio stimato.
Attività: Scegli un qualsiasi costrutto psicologico (es. impulsività, motivazione al successo, stile di attaccamento). Immagina di avere uno strumento (questionario, test computerizzato o altro) che fornisce un punteggio finale come estimando empirico.
- Spiega come l’errore di misurazione (rumore, bias di risposta, item poco chiari) può influire sull’interpretazione del punteggio.
- Descrivi una situazione in cui il punteggio osservato potrebbe non riflettere correttamente il costrutto latente (es. persona che risponde in modo poco sincero).
- Proponi due strategie per migliorare la validità della misura (es. aggiungere item, utilizzare misurazioni multiple, integrazione con misure fisiologiche, controlli statistici, ecc.).
- Spiega come l’errore di misurazione (rumore, bias di risposta, item poco chiari) può influire sull’interpretazione del punteggio.
Esercizio 1: Distinguere Estimando Teorico ed Empirico
Autostima
- Estimando teorico: L’idea di “auto-valutazione globale positiva o negativa di sé” (construct della psicologia della personalità). Non si misura direttamente, ma è un concetto chiave per spiegare comportamenti di auto-efficacia, soddisfazione, ecc.
- Estimando empirico: Punteggio ottenuto dal Rosenberg Self-Esteem Scale (RSES), una scala di 10 item con punteggi da 0 a 30.
- Errori/distorsioni: Possibile desiderabilità sociale: il partecipante potrebbe tendere a rispondere in modo da apparire migliore; eventuale variazione linguistica nella comprensione degli item.
- Estimando teorico: L’idea di “auto-valutazione globale positiva o negativa di sé” (construct della psicologia della personalità). Non si misura direttamente, ma è un concetto chiave per spiegare comportamenti di auto-efficacia, soddisfazione, ecc.
Ansia di tratto
- Estimando teorico: Tendenza stabile a sperimentare preoccupazione, nervosismo, e tensione in varie situazioni (componente relativamente stabile).
- Estimando empirico: Punteggio della sezione Trait (T) del State-Trait Anxiety Inventory (STAI-T).
- Errori/distorsioni: Bias di risposta (es. risposte casuali, eccessiva fretta), scarsa onestà, influenza dell’umore momentaneo (che dovrebbe riflettere l’ansia di stato, non di tratto).
- Estimando teorico: Tendenza stabile a sperimentare preoccupazione, nervosismo, e tensione in varie situazioni (componente relativamente stabile).
Empatia
- Estimando teorico: Capacità di comprendere e condividere lo stato emotivo altrui, distinta in componente cognitiva e affettiva.
- Estimando empirico: Punteggio al Davis Interpersonal Reactivity Index (IRI) o un’altra scala self-report sull’empatia.
- Errori/distorsioni: Limitazione del formato self-report nel catturare l’aspetto empatico reale in situazioni quotidiane, possibili misunderstanding di alcuni item.
- Estimando teorico: Capacità di comprendere e condividere lo stato emotivo altrui, distinta in componente cognitiva e affettiva.
Esercizio 2: Validità e Affidabilità di una Scala di Misura
Questionario a 5 item (risposte su scala Likert 1–5):
- “Prima di una gara, mi preoccupo di non riuscire a gestire la pressione.”
- “Penso spesso a come potrei sbagliare durante la competizione.”
- “Mi sento nervoso/a e teso/a molto tempo prima di iniziare la performance.”
- “Ho la sensazione di non essere all’altezza di ciò che ci si aspetta da me.”
- “Faccio fatica a concentrare l’attenzione sui miei obiettivi sportivi.”
- “Prima di una gara, mi preoccupo di non riuscire a gestire la pressione.”
Strategia per valutare la validità
- Validità di contenuto: confrontare gli item con la letteratura specialistica sull’ansia di prestazione (chiedere feedback a esperti in psicologia dello sport).
- Validità concorrente: somministrare il questionario insieme a un altro strumento già validato per l’ansia di prestazione (o con una misura fisiologica di stress, come frequenza cardiaca a riposo).
- Validità di costrutto: correlare i punteggi con scale simili (es. STAI) e verificare che siano più alti in atleti di sport ad alta pressione (es. gare individuali).
- Validità di contenuto: confrontare gli item con la letteratura specialistica sull’ansia di prestazione (chiedere feedback a esperti in psicologia dello sport).
Procedura per valutare l’affidabilità
- Test-retest: somministrare la scala a un gruppo di atleti a distanza di 2 settimane, verificando la correlazione tra i punteggi.
- Consistenza interna: calcolare l’α di Cronbach per stimare in che misura gli item misurano un costrutto coerente.
- Test-retest: somministrare la scala a un gruppo di atleti a distanza di 2 settimane, verificando la correlazione tra i punteggi.
Possibili fonti di errore
- Bias di desiderabilità sociale (l’atleta potrebbe minimizzare la propria ansia).
- Stato emotivo contingente (per es., stress esterno non legato allo sport).
- Situazione specifica dell’atleta il giorno della compilazione (stanchezza, problemi personali, ecc.).
- Bias di desiderabilità sociale (l’atleta potrebbe minimizzare la propria ansia).
Esercizio 3: Modello Fattoriale Latente
Equazione di un modello fattoriale (semplificata)
\[ y_i = \lambda_i \,\theta + \epsilon_i \quad\quad (i=1,2,3,4), \]
dove
- \(y_i\) è la risposta all’item \(i\),
- \(\theta\) è il livello latente di autoefficacia,
- \(\lambda_i\) è il peso fattoriale per l’item \(i\),
- \(\epsilon_i\) è l’errore di misurazione per l’item \(i\).
- \(y_i\) è la risposta all’item \(i\),
Descrizione dei termini:
- \(\theta\): il “vero” senso di autoefficacia che non possiamo osservare direttamente.
- \(\lambda_i\): indica quanto ciascun item riflette il costrutto; se \(\lambda_i\) è alto, l’item è molto rappresentativo.
- \(\epsilon_i\): comprende errori casuali, interpretazioni errate, ecc.
- \(\theta\): il “vero” senso di autoefficacia che non possiamo osservare direttamente.
Due vantaggi del modello fattoriale:
- Gestione dell’errore: il modello separa la parte di variabilità dovuta al costrutto da quella dovuta all’errore (mentre la media “mescola” entrambe).
- Indagine del peso di ciascun item: possiamo capire se un item è fortemente o debolmente collegato al costrutto, migliorando la validità dello strumento.
- Gestione dell’errore: il modello separa la parte di variabilità dovuta al costrutto da quella dovuta all’errore (mentre la media “mescola” entrambe).
Esercizio 4: Definire l’Estimando per un Compito di Apprendimento
Estimando teorico
- L’“abilità di adeguare il comportamento in funzione degli esiti passati” corrisponde al grado di plasticità dell’apprendimento. Non osserviamo “direttamente” questa abilità, che resta un costrutto astratto.
Estimando empirico (\(\alpha\))
- Nel modello di Rescorla-Wagner, dopo ogni prova la stima del valore dello stimolo si aggiorna in base all’errore di predizione.
- Dati osservati: scelte del partecipante, premio o penalità ricevuti, differenze tra aspettative e risultati effettivi.
- \(\alpha\) si stima applicando un metodo di ottimizzazione (per es. regressione non lineare, massima verosimiglianza, o un approccio bayesiano) che riduce lo scarto tra le previsioni del modello e il comportamento (scelte corrette/errate) del partecipante.
- Nel modello di Rescorla-Wagner, dopo ogni prova la stima del valore dello stimolo si aggiorna in base all’errore di predizione.
Due ragioni per cui \(\alpha\) varia
- Differenti procedure di ottimizzazione: alcuni algoritmi convergono a un valore locale invece che globale, oppure usano penali diverse per la complessità del modello.
- Varie formulazioni del modello: si potrebbero introdurre parametri addizionali (ad es. \(\beta\) per la “temperatura inversa” o funzioni di apprendimento leggermente diverse) che modificano il valore ottimale di \(\alpha\).
- Differenti procedure di ottimizzazione: alcuni algoritmi convergono a un valore locale invece che globale, oppure usano penali diverse per la complessità del modello.
Esercizio 5: Criticità nell’Interpretazione degli Estimandi
- Costrutto: Impulsività
- Strumento: Una scala di autovalutazione (es. Barratt Impulsiveness Scale)
- Influenza dell’errore di misurazione
- Se un individuo compila la scala in un momento di forte stress o fretta, le sue risposte possono enfatizzare un aspetto temporaneo invece che stabile.
- Piccoli errori (item poco chiari, interpretazioni ambigue) si sommano, distorcendo il punteggio finale.
- Se un individuo compila la scala in un momento di forte stress o fretta, le sue risposte possono enfatizzare un aspetto temporaneo invece che stabile.
- Situazione in cui il punteggio non rispecchia il costrutto latente
- Una persona tende a presentarsi in modo socialmente desiderabile, dunque minimizza i comportamenti impulsivi. Di fatto, il punteggio osservato sarà basso, ma non rappresenta il vero livello di impulsività.
- Due strategie per migliorare la validità
- Aggiungere item e fonti multiple: utilizzare più item su diverse sfaccettature dell’impulsività e integrare dati osservazionali o indicatori oggettivi (per es. tempi di reazione in un test computerizzato).
- Ridurre la desiderabilità sociale: rendere le risposte anonime, istruendo i partecipanti sull’importanza di risposte autentiche, o aggiungere un indice di tendenza alla risposta “socialmente accettabile”.
- Aggiungere item e fonti multiple: utilizzare più item su diverse sfaccettature dell’impulsività e integrare dati osservazionali o indicatori oggettivi (per es. tempi di reazione in un test computerizzato).