Introduzione
In questa sezione affronteremo alcuni tra i casi più semplici dell’inferenza statistica, ovvero l’inferenza su una singola media, la differenza tra due medie, e l’analisi del modello di regressione lineare, sia bivariato sia multiplo, con predittori quantitativi e qualitativi.
Tradizionalmente, l’inferenza su una o due medie viene trattata mediante il t-test di Student, nell’ambito dell’approccio frequentista. Tuttavia, in una prospettiva più moderna, questi problemi possono essere ricondotti al modello lineare generale, che fornisce un quadro metodologico unificato. In questa sezione, quindi, presenteremo il modello lineare sia dal punto di vista frequentista sia secondo l’approccio bayesiano, mostrando come l’inferenza su una o due medie rappresenti un caso particolare di questo impianto generale.
È utile, a questo proposito, distinguere tra due tipi di modelli: i modelli fenomenologici e i modelli meccanicistici. I modelli fenomenologici si limitano a descrivere i dati: forniscono un riassunto matematico della relazione osservata tra variabili, senza fare ipotesi esplicite sui processi che generano tali relazioni. I modelli meccanicistici, al contrario, cercano di rappresentare il processo sottostante che ha prodotto i dati, offrendo una spiegazione plausibile dei meccanismi causali in gioco.
Il modello lineare, e in particolare il modello di regressione, appartiene alla prima categoria: è un modello fenomenologico, descrittivo. La sua enorme diffusione in psicologia è legata, almeno in parte, al successo dell’approccio frequentista, che imposta la questione inferenziale in termini dicotomici: “c’è evidenza di un’associazione tra variabili, oppure no?”, alla luce di un’ipotesi nulla che assume l’assenza di associazione nella popolazione.
Tuttavia, abbiamo già osservato come questa domanda, in sé, abbia una portata scientifica limitata. Sappiamo, in linea generale, che tutto è correlato con tutto il resto. La domanda rilevante, quindi, non è se esista un’associazione, ma quanto forte sia tale associazione. E anche quando stimiamo la forza dell’associazione, questo non ci dice ancora nulla sui meccanismi che l’hanno generata. Una descrizione accurata può essere utile, ma non è sufficiente per spiegare il fenomeno osservato.
Purtroppo, la maggior parte dei modelli quantitativi in psicologia è di tipo fenomenologico, probabilmente a causa della predominanza dell’approccio frequentista e della sua enfasi sull’associazione statistica come obiettivo esplicativo. Questo rappresenta un limite per lo sviluppo teorico della disciplina. Esistono però anche modelli meccanicistici in psicologia – ne vedremo un esempio concreto nella sezione dedicata alla modellazione dinamica – che si propongono di simulare i processi cognitivi o affettivi sottostanti.
In questa sezione ci concentreremo dunque sul modello di regressione, consapevoli che si tratta di un modello descrittivo, non esplicativo. Non lo facciamo perché sia particolarmente importante dal punto di vista scientifico, ma perché è onnipresente nella pratica della ricerca psicologica. L’aspetto innovativo della trattazione che segue sarà l’adozione di una prospettiva bayesiana, che ci permette di reinterpretare l’inferenza statistica in termini di incertezza soggettiva, confronto tra modelli e plausibilità delle ipotesi, offrendo strumenti concettuali e computazionali più coerenti con un approccio scientifico maturo.