Introduzione alla sezione
Nei capitoli precedenti abbiamo visto come sia possibile condurre l’inferenza statistica in situazioni semplici, come la stima di una media o il confronto tra due gruppi. In questa sezione estenderemo il discorso al modello di regressione lineare, nelle sue forme bivariata e multipla, applicato sia a predittori quantitativi sia a predittori qualitativi. La regressione non rappresenta un nuovo problema, ma piuttosto un ampliamento: l’inferenza su una o due medie, tradizionalmente affrontata con il t-test di Student, può infatti essere vista come un caso particolare del più generale modello lineare. Questo approccio unificato sarà presentato sia nella prospettiva frequentista sia in quella bayesiana.
È importante, a questo punto, distinguere tra due grandi famiglie di modelli. I modelli fenomenologici descrivono i dati: offrono un riassunto matematico delle relazioni osservate, senza fare ipotesi esplicite sui processi che le hanno generate. I modelli meccanicistici, invece, mirano a rappresentare i meccanismi sottostanti, simulando i processi cognitivi o affettivi che producono le osservazioni. La regressione lineare appartiene chiaramente alla prima categoria: è uno strumento descrittivo, non esplicativo. La sua diffusione in psicologia deriva in larga misura dal successo dell’approccio frequentista, che ha imposto la logica dicotomica della verifica dell’ipotesi nulla (“c’è o non c’è un’associazione nella popolazione?”).
Tuttavia, sappiamo che questa domanda ha un valore scientifico limitato. In un certo senso, tutto è correlato con tutto il resto: ciò che conta non è stabilire se un’associazione esista, ma comprenderne l’entità e, più in profondità, i meccanismi che la determinano. La regressione lineare fornisce una descrizione accurata dell’associazione, ma non può dirci nulla sulle cause. Questo limite è condiviso dalla maggior parte dei modelli quantitativi utilizzati in psicologia, ancora oggi prevalentemente di tipo fenomenologico.
Ciononostante, studiare la regressione è indispensabile. Non tanto per la sua capacità esplicativa – che è ridotta – quanto perché costituisce lo strumento statistico più usato nella ricerca psicologica. Inoltre, l’adozione di una prospettiva bayesiana consente di reinterpretare la regressione in termini più maturi e scientificamente fecondi: non più come un test dicotomico dell’ipotesi nulla, ma come valutazione della plausibilità dei diversi valori dei parametri e confronto tra modelli alternativi. In questa prospettiva, la regressione lineare diventa un passaggio cruciale nel percorso che ci porterà, più avanti, verso modelli più ricchi e meccanicistici, capaci di rappresentare non solo le associazioni osservate ma anche i processi che le generano.