Riflessioni conclusive della sezione
La sezione dedicata alla regressione ci ha permesso di esplorare uno degli strumenti più centrali della statistica applicata in psicologia. Abbiamo visto come la regressione lineare nasca come modello fenomenologico: descrive relazioni tra variabili, ma non pretende di spiegare i meccanismi sottostanti. Proprio per questo, la regressione è onnipresente nella ricerca empirica: offre un linguaggio comune per riassumere i dati, stimare differenze e formulare previsioni.
Abbiamo iniziato dalla regressione lineare bivariata, per comprendere concetti di base come intercetta, pendenza e variabilità residua, e abbiamo visto come la regressione verso la media rappresenti un fenomeno statistico inevitabile che ci mette in guardia dai rischi di interpretazioni affrettate. Successivamente abbiamo introdotto l’approccio bayesiano alla regressione, che ci consente di esprimere l’incertezza in modo diretto e di integrare conoscenze pregresse, trasformando la regressione da strumento puramente descrittivo a parte di un quadro inferenziale più ampio.
Con l’introduzione di Stan abbiamo visto come l’approccio bayesiano diventi praticabile anche in modelli più complessi, a patto di saperne interpretare correttamente i risultati e di essere consapevoli dei limiti derivanti da un’eventuale specificazione errata del modello o dall’omissione di variabili rilevanti.
Abbiamo poi riformulato problemi classici — la stima di una media, il confronto tra due gruppi, la valutazione della grandezza dell’effetto — come casi particolari del modello lineare. Questo ci ha permesso di mettere in evidenza il vero obiettivo della ricerca psicologica: non stabilire soltanto se una differenza “esiste”, ma comprenderne l’ampiezza, la plausibilità e la rilevanza pratica. Da qui il passo verso la pianificazione della dimensione campionaria è stato naturale: l’inferenza statistica non riguarda solo l’analisi dei dati raccolti, ma anche la progettazione consapevole degli studi.
Infine, abbiamo visto come l’ANOVA a una via si inserisca nello stesso quadro concettuale, come estensione del modello di regressione con variabili indicatrici. Ciò conferma che regressione e ANOVA non sono strumenti distinti, ma espressioni diverse dello stesso impianto metodologico.
In sintesi, la sezione ha mostrato come il modello lineare costituisca un quadro unificante per gran parte delle analisi psicologiche, e come l’approccio bayesiano renda questo quadro più trasparente e interpretabile. Ma ci ha anche ricordato che si tratta di modelli fenomenologici, che descrivono associazioni senza entrare nel merito dei processi che le generano. Nel prosieguo del manuale vedremo come sia possibile andare oltre, introducendo modelli più ricchi e meccanicistici, capaci non solo di descrivere, ma anche di simulare e spiegare i processi cognitivi e affettivi che stanno alla base dei dati psicologici.