Introduzione
In questa sezione esploreremo un approccio all’analisi dei dati basato sull’uso della regressione lineare, esaminandolo dalla prospettiva dell’inferenza bayesiana. La regressione è un metodo che consente ai ricercatori di riassumere come le previsioni o i valori medi di un risultato variano tra individui definiti da un insieme di predittori.
Come indicato da Gelman et al. (2020), alcuni degli usi più importanti della regressione sono:
Previsione: Modellare osservazioni esistenti o prevedere nuovi dati. Esempi con risultati continui o approssimativamente continui includono la previsione dei punteggi in un test futuro, la misurazione dei livelli di stress in un contesto di lavoro, o il monitoraggio del benessere psicologico in uno studio longitudinale. Esempi con risultati discreti o categoriali (a volte chiamati classificazione) includono la diagnosi di un disturbo psicologico, la riuscita o il fallimento in un compito cognitivo, e le decisioni individuali di partecipare a una terapia.
Esplorazione delle associazioni: Riassumere quanto bene una variabile, o un insieme di variabili, predica il risultato. Esempi includono l’identificazione dei tratti di personalità associati a una maggiore resilienza allo stress. Oppure l’analisi della relazione tra stili di attaccamento infantile e capacità relazionali in età adulta. Oppure lo studio di come diversi fattori socio-economici influenzano lo sviluppo cognitivo nei bambini.
Estrapolazione: Adeguare le analisi per tenere conto delle differenze conosciute tra il campione osservato e la popolazione di interesse. Per esempio, la generalizzazione dei risultati di uno studio sulla depressione condotto su studenti universitari alla popolazione generale. Oppure la stima dell’efficacia di una nuova terapia cognitivo-comportamentale testata in un contesto clinico controllato su una popolazione più ampia e diversificata. Oppure la previsione dell’impatto di un programma di prevenzione del bullismo testato in alcune scuole su un intero distretto scolastico.
Inferenza causale: Forse l’uso più importante della regressione è stimare gli effetti di un trattamento. Abbiamo già definito l’inferenza causale più dettagliatamente nel 23 Causalità dai dati osservazionali. Per esempio, la valutazione dell’effetto di un intervento di mindfulness sui livelli di ansia, controllando per variabili confondenti come l’età e precedenti esperienze di meditazione. Oppure la stima dell’impatto di un programma di sviluppo delle competenze emotive sulle performance lavorative, tenendo conto di fattori come l’ambiente di lavoro e la personalità dei partecipanti. Oppure l’analisi dell’efficacia di diverse tecniche psicoterapeutiche nel trattamento del disturbo post-traumatico da stress, considerando la gravità iniziale dei sintomi e il supporto sociale dei pazienti.
In tutti questi scenari, è cruciale che il modello di regressione includa tutte le variabili rilevanti. Ad esempio, in uno studio sull’efficacia di una terapia per la depressione negli anziani, è essenziale includere fattori come l’età, le condizioni di salute preesistenti e il supporto sociale. Omettere questi predittori potrebbe portare a stime inaccurate e conclusioni fuorvianti sull’effettiva efficacia del trattamento in questa popolazione specifica.