96  Usi e abusi dei modelli lineari

96.1 Introduzione

Sebbene i metodi di regressione siano ampiamente utilizzati in psicologia e nelle scienze sociali, molte applicazioni di queste analisi nella ricerca mancano di chiarezza di scopo e dimostrano una comprensione inadeguata di concetti chiave. Carlin & Moreno-Betancur (2023) sostengono che è necessario un approccio più mirato nell’insegnamento e nell’applicazione dei metodi biostatistici, in particolare per quanto riguarda i modelli di regressione. Carlin & Moreno-Betancur (2023) propongono che i concetti statistici dovrebbero essere insegnati e applicati in stretta relazione con il contesto specifico della loro applicazione, piuttosto che essere trattati come strumenti universali. Carlin & Moreno-Betancur (2023) evidenziano l’importanza di distinguere tra tre tipi di domande di ricerca: descrittive, predittive e causali, sostenendo che tale distinzione è essenziale per evitare fraintendimenti e cattive pratiche nell’uso dei modelli di regressione.

96.1.1 1. Domande Descrittive

Scopo: Le domande descrittive in psicologia mirano a caratterizzare e descrivere comportamenti, pensieri, emozioni o caratteristiche psicologiche di una popolazione. L’obiettivo è ottenere una panoramica chiara delle variabili psicologiche senza cercare di determinare cause o fare previsioni.

Esempi: - Uno studio che descrive il livello di ansia in diversi gruppi di età durante una pandemia, utilizzando scale di autovalutazione dell’ansia. - Un’indagine che esplora la prevalenza di sintomi depressivi tra studenti universitari durante il periodo degli esami. - Un’analisi che misura la frequenza di comportamenti di procrastinazione tra professionisti in diversi settori lavorativi.

Approccio Analitico: Per queste domande, si utilizzano statistiche descrittive come medie, deviazioni standard e percentuali per fornire un quadro generale delle caratteristiche psicologiche della popolazione studiata. I modelli di regressione possono essere impiegati per controllare i potenziali confondenti, ma il loro scopo principale è descrittivo, non predittivo o causale.

96.1.2 2. Domande Predittive

Scopo: Le domande predittive in psicologia si concentrano sulla costruzione di modelli che possano prevedere comportamenti o esiti psicologici futuri in base a dati già disponibili. L’obiettivo è identificare i migliori predittori di un risultato psicologico e creare modelli che possano essere applicati per fare previsioni accurate su nuovi individui.

Esempi: - Uno studio che utilizza i dati dei tratti della personalità per prevedere la probabilità di burnout in professionisti della salute mentale. - Un modello che stima il rischio di abbandono scolastico tra gli adolescenti basandosi su variabili come l’autostima, il supporto familiare e le esperienze di bullismo. - Un’analisi che sviluppa un algoritmo per prevedere la probabilità di recidiva in pazienti con disturbi alimentari, usando dati raccolti su fattori psicologici e comportamentali.

Approccio Analitico: In questo contesto, vengono utilizzati modelli statistici come la regressione logistica, la regressione lineare, o algoritmi di machine learning per sviluppare modelli predittivi. La qualità di un modello predittivo viene valutata sulla base di metriche come l’accuratezza, la sensibilità, e la specificità, piuttosto che sulla comprensione delle relazioni causali tra variabili.

96.1.3 3. Domande Causali

Scopo: Le domande causali in psicologia cercano di determinare l’effetto di una variabile psicologica su un’altra, spesso per comprendere le implicazioni di un intervento o di una modifica in un comportamento o stato psicologico. L’obiettivo è stabilire una relazione di causa-effetto per giustificare interventi o sviluppare teorie.

Esempi: - Uno studio sperimentale che valuta l’efficacia della terapia cognitivo-comportamentale (CBT) nel ridurre i sintomi d’ansia nei pazienti rispetto a un gruppo di controllo che riceve un trattamento placebo. - Un’indagine longitudinale che esamina se l’incremento della consapevolezza (mindfulness) nel corso del tempo porta a una riduzione significativa dei livelli di stress in studenti universitari. - Una ricerca che esplora se un programma di training sulla regolazione emotiva può causare una diminuzione della frequenza di attacchi di panico nei partecipanti con disturbo da panico.

Approccio Analitico: Per rispondere a domande causali, sono necessari disegni di studio ben pianificati, come esperimenti randomizzati controllati o studi longitudinali. L’analisi dei dati può coinvolgere modelli di regressione per aggiustare i confondenti e isolare gli effetti causali. In questi casi, l’enfasi è posta sull’uso corretto della randomizzazione, del controllo dei confondenti e dell’inferenza causale per fare dichiarazioni valide sulle relazioni causa-effetto.

96.1.4 Conclusione

Comprendere le differenze tra domande di ricerca descrittive, predittive e causali è fondamentale nella ricerca psicologica per utilizzare correttamente i metodi statistici. Ogni tipo di domanda richiede un approccio specifico che tenga conto dell’obiettivo dell’analisi e delle caratteristiche dei dati disponibili, al fine di evitare errori comuni e migliorare la validità e l’applicabilità dei risultati ottenuti.

Un aspetto importante sottolineato da Carlin & Moreno-Betancur (2023) riguarda l’interpretazione errata dei coefficienti di regressione, che è un problema comune nella pratica della statistica applicata, inclusa la psicologia. Questo errore deriva spesso da una mancanza di chiarezza rispetto allo scopo dell’analisi e alla natura delle domande di ricerca.

96.1.5 Problemi Comuni nell’Interpretazione dei Coefficienti di Regressione

  1. Assunzione di Causalità da Modelli Predittivi: Un errore comune è interpretare i coefficienti di regressione come indicativi di relazioni causali quando il modello è stato progettato per uno scopo predittivo. Ad esempio, in un modello di regressione sviluppato per prevedere la depressione basato su variabili come l’età, il livello di stress e il supporto sociale, i coefficienti associati a ciascuna variabile indicano solo l’importanza relativa di queste variabili nel predire la depressione, non che queste variabili siano cause della depressione. Tuttavia, è frequente che tali coefficienti vengano erroneamente interpretati come prove che un aumento del livello di stress causi un aumento della depressione, senza considerare che potrebbero esserci fattori confondenti non misurati o che il modello stesso non sia stato progettato per testare ipotesi causali.

  2. “Table 2 Fallacy”: L’articolo cita l’errore noto come “Table 2 fallacy”, che si riferisce alla pratica comune di presentare una tabella con coefficienti di regressione stimati da un modello multivariabile come se questi rappresentassero effetti causali. Ad esempio, in un’analisi che esamina il rapporto tra autostima e rendimento accademico, i coefficienti di regressione possono essere interpretati erroneamente come se indicassero l’effetto diretto dell’autostima sul rendimento accademico, ignorando che la relazione potrebbe essere mediata o confusa da altre variabili come il supporto familiare, il contesto scolastico o la motivazione intrinseca.

  3. Errore nella Definizione di “Fattori di Rischio”: Spesso si utilizzano modelli di regressione per identificare “fattori di rischio” per un determinato esito, come ad esempio la depressione o l’ansia. Tuttavia, il termine “fattore di rischio” viene talvolta utilizzato in modo impreciso per indicare sia predittori che possono avere un’associazione statistica con l’esito, sia cause potenziali. Questo porta a interpretazioni errate quando i coefficienti di regressione vengono visti come indicatori di cause effettive piuttosto che come relazioni associative, senza considerare la necessità di ulteriori analisi per stabilire causalità.

  4. Interpretazione Ambigua dell’Indipendenza: Nella pratica, i coefficienti di regressione sono spesso interpretati come effetti “indipendenti” delle variabili predittive sull’esito, assumendo che “controllando per” altre variabili nel modello, il coefficiente di una variabile rappresenti il suo effetto isolato. Tuttavia, questa interpretazione è valida solo se il modello è specificato correttamente e se tutte le variabili confondenti rilevanti sono incluse nel modello. In caso contrario, i coefficienti potrebbero essere distorti da confondenti non misurati o mal specificati, portando a conclusioni errate.

96.1.6 Come Correggere l’Interpretazione Errata dei Coefficienti

  1. Chiarezza dello Scopo dell’Analisi: Prima di costruire e interpretare un modello di regressione, è essenziale definire chiaramente l’obiettivo dell’analisi: è descrittivo, predittivo o causale? Questo aiuta a guidare l’interpretazione corretta dei coefficienti. Se lo scopo è predittivo, l’interesse dovrebbe essere rivolto alla qualità delle previsioni piuttosto che all’interpretazione dei coefficienti.

  2. Comprendere i Limiti della Regressione Multivariata: Anche nei modelli multivariati, dove si tenta di aggiustare per diversi confondenti, è importante riconoscere che i coefficienti rappresentano associazioni condizionate e non necessariamente effetti causali. Questo è particolarmente vero in contesti non sperimentali, dove la randomizzazione manca e la selezione dei confondenti è basata sull’osservazione e non su un controllo sperimentale.

  3. Utilizzo di Metodi di Inferenza Causale: Quando l’obiettivo è comprendere le relazioni causali, è importante utilizzare metodi di inferenza causale, come il controllo dei confondenti attraverso modelli di causalità esplicita (come i DAG, Directed Acyclic Graphs), la randomizzazione o metodi quasi-sperimentali. Questi approcci aiutano a isolare gli effetti causali e a evitare le interpretazioni errate che possono derivare dall’uso ingenuo dei modelli di regressione.

  4. Formazione e Educazione Statistica: È fondamentale educare i ricercatori e gli analisti sull’importanza della corretta interpretazione dei coefficienti di regressione e sull’uso appropriato dei modelli statistici. Questo dovrebbe includere una formazione sulle differenze tra correlazione e causalità, sui limiti dei modelli di regressione e sui metodi alternativi per stabilire relazioni causali.

96.1.7 Conclusione

L’interpretazione errata dei coefficienti di regressione è un problema notevole che può portare a conclusioni fuorvianti e a decisioni errate nella ricerca psicologica. Una chiara comprensione dello scopo dell’analisi, una formazione adeguata e l’uso di metodi appropriati sono essenziali per evitare questi errori e migliorare la validità delle conclusioni derivate dalle analisi statistiche.