Considerazioni Conclusive
L’inferenza bayesiana offre un modo rigoroso e trasparente per integrare conoscenze pregresse e dati empirici nell’analisi psicologica. A differenza degli approcci frequentisti, l’approccio bayesiano ci permette di quantificare l’incertezza e di costruire modelli che riflettono le nostre aspettative a priori. Questa flessibilità è particolarmente utile in psicologia, dove le teorie e le ipotesi giocano un ruolo fondamentale nella guida della ricerca. L’approccio bayesiano rende esplicita la nostra assunzione iniziale e ci permette di valutare l’impatto dei dati sulla nostra comprensione dei fenomeni psicologici.
Limiti dell’Inferenza Frequentista
Nel corso di questa trattazione, abbiamo esaminato i limiti dell’inferenza frequentista, in particolare quando viene impiegata come “filtro” per distinguere i risultati scientifici rilevanti da quelli trascurabili. L’eccessiva dipendenza dai valori-p è stata oggetto di critiche per la sua associazione con inferenze inadeguate; gli effetti possono essere notevolmente sovrastimati, talvolta persino nella direzione errata, quando la stima è vincolata alla significatività statistica in presenza di dati altamente variabili (Loken & Gelman, 2017).
La persistenza e la resistenza del valore-p come indicatore di significatività sono sorprendenti, nonostante le critiche di lunga data e i dibattiti sul suo uso improprio e sulla sua errata interpretazione (Gardner e Altman, 1986; Cohen, 1994; Anderson et al., 2000; Fidler et al., 2004; Finch et al., 2004). Il continuo uso di questa tenacia può offrire spunti su come tali indici, insieme alle euristiche utilizzate per interpretarli (ad esempio, l’assegnazione di soglie come 0.05, 0.01 e 0.001 per determinati livelli di significatività), siano adottati dai ricercatori per ottenere una comprensione intuitiva, sebbene eccessivamente semplificata, della struttura dei loro dati. Inoltre, l’uso di un simile indice risulta particolarmente rilevante in contesti che richiedono decisioni e relative giustificazioni (ad esempio, in ambito medico).
Purtroppo, queste euristiche sono diventate estremamente rigide, e il raggiungimento della significatività si è trasformato in un obiettivo fine a se stesso, piuttosto che in uno strumento per comprendere i dati (Cohen, 1994; Kirk, 1996). Ciò è particolarmente problematico considerando che i valori-p possono essere utilizzati solo per rifiutare l’ipotesi nulla e non per accettarla come vera, poiché un risultato statisticamente non significativo non implica l’assenza di differenze tra gruppi o l’assenza di un effetto di un trattamento (Wagenmakers, 2007; Amrhein et al., 2019).
I fraintendimenti e l’uso improprio dei valori-p, il cosiddetto “p-hacking” (Simmons et al., 2011), hanno incentivato pratiche scientifiche discutibili, contribuendo in modo rilevante alla crisi di riproducibilità nella scienza psicologica (Chambers et al., 2014; Szucs e Ioannidis, 2016).
La Crisi della Replicabilità
La crisi della replicabilità rappresenta una sfida non solo per la ricerca psicologica, ma anche per l’applicazione pratica delle sue teorie. Quando i risultati degli studi non possono essere replicati in contesti diversi, si mette in dubbio la validità e l’affidabilità delle teorie psicologiche su cui si basano gli interventi clinici e le politiche pubbliche. Questo non solo mina la fiducia nella scienza psicologica, ma limita anche la capacità dei professionisti di sviluppare trattamenti efficaci e basati sull’evidenza. Pertanto, è fondamentale che la comunità scientifica adotti pratiche di ricerca rigorose e trasparenti per garantire che le scoperte siano replicabili e applicabili nel mondo reale.
Come uscirne?
L’abbandono dell’inferenza frequentista a favore dei metodi bayesiani, per ragioni quali la maggiore flessibilità, una migliore accuratezza in presenza di dati rumorosi e campioni piccoli, una minore predisposizione agli errori di tipo I, la possibilità di incorporare conoscenze pregresse nell’analisi e la chiarezza e facilità di interpretazione dei risultati (Kruschke, 2010; Kruschke et al., 2012; Etz e Vandekerckhove, 2016; Wagenmakers et al., 2016, 2018; Dienes e Mclatchie, 2018), è una delle strategie proposte per affrontare la crisi della replicabilità nella ricerca psicologica. Tuttavia, sebbene questo cambiamento sia rilevante, non è sufficiente da solo. I problemi più profondi derivano anche da un sistema accademico caratterizzato da incentivi distorti, come la pressione a pubblicare risultati significativi, e dalla riluttanza delle riviste scientifiche a riconoscere e affrontare casi di frode o a ritirare articoli quando necessario.
Una proposta su cui insiste molto McElreath (2020) è quella di passare da un approccio descrittivo della relazione tra variabili — tipico dei modelli lineari e dei modelli lineari generalizzati — a una prospettiva che miri a descrivere formalmente il meccanismo generatore dei dati sottostante al fenomeno in esame. In questo contesto, il ricercatore dovrebbe formulare ipotesi esplicite sul processo che genera i dati e fornire un test quantitativo di tali ipotesi. Questo approccio porta naturalmente alla pratica del confronto tra modelli, un metodo che abbiamo discusso in diversi capitoli di questo testo. Tale confronto può essere effettuato utilizzando tecniche come la validazione incrociata bayesiana Leave-One-Out (LOO), che permette di valutare la robustezza dei modelli e la loro capacità di generalizzare a nuovi dati. Ma si tengano anche a mente i limiti di tale approccio (Navarro, 2019).
Un altro approccio attuale per superare la cosiddetta “junk science” (Calin-Jageman & Caldwell, 2014; Gelman & Weakliem, 2009; Jung et al., 2014), che troppo spesso affligge la psicologia e non solo, è la “rivoluzione causale”. Questo movimento si concentra sul tentativo di comprendere e identificare le relazioni causali in contesti naturali, superando l’arbitrarietà e l’artificialità degli esperimenti di laboratorio tradizionali. La “rivoluzione causale” ha molto in comune con l’approccio di McElreath (2020), poiché anche qui si richiede ai ricercatori di formulare ipotesi causali in maniera esplicita e di confrontare modelli alternativi che rappresentano diverse ipotesi sui rapporti causali. Questo approccio non solo migliora la comprensione dei fenomeni studiati, ma aumenta anche la credibilità e la replicabilità dei risultati scientifici.
Questi cambiamenti prevedono anche una profonda revisione dei metodi didattici e dei programmi dei corsi, in cui si insegna agli studenti come formulare inferenze basate sui dati empirici raccolti in psicologia. Questo tema è stato approfondito da studiosi come Mine Dogucu [Johnson et al. (2022); dogucu2022current; rosenberg2022making; dogucu2021web]. Come dovrebbe ormai essere evidente al lettore, il presente testo ha accettato questa sfida.
Conclusioni
L’approccio bayesiano rappresenta una risorsa fondamentale per l’analisi dei dati psicologici, offrendo strumenti avanzati per gestire l’incertezza, integrare conoscenze pregresse e adattarsi a modelli complessi. La sua capacità di fornire previsioni robuste e aggiornare continuamente le ipotesi alla luce di nuovi dati lo rende particolarmente adatto per esplorare e comprendere la mente umana e il comportamento in tutte le loro sfaccettature.
Tuttavia, per affrontare la crisi della replicabilità e migliorare la qualità della ricerca scientifica in psicologia, non è sufficiente adottare esclusivamente metodi bayesiani. È essenziale combinare questi metodi con altre pratiche rigorose e principi metodologici solidi. Tra queste pratiche, la formalizzazione dei modelli generativi consente di descrivere chiaramente i processi sottostanti che generano i dati, migliorando la trasparenza e la validità delle inferenze. Inoltre, il confronto rigoroso tra modelli, ad esempio tramite tecniche di validazione incrociata, aiuta a determinare quale modello meglio rappresenta i dati e a evitare interpretazioni errate.
Infine, l’adozione di una prospettiva causale esplicita è cruciale per identificare correttamente le relazioni di causa-effetto, evitando l’arbitrarietà e l’artificialità degli esperimenti tradizionali. Solo attraverso un approccio integrato, che combini l’inferenza bayesiana con queste pratiche metodologiche avanzate, sarà possibile progredire verso una scienza psicologica più affidabile e riproducibile, capace di fornire una comprensione più profonda e accurata del comportamento umano.