Introduzione alla sezione
Nel manuale didattico abbiamo visto come l’inferenza bayesiana possa essere condotta in casi semplici, sfruttando coppie coniugate di distribuzioni o metodi diretti come l’approssimazione su griglia. Questi approcci, utili per comprendere intuitivamente la logica dell’aggiornamento bayesiano, rivelano però i loro limiti con l’aumentare della complessità dei modelli: i calcoli analitici diventano rapidamente impraticabili e l’approccio su griglia soccombe alla maledizione della dimensionalità.
Un’ulteriore difficoltà pratica è che conoscere la forma della distribuzione a posteriori non normalizzata non è sufficiente per fare inferenza. Anche se si riesce a scrivere la funzione proporzionale alla distribuzione a posteriori, è difficile calcolare direttamente quantità come la media, la varianza o gli intervalli di credibilità, perché bisognerebbe integrare analiticamente la distribuzione a posteriori, cosa possibile solo in casi molto semplici. In pratica, dalla sola forma della distribuzione a posteriori si può ricavare al massimo un punto (la moda o la stima MAP), ma non la distribuzione dell’incertezza. I metodi Monte Carlo affrontano proprio questo limite, permettendo di generare campioni dalla distribuzione a posteriori per stimare numericamente qualsiasi quantità di interesse, senza richiedere l’integrazione analitica.
In questa sezione del materiale di approfondimento viene introdotto il linguaggio di programmazione probabilistica Stan, che permette di implementare gli algoritmi MCMC più avanzati. Stan generalizza e perfeziona i principi alla base dell’algoritmo di Metropolis, che abbiamo discusso nel manuale didattico, grazie a tecniche più efficienti, come l’Hamiltonian Monte Carlo. Il materiale supplementare qui presentato illustra esempi concreti, dalla stima di una proporzione al confronto tra gruppi fino ai modelli di Poisson per i dati di conteggio, dimostrando come i metodi MCMC implementati in Stan rendano accessibili analisi che risulterebbero altrimenti intrattabili con gli strumenti analitici tradizionali.
La sezione si conclude con un’introduzione ai modelli gerarchici bayesiani che, estendendo ulteriormente le possibilità inferenziali, permettono di rappresentare strutture di dati multilivello, tipiche della ricerca in psicologia e nelle scienze sociali. Questi modelli non solo esemplificano una delle applicazioni più rilevanti dell’approccio bayesiano moderno, ma dimostrano concretamente come la statistica computazionale possa trasformarsi in uno strumento operativo per affrontare questioni di ricerca psicologica complesse.