[[16]{.chapter-number}  [Conclusioni: dal linguaggio della probabilità all&amp;#039;inferenza bayesiana]{.chapter-title}]{#sec-conclusioni .quarto-section-identifier}

16 Conclusioni: dal linguaggio della probabilità all’inferenza bayesiana

Il percorso compiuto

Questo modulo ha costruito, passo dopo passo, il vocabolario concettuale e gli strumenti formali necessari per ragionare in modo rigoroso in condizioni di incertezza.

Siamo partiti da una domanda fondamentale: come possiamo rappresentare e aggiornare le nostre credenze alla luce dell’evidenza? La risposta bayesiana a questa domanda richiede un linguaggio preciso, ovvero il linguaggio della probabilità, e strumenti matematici per manipolarlo in modo coerente.

Il percorso si è articolato nelle seguenti tappe:

L’interpretazione bayesiana della probabilità ha stabilito che le probabilità rappresentano gradi di credenza razionale, non frequenze ipotetiche. Gli assiomi di Kolmogorov garantiscono la coerenza interna di queste credenze, evitando contraddizioni logiche.
Le variabili casuali e le distribuzioni hanno fornito il linguaggio per descrivere quantità incerte. Abbiamo imparato a distinguere tra variabili discrete e continue, a caratterizzarle mediante funzioni di massa e densità, e a sintetizzarle attraverso momenti come il valore atteso e la varianza.
La covarianza e la correlazione hanno esteso questo linguaggio alle situazioni multivariate, permettendoci di descrivere come le incertezze su diverse quantità siano legate tra loro.
Le famiglie parametriche di distribuzioni, ovvero la distribuzione di Bernoulli, la distribuzione binomiale, la distribuzione di Poisson, la distribuzione normale, la distribuzione beta e la distribuzione gamma, hanno costituito un vocabolario standardizzato per esprimere credenze in forme matematicamente trattabili e clinicamente interpretabili.
La verosimiglianza ha completato il quadro, formalizzando il modo in cui i dati osservati aggiornano le nostre credenze sui parametri. Abbiamo visto come essa si combini con la distribuzione a priori per generare la distribuzione a posteriori, e come le proprietà fondamentali della media campionaria, come la sua centratura, la precisione crescente con la numerosità e la convergenza, si riflettano direttamente nel comportamento dell’inferenza bayesiana.

I tre elementi fondamentali dell’inferenza bayesiana

Al termine di questo percorso, disponete degli strumenti concettuali per comprendere e impiegare i tre elementi costitutivi dell’inferenza bayesiana:

\[ \underbrace{p(\theta \mid \text{dati})}_{\text{a posteriori}} \propto \underbrace{p(\text{dati} \mid \theta)}_{\text{verosimiglianza}} \times \underbrace{p(\theta)}_{\text{a priori}} \]

La distribuzione a priori formalizza le credenze iniziali sul parametro, prima di osservare i dati. Sapete ora come scegliere famiglie parametriche appropriate (ad esempio, Beta per proporzioni, Gamma per tassi, Normale per quantità non vincolate) e come i loro parametri traducono in forma matematica il vostro stato di conoscenza iniziale.

La verosimiglianza quantifica quanto ciascun valore possibile del parametro renda plausibili i dati osservati. Comprendete perché questa funzione si concentra attorno a valori particolari, perché diventi più “stretta” (informativa) all’aumentare dei dati, e come la Legge dei Grandi Numeri e il Teorema del Limite Centrale ne descrivano il comportamento asintotico.

La distribuzione a posteriori sintetizza tutto ciò che sappiamo dopo aver osservato i dati. Sapete interpretarla come distribuzione aggiornata delle credenze, calcolare da essa intervalli di credibilità e comprendere perché ricercatori con conoscenze iniziali differenti convergano verso conclusioni simili quando l’evidenza empirica diventa sufficientemente ricca.

Verso il manuale principale

Il manuale Inferenza bayesiana in psicologia: Ragionare con l’incertezza costruisce su queste fondamenta per affrontare problemi di complessità crescente e di diretta rilevanza per la ricerca psicologica.

Modelli bayesiani applicati: I concetti di prior, verosimiglianza e posterior saranno applicati concretamente a modelli di regressione, ANOVA bayesiana, modelli per dati categoriali e analisi di mediazione e moderazione.

Modelli gerarchici: La struttura dell’aggiornamento bayesiano si estende naturalmente a modelli multilivello, in cui i parametri a livello individuale sono a loro volta descritti da distribuzioni a livello di popolazione. Questo approccio è particolarmente adatto ai dati psicologici, che presentano tipicamente variabilità strutturata tra soggetti, item e contesti di misurazione.

Metodi computazionali: Quando le soluzioni analitiche non sono disponibili, metodi come Markov Chain Monte Carlo (MCMC) e Hamiltonian Monte Carlo (HMC) consentono di esplorare distribuzioni a posteriori di forma arbitraria. Il linguaggio Stan offrirà lo strumento pratico per implementare questi metodi in modo efficiente e validato.

Confronto di modelli: Strumenti come il fattore di Bayes e i criteri di informazione permetteranno di confrontare modelli alternativi, quantificando l’evidenza relativa a favore di diverse ipotesi teoriche, a completamento di un’inferenza basata sulla stima dei parametri.

Un messaggio finale

La statistica bayesiana non è semplicemente una collezione di tecniche alternative a quelle frequentiste. Essa rappresenta un modo di pensare all’incertezza che rispecchia il ragionamento scientifico stesso: partiamo da ciò che già sappiamo, raccogliamo nuova evidenza, e aggiorniamo in modo logicamente coerente le nostre credenze.

I concetti sviluppati in questo modulo, ovvero la probabilità come grado di credenza, le distribuzioni come rappresentazione dell’incertezza, la verosimiglianza come ponte tra dati e parametri, non sono prerequisiti da archiviare. Essi costituiscono il fondamento concettuale su cui poggia ogni analisi bayesiana, dalla più elementare alla più sofisticata.

Quando, nel manuale principale, incontrerete una distribuzione a posteriori complessa o un modello gerarchico articolato, la logica sottostante rimarrà invariata: prior × verosimiglianza → posterior. La complessità risiederà nella specificazione del modello e nella sua struttura, non nel principio fondamentale che lo governa.

Con questi strumenti concettuali, siete ora pronti per affrontare l’inferenza bayesiana applicata ai problemi concreti della ricerca psicologica.