5 Il teorema di Bayes
“It is, without exaggeration, perhaps the most important single equation in history.”
– Tom Chivers (2024)
Introduzione
Il teorema di Bayes costituisce un metodo matematico ottimale per risolvere problemi di inferenza induttiva, ovvero situazioni in cui si deducono cause sottostanti, principi generali o strutture complesse a partire da dati parziali e incerti. Trova applicazione in scenari disparati: dalla ricostruzione della percezione tridimensionale basata su segnali retinici all’interpretazione degli stati mentali altrui attraverso il comportamento osservabile, fino alla stima di parametri fisici in condizioni sperimentali rumorose (Baker et al., 2011; Ma et al., 2023). La sua efficacia emerge soprattutto in contesti dove le evidenze disponibili non permettono di discriminare univocamente tra ipotesi concorrenti.
Panoramica del capitolo
- L’importanza dell teorema di Bayes.
- l’utilizzo del teorema di Bayes per analizzare e interpretare i test diagnostici, tenendo in considerazione la prevalenza della malattia in questione.
- Soluzione di problemi di probabilità discreta che necessitano dell’applicazione del teorema di Bayes.
5.0.1 Incertezza come fondamento dell’inferenza
Un principio cardine del ragionamento bayesiano è il riconoscimento dell’incertezza intrinseca a qualsiasi processo conoscitivo. Anche in un universo deterministico, la complessità dei sistemi e i limiti dei nostri sensi rendono impossibile una conoscenza completa. Ad esempio, non possiamo determinare con esattezza infiniti dettagli (come posizione e stato di ogni neurone nel cervello di un interlocutore) né accedere direttamente a variabili latenti (come emozioni o intenzioni). Di conseguenza, ogni inferenza conserva un margine probabilistico, che Bayes quantifica e trasforma in uno strumento operativo.
5.0.2 Dinamica bayesiana: aggiornare le credenze
La realtà assomiglia più a una partita di poker che a una di scacchi: operiamo costantemente in condizioni di informazione imperfetta e incompleta. Le decisioni si basano su un bilanciamento dinamico tra conoscenze pregresse (prior) e nuovi indizi (evidenza), un processo formalizzato dall’equazione di Bayes:
\[ P(H \mid E) = \frac{P(E \mid H) \cdot P(H)}{P(E)} , \tag{1} \] dove:
- \(P(H \mid E)\) (probabilità a posteriori): plausibilità rivista dell’ipotesi \(H\) dopo aver osservato l’evidenza \(E\);
- \(P(E \mid H)\) (verosimiglianza): probabilità di osservare \(E\) nell’ipotesi che \(H\) sia vera;
- \(P(H)\) (probabilità a priori): grado di fiducia iniziale in \(H\), prima di raccogliere \(E\);
- \(P(E)\) (probabilità marginale dell’evidenza): fattore di normalizzazione, calcolato tramite il teorema della probabilità totale.
Questo meccanismo consente di ricalibrare razionalmente le convinzioni alla luce di nuove informazioni, riducendo progressivamente l’incertezza attraverso un aggiornamento sequenziale e coerente.
5.0.3 Inferenza induttiva e razionalità adattiva
L’inferenza induttiva bayesiana rappresenta un pilastro della razionalità scientifica e quotidiana. A differenza della logica deduttiva (dove le conclusioni derivano necessariamente dalle premesse), Bayes riconcilia teoria ed evidenza empirica, consentendo previsioni robuste nonostante dati incompleti. Le applicazioni spaziano:
- in psicologia cognitiva, modellando come il cervello interpreta segnali ambigui (Caudek & Bruno, 2024; Domini & Caudek, 2003);
- nell’intelligenza artificiale, guidando algoritmi di apprendimento automatico (Chivers, 2024);
- nelle scienze sociali, per stimare preferenze nascoste da comportamenti osservati.
Il teorema non elimina l’incertezza, ma fornisce un protocollo formale per gestirla, trasformando l’induzione da atto intuitivo a procedura rigorosa. In questo senso, incarna un principio di razionalità adattiva, dove l’ottimalità non richiede onniscienza, bensì un aggiornamento coerente delle credenze in risposta all’esperienza.
5.0.4 Una rivoluzione nel pensiero probabilistico
Per comprendere appieno il teorema di Bayes, è necessario delineare le sue origini storiche. Nel XVIII secolo, Thomas Bayes (1701-1761), ecclesiastico presbiteriano e matematico britannico, pose le basi di una rivoluzione concettuale nel campo della probabilità e della statistica. Il suo contributo teorico, passato alla storia come teorema di Bayes, ha plasmato in modo decisivo lo sviluppo scientifico e tecnologico dei secoli successivi, influenzando discipline che spaziano dalla medicina all’intelligenza artificiale (Chivers, 2024).
5.0.4.1 La figura di Thomas Bayes
Bayes proveniva da una famiglia benestante e studiò teologia a Edimburgo, preparandosi al ministero religioso. Come ricorda il biografo David Bellhouse, Bayes non era un accademico nel senso moderno del termine, ma un erudito libero, interessato alla conoscenza per passione personale (Bellhouse, 2004).
Durante la sua vita, Bayes pubblicò due testi:
-
un trattato di teologia: Divine Benevolence: Or, an Attempt to Prove that the Principal End of the Divine Providence and Government is the Happiness of His Creatures (1731), una teodicea che cerca di spiegare come la legge naturale possa ottimizzare il benessere universale;
- una difesa del calcolo infinitesimale: An Introduction to the Doctrine of Fluxions (1736), in risposta alle critiche di George Berkeley sugli infinitesimi e i concetti fondamentali del calcolo newtoniano (Jesseph, 1993).
Il lavoro che segnò la svolta nella teoria della probabilità fu però pubblicato postumo, nel 1763, sulle Philosophical Transactions of the Royal Society: An Essay towards Solving a Problem in the Doctrine of Chances. Per la prima volta, si formalizzava un metodo per aggiornare le ipotesi probabilistiche alla luce di nuove evidenze, ponendo le fondamenta dell’inferenza bayesiana (Stigler, 1990).
5.0.4.2 Bayes e il ruolo culturale della scienza
Come sottolinea ancora Bellhouse, nel XVIII secolo era comune, tra le élite colte, dedicarsi allo studio di discipline scientifiche per prestigio sociale. Per Bayes, la matematica era dunque una passione coltivata con spirito libero. Il suo merito straordinario fu di spingere l’interpretazione della probabilità verso una prospettiva epistemologica innovativa, dove la probabilità diventa espressione quantitativa della nostra ignoranza sul mondo.
In contrapposizione alla visione “classica”, che vedeva la probabilità come frequenza osservabile in eventi ripetuti, Bayes propose che essa potesse rappresentare il grado di fiducia di un osservatore, inevitabilmente influenzato da conoscenze pregresse e da pregiudizi individuali. In questo senso, la probabilità assume un carattere dinamico e soggettivo, configurandosi come uno strumento di conoscenza che si aggiorna di continuo al variare dei dati (Spiegelhalter, 2019).
5.0.4.3 Un esperimento mentale illuminante
Per illustrare la sua idea, Bayes propose un semplice esempio: immagina di lanciare alcune palline su un tavolo da biliardo. Dopo aver segnato con una linea il punto in cui si ferma una pallina bianca (e averla poi rimossa), si lanciano altre palline rosse e si conta quante cadono a destra e quante a sinistra di quella linea. Sulla base di queste osservazioni, come si può “indovinare” la posizione della linea? E con quale probabilità la prossima pallina rossa cadrà a sinistra di essa?
La soluzione di Bayes combina i dati osservati (numero di palline cadute a sinistra o a destra) con le convinzioni iniziali dell’osservatore (il cosiddetto “prior”), delineando un processo di apprendimento graduale che guida la revisione critica delle ipotesi.
5.0.4.4 Il ruolo di Richard Price
Dopo la morte di Bayes, fu un altro ecclesiastico, Richard Price (1723-1791), a dare impulso alla diffusione del saggio bayesiano. Price aveva un’ottima reputazione negli ambienti intellettuali dell’epoca, grazie anche alle sue relazioni con figure di spicco come Benjamin Franklin, Thomas Jefferson e John Adams.
Price prese in carico il manoscritto di Bayes, lo sottopose al fisico John Canton e ne curò la pubblicazione postuma, operando modifiche significative. Rispetto alla versione originale di Bayes, concentrata quasi esclusivamente sugli aspetti teorici, Price aggiunse una parte dedicata alle applicazioni pratiche, rendendo il testo più fruibile a un pubblico più ampio. Per questo motivo, lo storico Stephen Stigler lo definisce «il primo bayesiano della storia».
5.0.4.5 Dal silenzio alla riscoperta
Per oltre cinquant’anni, il lavoro di Bayes rimase in ombra, oscurato dall’opera pionieristica di Pierre-Simon Laplace. Già nel 1774, Laplace pervenne indipendentemente a principi analoghi, e successivamente li sistematizzò nella monumentale Théorie analytique des probabilités (1812). Solo in tempi più recenti, con l’avvento dei metodi di calcolo moderno e dell’informatica, la statura del teorema di Bayes è emersa in tutta la sua importanza.
Oggi, il teorema di Bayes è considerato un cardine della statistica moderna: formalizza il modo in cui aggiorniamo le nostre credenze alla luce di nuovi dati. Questo schema è cruciale in ogni disciplina scientifica e tecnologica che debba fare i conti con incertezza e dati incompleti. Dalla genomica all’econometria, dalla fisica delle particelle alle scienze cognitive, il paradigma bayesiano risulta prezioso per gestire e interpretare informazioni in continuo aggiornamento.
5.0.4.6 L’eredità di Bayes nell’era digitale
Nell’intelligenza artificiale, le idee bayesiane sono alla base di sistemi di apprendimento automatico e modelli probabilistici complessi. Strumenti come i moderni modelli linguistici (ad esempio ChatGPT e Claude) sfruttano strategie di inferenza bayesiana – anche se in forme estremamente avanzate – per generare risposte, fare previsioni e adattarsi costantemente agli input degli utenti.
La parabola storica di questo teorema, nato dalle speculazioni di un pastore presbiteriano del Settecento, mostra chiaramente il potenziale trasformativo delle idee matematiche. Come sottolinea Tom Chivers nel suo Everything Is Predictable: How Bayesian Statistics Explain Our World, la statistica bayesiana è diventata una sorta di “grammatica universale” per interpretare la realtà, permettendoci di affrontare con metodo situazioni complesse, modellare l’incertezza e formulare previsioni in contesti dove l’informazione è inevitabilmente limitata (Chivers, 2024).
In sintesi, la forza del teorema di Bayes non risiede soltanto nella sua eleganza formale, ma soprattutto nella sua portata epistemologica: esso traduce in termini matematici la nostra naturale tendenza ad apprendere da ciò che osserviamo e a rivedere continuamente ciò che crediamo. Per questo rimane, ancora oggi, un punto di riferimento fondamentale in qualunque disciplina che affronti il problema della conoscenza in condizioni di incertezza.
5.1 La regola di Bayes e l’inferenza probabilistica
L’inferenza bayesiana utilizza un principio centrale della teoria delle probabilità noto come regola di Bayes. Questo principio consente di aggiornare in modo razionale le nostre credenze sulla base di nuovi dati osservati, integrandoli con conoscenze pregresse.
5.1.1 Derivazione della regola di Bayes
Consideriamo due eventi \(A\) e \(B\). La probabilità congiunta \(P(A \cap B)\), ovvero la probabilità che entrambi gli eventi si verifichino, può essere espressa in due modi equivalenti:
Applicando la regola della catena (o teorema del prodotto): \[ P(A \cap B) = P(A \mid B) \cdot P(B). \] In questa formulazione, \(P(A \mid B)\) rappresenta la probabilità di \(A\) condizionata al verificarsi di \(B\), mentre \(P(B)\) è la probabilità marginale di \(B\).
Sfruttando la simmetria della probabilità congiunta: \[ P(A \cap B) = P(B \mid A) \cdot P(A). \] Qui, \(P(B \mid A)\) è la probabilità di \(B\) dato \(A\), e \(P(A)\) è la probabilità marginale di \(A\).
Uguagliando le due espressioni: \[ P(A \mid B) \cdot P(B) = P(B \mid A) \cdot P(A). \]
Isolando \(P(B \mid A)\) si ottiene la regola di Bayes: \[ P(B \mid A) = \frac{P(A \mid B) \cdot P(B)}{P(A)}. \tag{5.1}\] Questa relazione fondamentale permette di “invertire” le probabilità condizionate, aggiornando la credenza nell’evento \(B\) dopo aver osservato \(A\).
5.1.2 Interpretazione dei termini della regola di Bayes
La regola di Bayes fornisce un framework formale per aggiornare la credenza in un’ipotesi \(B\) dopo l’osservazione di un’evidenza \(A\). I suoi componenti chiave sono:
\(P(B)\) (probabilità a priori): rappresenta la probabilità iniziale assegnata all’ipotesi \(B\) prima di considerare l’evidenza \(A\). Riflette la conoscenza pregressa o le aspettative basate sul contesto.
\(P(A \mid B)\) (verosimiglianza): esprime la probabilità di osservare l’evidenza \(A\) nell’ipotesi che \(B\) sia vero. Quantifica la compatibilità tra l’evidenza e l’ipotesi.
\(P(B \mid A)\) (probabilità a posteriori): corrisponde alla probabilità rivista dell’ipotesi \(B\) dopo aver considerato l’evidenza \(A\). Rappresenta l’aggiornamento bayesiano delle credenze.
\(P(A)\) (probabilità marginale dell’evidenza): agisce come fattore di normalizzazione, calcolato integrando o sommando su tutte le possibili ipotesi che potrebbero generare \(A\). Garantisce che la probabilità a posteriori sia coerente e normalizzata.
In sintesi, la regola di Bayes trasforma una probabilità a priori in una probabilità a posteriori, ponderando la verosimiglianza dell’evidenza osservata e normalizzando per l’evidenza complessiva.
5.1.3 Applicazioni della regola di Bayes
Nella pratica, l’aggiornamento bayesiano si articola attraverso i seguenti passi fondamentali:
Definizione dello spazio delle ipotesi: Si identifica l’insieme \(\mathcal{H}\) di tutte le ipotesi, modelli o spiegazioni plausibili che potrebbero aver generato i dati osservati \(D\). Questo spazio può essere discreto (es.: un insieme finito di modelli) o continuo (es.: un intervallo di valori per un parametro).
Specificazione dei priori: Ad ogni ipotesi \(H \in \mathcal{H}\) viene assegnata una probabilità a priori \(P(H)\). Questa quantifica il nostro grado di fiducia in \(H\) prima di osservare i dati \(D\), basandosi su conoscenza pregressa, letteratura scientifica o esperienza soggettiva.
-
Aggiornamento bayesiano: Osservati i dati \(D\), le probabilità a priori vengono aggiornate calcolando le probabilità a posteriori \(P(H \mid D)\) utilizzando il teorema di Bayes:
\[ P(H \mid D) = \frac{P(D \mid H) \, P(H)}{P(D)} \tag{5.2}\] dove:
- \(P(D \mid H)\) è la funzione di verosimiglianza (likelihood). Essa rappresenta la probabilità (o densità di probabilità) di osservare i dati \(D\) sotto l’ipotesi \(H\).
- \(P(H)\) è la probabilità a priori, come definita sopra.
- \(P(D)\) è la probabilità marginale dei dati o evidenza. Questo termine funziona da costante di normalizzazione, assicurando che le probabilità a posteriori sommino (o integrino) a 1.
-
Calcolo dell’evidenza (\(P(D)\)): La probabilità marginale viene calcolata considerando tutte le possibili ipotesi nello spazio \(\mathcal{H}\):
- Caso discreto (somma su tutte le ipotesi): \[ P(D) = \sum_{H' \in \mathcal{H}} P(D \mid H')\, P(H') \]
- Caso continuo (integrale su tutto lo spazio delle ipotesi): \[ P(D) = \int_{\mathcal{H}} P(D \mid H')\, P(H') \, dH' \]
Il risultato di questo processo è la distribuzione a posteriori \(P(H \mid D)\), che sintetizza in modo probabilistico tutto ciò che sappiamo su tutte le ipotesi considerate, dopo aver tenuto conto sia della nostra conoscenza iniziale (il priori) che delle nuove osservazioni (la verosimiglianza).
5.1.3.1 Un processo iterativo e dinamico
È cruciale sottolineare che l’inferenza bayesiana non è un procedimento statico che conduce a una verità finale. Al contrario, è un ciclo iterativo e perpetuo di apprendimento. La distribuzione a posteriori ottenuta (\(P(H \mid D)\)) diventa, a sua volta, la nuova distribuzione a priori per il successivo round di inferenza non appena diventano disponibili nuovi dati (\(D'\)):
\[ P(H \mid D, D') = \frac{P(D' \mid H, D) \, P(H \mid D)}{P(D' \mid D)} \] Questo processo di aggiornamento sequenziale riflette l’essenza stessa del metodo scientifico: le nostre credenze si evolvono e si affinano in modo dinamico, diventando sempre più informate man mano che accumuliamo evidenze. Non si giunge mai a un “punto di arrivo” assoluto, ma a uno stato di conoscenza sempre provvisorio e migliorabile, pronto a essere aggiornato dalla prossima osservazione.
5.1.3.2 Considerazioni pratiche
Nelle applicazioni reali, il calcolo diretto della probabilità marginale \(P(D)\) (o evidenza) rappresenta spesso la sfida computazionale principale. Questo termine, che nell’esempio del messaggio corrisponde alla probabilità di osservare quello specifico pattern di notifiche indipendentemente dalla sorgente, richiede di valutare tutte le possibili ipotesi.
Quando lo spazio delle ipotesi è vasto, discreto e complesso o continuo ad alta dimensionalità, il calcolo esatto dell’integrale (o della somma) diventa proibitivo o analiticamente intrattabile.
Per superare questo ostacolo, si ricorre a sofisticati metodi numerici approssimati:
- Metodi Monte Carlo Markov Chain (MCMC): Tecniche di campionamento che permettono di stimare la distribuzione a posteriori generando un campione rappresentativo delle ipotesi, senza dover calcolare \(P(D)\) direttamente.
- Inferenza Variazionale (VI): Un approccio alternativo che trasforma il problema di integrazione in un problema di ottimizzazione, approssimando la vera distribuzione a posteriori con una famiglia di distribuzioni più semplice da calcolare.
Queste tecniche permettono di applicare l’inferenza bayesiana in scenari complessi e realistici—dall’apprendimento automatico all’analisi genomica—rendendo fattibile l’aggiornamento delle credenze laddove un calcolo esatto sarebbe impossibile.
In sintesi, la regola di Bayes fornisce uno schema formale e razionale per integrare sistematicamente il know-how pregresso (il prior) con l’evidenza empirica (i dati). La sua potenza risiede proprio in questa capacità di quantificare dinamicamente l’incertezza e di aggiornare coerentemente il nostro stato di conoscenza. È questa caratteristica a renderla il fondamento del ragionamento probabilistico moderno e uno strumento indispensabile in una vastissima gamma di discipline scientifiche e ingegneristiche.
5.1.4 Applicazioni in psicologia
Negli ultimi anni, i modelli bayesiani hanno acquisito un ruolo centrale nello studio della cognizione umana, fornendo una struttura formale per comprendere come il cervello costruisca rappresentazioni del mondo e prenda decisioni sulla base di dati incerti. Come discusso da Griffiths et al. (2024), questi modelli sono stati applicati a una vasta gamma di processi cognitivi, tra cui:
- Apprendimento e generalizzazione: i modelli bayesiani descrivono come gli individui apprendano nuove categorie e concetti sulla base di dati limitati e rumorosi (Tenenbaum, Griffiths, & Kemp, 2006).
- Percezione e interpretazione sensoriale: la percezione visiva e il riconoscimento di oggetti possono essere spiegati come un’inferenza bayesiana sulla base di segnali sensoriali ambigui (Domini & Caudek, 2003; Yuille & Kersten, 2006).
- Controllo motorio: il sistema motorio umano sembra ottimizzare i movimenti attraverso una combinazione di modelli interni e aggiornamenti bayesiani (Kording & Wolpert, 2006).
- Memoria e recupero delle informazioni: i processi mnemonici, come il richiamo della memoria semantica, possono essere modellati come inferenze bayesiane basate su conoscenze pregresse (Steyvers, Griffiths, & Dennis, 2006).
- Acquisizione del linguaggio: l’apprendimento del linguaggio nei bambini può essere descritto attraverso processi probabilistici che permettono di inferire le strutture grammaticali sulla base di dati linguistici limitati (Chater & Manning, 2006; Xu & Tenenbaum, in press).
- Apprendimento causale: la capacità di inferire relazioni causali dagli eventi osservati è coerente con un modello bayesiano, in cui la mente valuta la probabilità di una relazione causale sulla base dell’evidenza disponibile (Griffiths & Tenenbaum, 2005, 2007).
- Ragionamento e decisione: il ragionamento simbolico e il processo decisionale possono essere formalizzati come un aggiornamento bayesiano delle credenze sulla base di nuove informazioni (Oaksford & Chater, 2001).
- Cognizione sociale: le inferenze sulle intenzioni e credenze altrui possono essere modellate attraverso processi bayesiani, permettendo di spiegare come le persone comprendano il comportamento altrui (Baker, Tenenbaum, & Saxe, 2007).
5.1.4.1 L’inferenza bayesiana nella cognizione umana
Un tema centrale che emerge da questi programmi di ricerca è la seguente domanda: come fa la mente umana ad andare oltre i dati dell’esperienza? In altre parole, come riesce il cervello a costruire modelli complessi del mondo a partire da informazioni limitate e spesso ambigue?
L’approccio bayesiano propone che il cervello utilizzi un processo di inferenza probabilistica per aggiornare continuamente le proprie credenze, combinando informazioni pregresse con nuove osservazioni per affinare le proprie rappresentazioni mentali. Questo meccanismo consente di spiegare molte delle capacità cognitive umane, dall’apprendimento rapido di nuove categorie alla capacità di adattarsi a un ambiente mutevole, fino alla formulazione di inferenze sociali e alla presa di decisioni in condizioni di incertezza.
L’adozione dei modelli bayesiani nella psicologia cognitiva ha portato a una nuova comprensione della mente come sistema predittivo, in grado di formulare ipotesi probabilistiche sugli eventi futuri e di correggerle dinamicamente sulla base dell’esperienza. Questo approccio ha profonde implicazioni per lo studio del comportamento umano e per lo sviluppo di nuove tecniche di modellizzazione nei campi della psicologia, delle neuroscienze e dell’intelligenza artificiale.
5.2 Test medici
Uno degli esempi più comuni per comprendere il teorema di Bayes riguarda i test diagnostici.
In un secondo esempio, vogliamo valutare l’affidabilità di un test per l’HIV e capire come la nostra stima di infezione cambia dopo due test consecutivi positivi. Utilizzeremo la regola di Bayes per aggiornare la probabilità di avere l’HIV man mano che otteniamo nuovi risultati.
5.3 La fallacia del procuratore
Il teorema di Bayes non trova applicazione solo in campo medico, ma è essenziale anche nei procedimenti giudiziari. Infatti, fraintendimenti nell’interpretazione di probabilità e statistiche possono portare a gravi errori di giudizio. Uno degli errori più comuni in questo contesto è la fallacia del procuratore.
5.4 La probabilità inversa
Gli esempi precedenti illustrano due domande probabilistiche fondamentalmente diverse, che distinguono l’approccio classico (frequentista) da quello bayesiano.
La probabilità diretta risponde a domande come: “Supposto che un’ipotesi sia vera, qual è la probabilità di osservare questi dati?”. Questo è il tipico ambito della statistica frequentista, che calcola la probabilità di risultati sotto ipotesi fissate.
La probabilità inversa, invece, capovolge completamente questa prospettiva, chiedendo: “Alla luce dei dati osservati, qual è la probabilità che un’ipotesi sia vera?”. Questa domanda, che riguarda direttamente la credibilità delle ipotesi date le evidenze, è al centro dell’approccio bayesiano.
5.4.1 Il problema fondamentale: da \(P(D \mid H)\) a \(P(H \mid D)\)
Consideriamo il lancio di una moneta. La probabilità diretta ci chiede: se la moneta è equa (\(P(\text{Testa})\) = 0.5), qual è la probabilità di osservare zero teste in cinque lanci? Calcoliamo \(P(D \mid H) = (0.5)^5 = 0.03125\).
La probabilità inversa affronta la questione opposta: dopo aver osservato zero teste in cinque lanci, quanto è probabile che la moneta sia effettivamente equa? Questa domanda cerca \(P(H \mid D)\), non \(P(D \mid H)\).
In questo contesto emerge il contributo fondamentale di Thomas Bayes, che ha riconosciuto come, per rispondere alla seconda domanda - l’unica rilevante dal punto di vista scientifico nella maggior parte dei contesti reali - non sia sufficiente la verosimiglianza \(P(D \mid H)\). È necessario combinarla con una probabilità a priori, \(P(H)\), che esprime la nostra convinzione iniziale sull’ipotesi prima di osservare i dati.
5.4.2 La rivoluzione bayesiana: dall’ipotesi ai dati, e ritorno
Prima di Bayes, la probabilità si occupava principalmente del calcolo diretto P(D|H). La geniale intuizione di Bayes fu di invertire la prospettiva, mostrando come fosse possibile ritornare dall’osservazione dei dati alla valutazione delle ipotesi che li avevano generati.
Questa inversione concettuale ha reso possibile l’inferenza bayesiana, fornendo uno strumento formale per aggiornare sistematicamente le nostre credenze alla luce di nuove evidenze. Il teorema di Bayes permette infatti di combinare rigorosamente:
- la verosimiglianza dei dati sotto l’ipotesi [\(P(D \mid H)\)];
- la nostra conoscenza pregressa [\(P(H)\)]
per ottenere la probabilità a posteriori [\(P(H \mid D)\)], ovvero la nostra convinzione aggiornata.
5.4.3 L’importanza epistemologica della probabilità inversa
La capacità di calcolare \(P(H \mid D)\) invece che solo \(P(D \mid H)\) ha profonde implicazioni in quasi tutti i campi del sapere:
In ambito scientifico, permette di quantificare direttamente quanto i dati supportino un’ipotesi rispetto ad altre, superando la logica del puro rifiuto/accettazione di ipotesi.
In ambito medico, consente di rispondere alla domanda clinicamente rilevante: “Data una positività del test, qual è la probabilità che il paziente abbia realmente la malattia?” anziché limitarsi a “Data la malattia, qual è la probabilità di un test positivo?”.
Nel sistema giudiziario, aiuta a valutare la domanda “Data l’evidenza forense, qual è la probabilità che l’imputato sia colpevole?” piuttosto che limitarsi a “Data la colpevolezza, qual è la probabilità di trovare questa evidenza?”.
Senza il concetto di probabilità inversa, infatti, rimarremmo intrappolati in un paradosso epistemologico: potremmo calcolare la probabilità dei dati sotto varie ipotesi, ma non potremmo mai stabilire quale ipotesi sia più credibile alla luce dei dati osservati. Il teorema di Bayes fornisce questo ponte logico che collega razionalmente l’evidenza empirica alla valutazione delle ipotesi, rendendo possibile un ragionamento probabilistico scientificamente fondato.
Riflessioni conclusive
In questo capitolo abbiamo esplorato vari esempi, principalmente nel campo medico e forense, per illustrare come il teorema di Bayes permetta di combinare le informazioni derivate dalle osservazioni con le conoscenze precedenti (priori), aggiornando così il nostro grado di convinzione rispetto a un’ipotesi. Il teorema di Bayes fornisce un meccanismo razionale, noto come “aggiornamento bayesiano”, che ci consente di ricalibrare le nostre convinzioni iniziali alla luce di nuove evidenze.
La lezione fondamentale che emerge, tanto nella ricerca scientifica quanto nella vita quotidiana, è che raramente ci interessa soltanto la probabilità di osservare un dato presupposta vera un’ipotesi, \(P(D \mid H)\). Ciò che realmente conta è spesso la probabilità inversa: stabilire quanto un’ipotesi sia credibile dato ciò che abbiamo osservato, \(P(H \mid D)\). La potenza del teorema di Bayes risiede proprio nella sua capacità di affrontare direttamente questo problema inverso, permettendoci di dedurre la plausibilità delle ipotesi a partire dalle osservazioni empiriche.
Il framework bayesiano offre così un approccio generale per comprendere come i problemi induttivi possano essere affrontati razionalmente, e fornisce anche un modello plausibile per interpretare come la mente umana elabori l’incertezza e aggiorni le proprie credenze.
In questo capitolo ci siamo concentrati su applicazioni che utilizzano probabilità puntuali, per rendere i concetti più accessibili. Tuttavia, il teorema di Bayes esprime pienamente il suo potenziale quando sia l’evidenza che i gradi di incertezza iniziali vengono rappresentati attraverso distribuzioni di probabilità continue. Questo approccio più generale e potente, che consente di modellare situazioni realistiche in tutta la loro complessità, sarà l’argomento centrale della prossima sezione della dispensa, dove approfondiremo il flusso di lavoro bayesiano completo e l’uso di distribuzioni continue nell’aggiornamento probabilistico.
Esercizi
È facile trovare online esercizi sull’applicazione del teorema di Bayes. Ad esempio, consiglio gli esercizi 1–6 disponibili sulla seguente pagina web.