30 Il teorema di Bayes
- capire in profondità il teorema di Bayes e la sua importanza;
- utilizzare il teorema di Bayes per analizzare e interpretare i test diagnostici, tenendo in considerazione la prevalenza della malattia in questione;
- affrontare e risolvere problemi di probabilità discreta che necessitano dell’applicazione del teorema di Bayes.
- Leggere Everything is Predictable: How Bayesian Statistics Explain Our World (Chivers, 2024). Questo libro offre una descrizione chiara e accessibile dell’impatto che il teorema di Bayes ha avuto sulla vita moderna.
- Leggere Bayesian Models of Cognition di Thomas L. Griffiths, una voce della Open Encyclopedia of Cognitive Science.
- Leggere il capitolo Conditional Probability (Schervish & DeGroot, 2014).
“It is, without exaggeration, perhaps the most important single equation in history.”
— Tom Chivers (2024)
30.1 Introduzione
Il teorema di Bayes offre una soluzione ottimale ai problemi induttivi, che spaziano dall’identificazione della struttura tridimensionale del mondo basata su dati sensoriali limitati (Caudek & Bruno, 2024; Domini & Caudek, 2003; Ma et al., 2023), all’inferenza dei pensieri altrui a partire dal loro comportamento (Baker et al., 2011). Questa regola si rivela particolarmente utile in situazioni in cui i dati osservati sono insufficienti per distinguere in modo definitivo tra diverse ipotesi.
Nonostante ciò, tutte le previsioni basate su questo metodo mantengono un certo grado di incertezza. Anche se l’universo fosse completamente deterministico, la nostra conoscenza di esso rimarrebbe imperfetta: non possiamo conoscere la posizione e lo stato di ogni singola particella che lo compone. Le informazioni a nostra disposizione sono inevitabilmente parziali e imprecise, ottenute attraverso i nostri sensi limitati.
La vita reale non è paragonabile a una partita di scacchi, un gioco con informazioni perfette che può essere “risolto” in linea di principio. Assomiglia piuttosto al poker, dove le decisioni vengono prese utilizzando le informazioni limitate a disposizione dei giocatori (Chivers, 2024). Questo capitolo si concentra sull’equazione che ci permette di fare proprio questo: il teorema di Bayes. Esso descrive come modifichiamo le nostre convinzioni riguardo a un’ipotesi in una situazione in cui i dati disponibili non consentono una decisione certa.
Questo processo è noto come inferenza induttiva, che ci permette di trarre conclusioni generali da dati specifici e limitati. Il teorema di Bayes fornisce quindi un framework matematico per aggiornare le nostre credenze alla luce di nuove evidenze, permettendoci di prendere decisioni informate in un mondo caratterizzato dall’incertezza.
30.2 Una Rivoluzione nel Pensiero Probabilistico
Nel cuore del XVIII secolo, un ecclesiastico presbiteriano di nome Thomas Bayes pose le fondamenta per una delle più importanti rivoluzioni nel campo della statistica e del calcolo delle probabilità. Il suo contributo, noto oggi come teorema di Bayes, non solo trasformò radicalmente l’interpretazione della probabilità, ma continua a influenzare profondamente la scienza moderna, la tecnologia e persino l’intelligenza artificiale (Chivers, 2024).
Nato in una famiglia benestante, Thomas Bayes ricevette un’educazione raffinata, studiando teologia a Edimburgo per prepararsi alla vita da ecclesiastico. Come sottolinea il biografo David Bellhouse, Bayes “non incarnava l’archetipo dell’accademico moderno. Era piuttosto un erudito, un libero pensatore: perseguiva il sapere per il proprio piacere personale, non per seguire un rigido programma di ricerca.”
Bayes pubblicò due opere principali durante la sua vita:
- Un trattato teologico, Divine Benevolence: Or, an Attempt to Prove that the Principal End of the Divine Providence and Government is the Happiness of His Creatures (1731), in cui argomentò una teodicea basata sull’ottimizzazione del benessere universale attraverso le leggi naturali (Bellhouse, 2004).
- Un’apologia del calcolo newtoniano, An Introduction to the Doctrine of Fluxions* (1736), difesa metodologica contro le critiche di George Berkeley ai fondamenti degli infinitesimi, allora ritenuti logicamente inconsistenti (Jesseph, 1993).
Tuttavia, fu il suo lavoro postumo, An Essay towards Solving a Problem in the Doctrine of Chances (1763), pubblicato nelle Philosophical Transactions of the Royal Society, a cambiare per sempre il corso della teoria della probabilità. Questo lavoro formalizzò per la prima volta un metodo per aggiornare probabilisticamente ipotesi alla luce di dati empirici, ponendo le basi per l’inferenza bayesiana (Stigler, 1990).
Come evidenziato dallo storico David Bellhouse, l’interesse di Bayes per la matematica era emblematico del ruolo culturale della scienza tra le élite colte nel XVIII secolo: “Per i ricchi del tempo, impegnarsi in discipline scientifiche era un segno di status, analogo all’odierna passione per attività come gli sport esclusivi” (Bellhouse, 2004).
Il contributo rivoluzionario dell’approccio bayesiano non risiede tanto nella sua formulazione matematica quanto nella sua portata epistemologica. Come sottolinea David Spiegelhalter, statistico di fama internazionale e già presidente della Royal Statistical Society, per Bayes «la probabilità incarna l’espressione quantificabile della nostra ignoranza sul mondo». Questa definizione sovverte radicalmente la visione classica – legata a frequenze osservative e ripetibilità – trasformando la probabilità da proprietà oggettiva degli eventi a strumento soggettivo di conoscenza.
Nel paradigma bayesiano, assegnare una probabilità diventa un atto intrinsecamente contestuale: non riflette dinamiche “esterne”, ma sintetizza il grado di fiducia razionale di un osservatore, inevitabilmente filtrato dal suo bagaglio di conoscenze, esperienze e persino pregiudizi. Il teorema di Bayes formalizza questo processo dialettico, strutturando l’inferenza come revisione critica delle credenze alla luce di nuovi dati. La probabilità si trasforma così in una misura dinamica, continuamente aggiornabile, che modella statistiche e convinzioni in un unico atto cognitivo (Spiegelhalter, 2019).
Per illustrare questo concetto, Bayes utilizzò l’esempio di un esperimento mentale che coinvolge sei palline lanciate casualmente su un tavolo da biliardo.
Supponiamo che una pallina bianca venga lanciata a caso sul tavolo, la sua posizione lungo il tavolo sia segnata con una linea, e poi la pallina bianca venga rimossa. Successivamente, un certo numero di palline rosse viene lanciato casualmente sul tavolo, e ti viene comunicato solo quante di esse si trovano a sinistra e quante a destra della linea. Dove pensi che possa trovarsi la linea, e quale dovrebbe essere la probabilità che la prossima pallina rossa cada alla sua sinistra?
La soluzione proposta da Bayes utilizza non solo i dati osservati (il numero di palline rosse a sinistra e a destra della linea), ma anche le convinzioni iniziali (il “prior”).
Richard Price (1723-1791), altro ecclesiastico nonconformista, fu determinante per la diffusione dell’opera di Thomas Bayes. Ben più noto dell’amico, Price godeva di una solida reputazione nei circoli intellettuali del tempo. Intratteneva rapporti con numerosi Padri Fondatori della Rivoluzione Americana, tra cui Benjamin Franklin, Thomas Jefferson e John Adams – futuro secondo presidente degli Stati Uniti –, ai cui ideali rivoluzionari aderì con fervore. Nel 1776, pubblicò un opuscolo di grande impatto, Observations on the Nature of Civil Liberty, the Principles of Government, and the Justice and Policy of the War with America, divenuto manifesto del sostegno britannico all’indipendenza americana. La sua rete di contatti includeva anche filosofi del calibro di David Hume e Adam Smith, con cui discuteva di etica ed economia.
Il contributo più rilevante di Price in ambito scientifico fu però la valorizzazione del lavoro di Bayes. Dopo la morte di quest’ultimo, nel 1761 sottopose il saggio inedito al fisico John Canton e ne curò la pubblicazione nelle Philosophical Transactions della Royal Society, avvenuta due anni più tardi. Il ritardo non fu casuale: Price non si limitò a una semplice revisione di refusi o punteggiatura. Rivisitò profondamente l’opera, aggiungendovi una seconda metà interamente dedicata alle applicazioni pratiche del teorema. Mentre Bayes si era concentrato sulla dimensione teorica – come del resto in tutti i suoi scritti, privi di qualsiasi riferimento a casi concreti –, Price ampliò il testo con esempi probabilistici, trasformandolo in uno strumento utilizzabile in pratica. Non a caso, lo storico della statistica Stephen Stigler lo definisce «il primo bayesiano della storia».
Sebbene l’opera di Bayes rimase pressoché ignorata per oltre mezzo secolo - oscurata dal contributo pionieristico di Pierre-Simon Laplace, che nel 1774 formulò indipendentemente principi analoghi per poi sistematizzarli nella monumentale Théorie analytique des probabilités (1812) - il teorema bayesiano rappresenta oggi il fondamento epistemologico della statistica moderna. Questo strumento matematico, che formalizza il processo di aggiornamento delle credenze probabilistiche alla luce di nuove evidenze, incarna una visione dinamica della conoscenza dove ogni dato modifica iterativamente lo spazio delle ipotesi possibili.
Nell’era digitale, la rivoluzione bayesiana ha permeato ogni ambito scientifico: dalla genomica alle scienze cognitive, dalla fisica delle particelle all’econometria. Il suo impatto risulta particolarmente importante nell’intelligenza artificiale, dove costituisce l’architettura logica di sistemi di apprendimento automatico. Modelli linguistici avanzati come ChatGPT e Claude implementano versioni sofisticate di inferenza bayesiana per ottimizzare previsioni, generare testi coerenti e adattarsi contestualmente agli input dell’utente.
La parabola storica di questo teorema - nato dalle speculazioni teologiche di un pastore presbiteriano settecentesco - illustra il potere trasformativo delle idee matematiche. Come sottolinea Tom Chivers in Everything Is Predictable: How Bayesian Statistics Explain Our World, la statistica bayesiana è diventata una “grammatica universale” per decifrare la realtà, permettendoci non solo di interpretare fenomeni complessi ma di prevederne l’evoluzione in condizioni d’incertezza (Chivers, 2024).
30.3 La Regola di Bayes
L’inferenza bayesiana si basa su un principio fondamentale della teoria delle probabilità: la regola di Bayes. Questa formula consente di aggiornare le credenze alla luce di nuove evidenze, combinando informazioni a priori con dati osservati.
Per comprenderla, consideriamo due variabili casuali, \(A\) e \(B\). La probabilità congiunta di questi due eventi, ovvero la probabilità che entrambi accadano simultaneamente, può essere espressa in due modi diversi.
1. Applicazione della regola della catena.
La regola della catena ci permette di esprimere la probabilità congiunta come il prodotto tra una probabilità condizionata e una probabilità marginale. In particolare, possiamo scrivere:
\[ P(A, B) = P(A \mid B) P(B). \]
Questa espressione indica che la probabilità congiunta \(P(A, B)\) si ottiene moltiplicando la probabilità condizionata \(P(A \mid B)\) (cioè la probabilità che \(A\) si verifichi dato che \(B\) è accaduto) per la probabilità marginale \(P(B)\) (cioè la probabilità che \(B\) si verifichi indipendentemente da \(A\)).
2. Simmetria della probabilità congiunta.
Poiché la probabilità congiunta è simmetrica, possiamo anche esprimerla invertendo l’ordine delle variabili:
\[ P(A, B) = P(B \mid A) P(A). \]
Questa formula è ottenuta applicando la stessa regola della catena, ma considerando prima \(B\) condizionato a \(A\).
3. Eguaglianza delle due espressioni.
Poiché entrambi i modi di scrivere la probabilità congiunta rappresentano la stessa quantità, possiamo eguagliarli:
\[ P(A \mid B) P(B) = P(B \mid A) P(A). \]
4. Derivazione della regola di Bayes.
Ora possiamo risolvere questa equazione per \(P(B \mid A)\). Dividendo entrambi i lati per \(P(A)\), otteniamo:
\[ P(B \mid A) = \frac{P(A \mid B) P(B)}{P(A)}. \]
Questa è la regola di Bayes. Essa ci permette di calcolare la probabilità che \(B\) si verifichi dato che sappiamo che \(A\) è accaduto, utilizzando:
- \(P(A \mid B)\), cioè la probabilità di osservare \(A\) se \(B\) fosse vero.
- \(P(B)\), la probabilità a priori di \(B\) (cioè prima di considerare l’evidenza di \(A\)).
- \(P(A)\), la probabilità marginale di \(A\), che funge da termine di normalizzazione per assicurare che le probabilità condizionate si sommino a 1.
Questa formula è il cuore dell’inferenza bayesiana, poiché consente di aggiornare la nostra conoscenza su un evento alla luce di nuove osservazioni.
Nel contesto dell’inferenza bayesiana:
- \(P(B)\) rappresenta la nostra conoscenza iniziale (prior),
- \(P(A \mid B)\) è la verosimiglianza, ovvero la probabilità di osservare i dati supponendo che l’ipotesi sia vera,
- \(P(B \mid A)\) è la probabilità aggiornata (posterior), che incorpora l’evidenza fornita dai dati.
30.4 Applicazioni della Regola di Bayes
La regola di Bayes è fondamentale per l’inferenza probabilistica, permettendo di aggiornare le credenze alla luce di nuove informazioni. Supponiamo di voler determinare quale processo abbia generato un insieme di dati osservati, denotato con \(D\). Definiamo uno spazio delle ipotesi \(\mathcal{H}\), che contiene tutte le possibili ipotesi sui processi che potrebbero aver generato \(D\). Indichiamo con \(H\) una specifica ipotesi appartenente a \(\mathcal{H}\), mentre con \(H'\) denotiamo genericamente altre ipotesi alternative appartenenti allo stesso spazio \(\mathcal{H}\).
L’agente esprime il proprio grado di credenza in \(H\) attraverso la probabilità a priori \(P(H)\), che riflette il livello di fiducia nell’ipotesi prima di osservare i dati. Dopo aver raccolto nuovi dati \(D\), questa credenza viene aggiornata calcolando la probabilità a posteriori \(P(H \mid D)\), ovvero la probabilità dell’ipotesi dopo aver considerato l’evidenza.
La regola di Bayes fornisce il modo formale per eseguire questo aggiornamento:
\[ P(H \mid D) = \frac{P(D \mid H) P(H)}{P(D)} , \tag{30.1}\]
dove:
\(P(D \mid H)\) è la verosimiglianza, ovvero la probabilità di osservare i dati \(D\) supponendo che l’ipotesi \(H\) sia vera. Indica quanto l’ipotesi spiega i dati osservati.
\(P(H)\) è la probabilità a priori, ovvero la conoscenza preesistente su \(H\) prima dell’osservazione dei dati.
-
\(P(D)\) è la probabilità marginale dei dati, ottenuta considerando tutte le ipotesi possibili:
\[ P(D) = \sum_{H' \in \mathcal{H}} P(D \mid H') P(H'). \]
Questa quantità, detta evidenza o fattore di normalizzazione, garantisce che la somma delle probabilità a posteriori su tutte le ipotesi sia pari a 1.
30.4.1 La Marginalizzazione
Il calcolo della probabilità marginale \(P(D)\) è fondamentale per normalizzare la distribuzione a posteriori. Questo avviene considerando tutte le ipotesi possibili.
-
Caso discreto: la probabilità marginale si ottiene sommando su tutte le possibili ipotesi \(H' \in \mathcal{H}\):
\[ P(D) = \sum_{H' \in \mathcal{H}} P(D \mid H') P(H'). \]
Sostituendo questa espressione nella regola di Bayes, otteniamo la formula esplicita della distribuzione a posteriori:
\[ P(H \mid D) = \frac{P(D \mid H) P(H)}{\sum_{H' \in \mathcal{H}} P(D \mid H') P(H')}. \tag{30.2}\]
-
Caso continuo: se lo spazio delle ipotesi è continuo, la somma viene sostituita da un integrale:
\[ P(D) = \int_{\mathcal{H}} P(D \mid H') P(H') \, dH'. \]
La distribuzione a posteriori si esprime quindi come:
\[ P(H \mid D) = \frac{P(D \mid H) P(H)}{\int_{\mathcal{H}} P(D \mid H') P(H') \, dH'}. \tag{30.3}\]
L’evidenza \(P(D)\) può essere computazionalmente onerosa da calcolare, specialmente in spazi ad alta dimensionalità. Per questo motivo, si utilizzano tecniche di approssimazione come il campionamento Monte Carlo o i metodi variazionali.
30.4.2 Componenti Chiave della Formula di Bayes
La regola di Bayes si basa su tre elementi essenziali:
- Probabilità a priori \(P(H)\): la credenza iniziale sull’ipotesi \(H\) prima di osservare i dati.
- Verosimiglianza \(P(D \mid H)\): la probabilità dei dati osservati, dato che \(H\) sia vera. Misura quanto l’ipotesi è compatibile con l’evidenza.
- Probabilità a posteriori \(P(H \mid D)\): la credenza aggiornata in \(H\) dopo aver osservato i dati.
L’aggiornamento delle credenze attraverso la regola di Bayes è un processo iterativo: ogni volta che vengono raccolti nuovi dati, la distribuzione a posteriori diventa la nuova distribuzione a priori per il successivo aggiornamento. Questo meccanismo consente di adattare continuamente le proprie credenze alla luce di nuove informazioni, rendendo l’approccio bayesiano estremamente utile per modellare il ragionamento umano in condizioni di incertezza.
30.4.3 Applicazioni in Psicologia
Negli ultimi anni, i modelli bayesiani hanno acquisito un ruolo centrale nello studio della cognizione umana, fornendo una struttura formale per comprendere come il cervello costruisca rappresentazioni del mondo e prenda decisioni sulla base di dati incerti. Come discusso da Griffiths et al. (2024), questi modelli sono stati applicati a una vasta gamma di processi cognitivi, tra cui:
- Apprendimento e generalizzazione: i modelli bayesiani descrivono come gli individui apprendano nuove categorie e concetti sulla base di dati limitati e rumorosi (Tenenbaum, Griffiths, & Kemp, 2006).
- Percezione e interpretazione sensoriale: la percezione visiva e il riconoscimento di oggetti possono essere spiegati come un’inferenza bayesiana sulla base di segnali sensoriali ambigui (Domini & Caudek, 2003; Yuille & Kersten, 2006).
- Controllo motorio: il sistema motorio umano sembra ottimizzare i movimenti attraverso una combinazione di modelli interni e aggiornamenti bayesiani (Kording & Wolpert, 2006).
- Memoria e recupero delle informazioni: i processi mnemonici, come il richiamo della memoria semantica, possono essere modellati come inferenze bayesiane basate su conoscenze pregresse (Steyvers, Griffiths, & Dennis, 2006).
- Acquisizione del linguaggio: l’apprendimento del linguaggio nei bambini può essere descritto attraverso processi probabilistici che permettono di inferire le strutture grammaticali sulla base di dati linguistici limitati (Chater & Manning, 2006; Xu & Tenenbaum, in press).
- Apprendimento causale: la capacità di inferire relazioni causali dagli eventi osservati è coerente con un modello bayesiano, in cui la mente valuta la probabilità di una relazione causale sulla base dell’evidenza disponibile (Griffiths & Tenenbaum, 2005, 2007).
- Ragionamento e decisione: il ragionamento simbolico e il processo decisionale possono essere formalizzati come un aggiornamento bayesiano delle credenze sulla base di nuove informazioni (Oaksford & Chater, 2001).
- Cognizione sociale: le inferenze sulle intenzioni e credenze altrui possono essere modellate attraverso processi bayesiani, permettendo di spiegare come le persone comprendano il comportamento altrui (Baker, Tenenbaum, & Saxe, 2007).
30.4.4 L’Inferenza Bayesiana nella Cognizione Umana
Un tema centrale che emerge da questi programmi di ricerca è la seguente domanda: come fa la mente umana ad andare oltre i dati dell’esperienza? In altre parole, come riesce il cervello a costruire modelli complessi del mondo a partire da informazioni limitate e spesso ambigue?
L’approccio bayesiano propone che il cervello utilizzi un processo di inferenza probabilistica per aggiornare continuamente le proprie credenze, combinando informazioni pregresse con nuove osservazioni per affinare le proprie rappresentazioni mentali. Questo meccanismo consente di spiegare molte delle capacità cognitive umane, dall’apprendimento rapido di nuove categorie alla capacità di adattarsi a un ambiente mutevole, fino alla formulazione di inferenze sociali e alla presa di decisioni in condizioni di incertezza.
L’adozione dei modelli bayesiani nella psicologia cognitiva ha portato a una nuova comprensione della mente come sistema predittivo, in grado di formulare ipotesi probabilistiche sugli eventi futuri e di correggerle dinamicamente sulla base dell’esperienza. Questo approccio ha profonde implicazioni per lo studio del comportamento umano e per lo sviluppo di nuove tecniche di modellizzazione nei campi della psicologia, delle neuroscienze e dell’intelligenza artificiale.
30.5 Test medici
Uno degli esempi più comuni per comprendere il teorema di Bayes riguarda i test diagnostici.
Esempio 30.1 Consideriamo un test di mammografia utilizzato per diagnosticare il cancro al seno che abbiamo già discusso nel Capitolo 29. Definiamo le seguenti ipotesi:
- \(M^+\): la persona ha il cancro al seno;
- \(M^-\): la persona non ha il cancro al seno.
L’evidenza è il risultato positivo del test, indicato con \(T^+\). Il nostro obiettivo è calcolare la probabilità che una persona abbia il cancro al seno, dato un risultato positivo al test, ovvero \(P(M^+ \mid T^+)\).
Definizione dei termini nella regola di Bayes.
Il teorema di Bayes afferma che:
\[ P(M^+ \mid T^+) = \frac{P(T^+ \mid M^+) P(M^+)}{P(T^+)} , \]
dove:
- \(P(T^+ \mid M^+)\) è la sensibilità del test, cioè la probabilità che il test risulti positivo se la persona ha effettivamente il cancro. Nel nostro caso, \(P(T^+ \mid M^+) = 0.90\).
- \(P(M^+)\) è la probabilità a priori di avere il cancro al seno, ovvero la prevalenza della malattia nella popolazione. Supponiamo che sia \(P(M^+) = 0.01\) (1%).
- \(P(T^+ \mid M^-)\) è la probabilità di un falso positivo, cioè la probabilità che il test risulti positivo anche in assenza di malattia. Questa è complementare alla specificità del test:
\[ P(T^+ \mid M^-) = 1 - \text{Specificità} = 1 - 0.90 = 0.10. \]
- \(P(M^-)\) è la probabilità a priori che una persona non abbia il cancro, ovvero:
\[ P(M^-) = 1 - P(M^+) = 1 - 0.01 = 0.99. \]
- \(P(T^+)\) è la probabilità marginale che il test risulti positivo, calcolata considerando entrambe le possibilità (cioè che la persona abbia o non abbia il cancro):
\[ P(T^+) = P(T^+ \mid M^+) P(M^+) + P(T^+ \mid M^-) P(M^-). \]
Sostituendo i valori numerici:
\[ P(T^+) = (0.90 \cdot 0.01) + (0.10 \cdot 0.99) = 0.009 + 0.099 = 0.108. \]
Applicazione della Regola di Bayes.
Ora possiamo calcolare la probabilità a posteriori \(P(M^+ \mid T^+)\):
\[ P(M^+ \mid T^+) = \frac{0.90 \cdot 0.01}{0.108} = \frac{0.009}{0.108} = 0.0833. \]
Interpretazione del Risultato.
Questo risultato indica che, nonostante il test abbia una sensibilità e una specificità del 90%, la probabilità che una persona con un test positivo abbia effettivamente il cancro è solo dell’8.3%. Questo effetto è dovuto alla bassa prevalenza della malattia: anche se il test è relativamente accurato, il numero di falsi positivi è ancora alto rispetto ai veri positivi. Tale risultato conferma quanto precedentemente ottenuto nel Capitolo 29, attraverso un metodo di calcolo alternativo.
Questa formulazione mostra come la regola di Bayes permetta di aggiornare la probabilità di avere la malattia dopo aver osservato il risultato del test, combinando la sensibilità, la specificità e la prevalenza della malattia nella popolazione.
30.5.1 Affidabilità di un Test HIV e Aggiornamento Bayesiano
Vogliamo valutare quanto sia affidabile un test per l’HIV e come cambia la nostra conoscenza dopo due test consecutivi positivi. Per farlo, utilizzeremo la regola di Bayes per aggiornare la probabilità di infezione dopo ogni test.
Esempio 30.2 Definiamo:
- \(H^+\): la persona ha l’HIV.
- \(H^-\): la persona non ha l’HIV.
- \(T^+\): il test risulta positivo.
- \(T^-\): il test risulta negativo.
Dati noti:
-
Prevalenza dell’HIV nella popolazione:
\[ P(H^+) = 0.003 \] -
Sensibilità del test (probabilità di un test positivo dato che la persona ha l’HIV):
\[ P(T^+ \mid H^+) = 0.95 \] -
Specificità del test (probabilità di un test negativo dato che la persona NON ha l’HIV):
\[ P(T^- \mid H^-) = 0.9928 \] Da cui il tasso di falsi positivi è:
\[ P(T^+ \mid H^-) = 1 - 0.9928 = 0.0072. \]
Passo 1: Calcolo della probabilità di avere l’HIV dopo un test positivo.
Applichiamo la regola di Bayes:
\[ P(H^+ \mid T^+) = \frac{P(T^+ \mid H^+) P(H^+)}{P(T^+)} \]
dove la probabilità marginale del test positivo è:
\[ P(T^+) = P(T^+ \mid H^+) P(H^+) + P(T^+ \mid H^-) P(H^-). \]
Sostituendo i valori:
\[ P(T^+) = (0.95 \times 0.003) + (0.0072 \times 0.997) \]
\[ = 0.00285 + 0.00718 = 0.01003. \]
Ora calcoliamo la probabilità a posteriori:
\[ P(H^+ \mid T^+) = \frac{0.95 \times 0.003}{0.01003} = \frac{0.00285}{0.01003} \approx 0.2844. \]
Dopo un primo test positivo, la probabilità di avere l’HIV sale dal 0.3% al 28.44%.
Passo 2: Calcolo della probabilità di avere l’HIV dopo due test positivi.
Dopo un primo test positivo, la nuova probabilità a priori diventa \(P(H^+ \mid T^+) = 0.2844\). Ora ripetiamo il calcolo per un secondo test positivo.
La nuova probabilità marginale di un secondo test positivo è:
\[ P(T^+ \mid T^+) = P(T^+ \mid H^+) P(H^+ \mid T^+) + P(T^+ \mid H^-) P(H^- \mid T^+) , \]
dove:
- \(P(T^+ \mid H^+) = 0.95\) (la sensibilità rimane invariata).
- \(P(H^+ \mid T^+) = 0.2844\) (aggiornato dal primo test).
- \(P(T^+ \mid H^-) = 0.0072\) (tasso di falsi positivi).
- \(P(H^- \mid T^+) = 1 - P(H^+ \mid T^+) = 1 - 0.2844 = 0.7156\).
Calcoliamo la probabilità di un secondo test positivo:
\[ P(T^+ \mid T^+) = (0.95 \times 0.2844) + (0.0072 \times 0.7156) \]
\[ = 0.2702 + 0.00515 = 0.2753. \]
Ora applichiamo nuovamente la regola di Bayes per ottenere la probabilità a posteriori dopo due test positivi:
\[ P(H^+ \mid T^+, T^+) = \frac{P(T^+ \mid H^+) P(H^+ \mid T^+)}{P(T^+ \mid T^+)} \]
\[ = \frac{0.95 \times 0.2844}{0.2753} = \frac{0.2702}{0.2753} \approx 0.981. \]
Dopo due test consecutivi positivi, la probabilità di avere l’HIV aumenta drasticamente al 98.1%.
Conclusioni.
1. Dopo un solo test positivo, la probabilità di avere l’HIV è 28.44%, molto più alta rispetto alla prevalenza iniziale dello 0.3%, ma ancora lontana dal 100%. 2. Dopo due test positivi consecutivi, la probabilità sale al 98.1%, rendendo la diagnosi quasi certa. 3. L’aggiornamento bayesiano mostra chiaramente l’importanza di test ripetuti: un singolo test positivo non implica automaticamente la presenza della malattia, ma il risultato combinato di più test migliora enormemente l’affidabilità della diagnosi.
Questa analisi evidenzia come il teorema di Bayes sia essenziale per interpretare correttamente i risultati diagnostici, specialmente quando la prevalenza della malattia è bassa.
Per semplicità, possiamo riscrivere il teorema di Bayes in due modi distinti per calcolare ciò che viene chiamato valore predittivo del test positivo e valore predittivo del test negativo.
-
Valore Predittivo Positivo (VPP): la probabilità che una persona sia malata dato un test positivo.
- Valore Predittivo Negativo (VPN): la probabilità che una persona sia sana dato un test negativo.
Per stimare questi valori, è essenziale comprendere tre concetti fondamentali:
Prevalenza \((P(M^+))\): rappresenta la proporzione di individui malati nella popolazione. Per esempio, una prevalenza dello 0,5% implica che su 1000 persone, 5 hanno la malattia.
-
Sensibilità \((P(T^+ \mid M^+))\): misura la capacità del test di identificare correttamente i malati. È data dal rapporto tra il numero di veri positivi e il totale dei malati:
\[ \text{Sensibilità} = \frac{TP}{TP + FN}, \]
dove:
- \(TP\) sono i veri positivi (malati correttamente identificati dal test).
- \(FN\) sono i falsi negativi (malati che il test non ha rilevato).
-
Specificità \((P(T^- \mid M^-))\): misura la capacità del test di identificare correttamente i sani. È il rapporto tra il numero di veri negativi e il totale delle persone sane:
\[ \text{Specificità} = \frac{TN}{TN + FP} , \]
dove:
- \(TN\) sono i veri negativi (persone sane correttamente escluse dal test).
- \(FP\) sono i falsi positivi (persone sane erroneamente diagnosticate come malate).
Rappresentazione in tabella
Test Positivo \((T^+)\) | Test Negativo \((T^-)\) | Totale | |
---|---|---|---|
Malato \((M^+)\) | \(P(T^+ \cap M^+)\) (Sensibilità) | \(P(T^- \cap M^+)\) (\(1 -\) Sensibilità) | \(P(M^+)\) |
Sano \((M^-)\) | \(P(T^+ \cap M^-)\) (\(1 -\) Specificità) | \(P(T^- \cap M^-)\) (Specificità) | \(P(M^-)\) |
Totale | \(P(T^+)\) | \(P(T^-)\) | 1 |
Questa tabella descrive il legame tra i risultati del test e la condizione effettiva dell’individuo.
30.5.1.1 Calcolo del Valore Predittivo Positivo (VPP)
Il VPP esprime la probabilità che una persona con un test positivo sia effettivamente malata. Usando la regola di Bayes, otteniamo:
\[ P(M^+ \mid T^+) = \frac{P(T^+ \mid M^+) \cdot P(M^+)}{P(T^+)} \]
Sostituendo la formula di \(P(T^+)\) dalla tabella:
\[ P(M^+ \mid T^+) = \frac{P(T^+ \mid M^+) \cdot P(M^+)}{P(T^+ \mid M^+) \cdot P(M^+) + P(T^+ \mid M^-) \cdot P(M^-)} \]
Scritto in termini di sensibilità, specificità e prevalenza:
\[ VPP = \frac{(\text{Sensibilità} \times \text{Prevalenza})}{(\text{Sensibilità} \times \text{Prevalenza}) + (1 - \text{Specificità}) \times (1 - \text{Prevalenza})}. \]
30.5.1.2 Calcolo del Valore Predittivo Negativo (VPN)
Il VPN esprime la probabilità che una persona con un test negativo sia effettivamente sana. Applicando il teorema di Bayes:
\[ P(M^- \mid T^-) = \frac{P(T^- \mid M^-) \cdot P(M^-)}{P(T^-)} \]
Espandendo \(P(T^-)\):
\[ P(M^- \mid T^-) = \frac{P(T^- \mid M^-) \cdot (1 - P(M^+))}{P(T^- \mid M^-) \cdot (1 - P(M^+)) + P(T^- \mid M^+) \cdot P(M^+)} \]
Sostituendo sensibilità, specificità e prevalenza:
\[ VPN = \frac{\text{Specificità} \times (1 - \text{Prevalenza})}{\text{Specificità} \times (1 - \text{Prevalenza}) + (1 - \text{Sensibilità}) \times \text{Prevalenza}}. \]
30.5.1.3 Interpretazione e Implicazioni
-
Un test con alta sensibilità e specificità non garantisce un VPP elevato se la prevalenza della malattia è bassa.
- Anche con un test altamente accurato, un numero elevato di falsi positivi può abbassare la probabilità effettiva di essere malati dopo un test positivo.
Il VPN è generalmente più alto quando la prevalenza è bassa, il che significa che un test negativo è molto affidabile nell’escludere la malattia quando questa è rara.
Ripetere il test riduce l’incertezza: se un primo test positivo porta a un VPP basso, un secondo test positivo consecutivo può aumentare notevolmente la probabilità di essere effettivamente malati.
In conclusione, il valore predittivo di un test non dipende solo dalle sue caratteristiche intrinseche, ma anche dalla prevalenza della malattia. Il teorema di Bayes ci fornisce uno strumento essenziale per aggiornare la probabilità di malattia dopo aver osservato il risultato di un test, migliorando la nostra capacità di interpretare i risultati in modo più accurato.
Implementiamo in R le formule per calcolare il valore predittivo positivo (VPP) e il valore predittivo negativo (VPN) di un test diagnostico, utilizzando gli stessi dati dell’esercizio precedente sulla mammografia.
positive_predictive_value_of_diagnostic_test <- function(sens, spec, prev) {
(sens * prev) / (sens * prev + (1 - spec) * (1 - prev))
}
negative_predictive_value_of_diagnostic_test <- function(sens, spec, prev) {
(spec * (1 - prev)) / (spec * (1 - prev) + (1 - sens) * prev)
}
Inseriamo i dati del problema.
sens = 0.9 # sensibilità
spec = 0.9 # specificità
prev = 0.01 # prevalenza
Il valore predittivo del test positivo è:
Il valore predittivo del test negativo è:
30.6 La Fallacia del Procuratore e il Teorema di Bayes
Il teorema di Bayes non è solo uno strumento utile in ambito medico, ma è anche cruciale nel sistema giudiziario, dove errori nell’interpretazione delle probabilità possono avere conseguenze gravi. Un errore logico particolarmente rilevante in questo contesto è la fallacia del procuratore.
30.6.1 Cos’è la fallacia del procuratore?
Questa fallacia si verifica quando si confonde la probabilità di ottenere una certa evidenza se un individuo è innocente con la probabilità che un individuo sia innocente dato che quella evidenza è stata osservata. In altre parole, si scambia \(P(T^+ \mid I)\) (la probabilità di ottenere un test positivo se la persona è innocente) con \(P(I \mid T^+)\) (la probabilità che la persona sia innocente dato un test positivo).
Questo errore è particolarmente insidioso nei processi giudiziari in cui si utilizzano prove statistiche, come il test del DNA. Vediamo un esempio concreto per capire come il teorema di Bayes corregge questa errata interpretazione.
Esempio 30.3 Supponiamo che un test del DNA venga utilizzato per identificare un sospetto all’interno di una popolazione di 65 milioni di persone. I parametri del test sono:
Sensibilità:
\[ P(T^+ \mid C) = 99\% \] Questa è la probabilità che il test dia un risultato positivo se la persona è effettivamente colpevole.Specificità:
\[ P(T^- \mid I) = 99.99997\% \] Questa è la probabilità che il test dia un risultato negativo se la persona è innocente.Prevalenza:
\[ P(C) = \frac{1}{65.000.000} \approx 1.54 \times 10^{-8} \] Ovvero, la probabilità a priori che una persona scelta a caso sia il vero colpevole.
Un campione di DNA viene confrontato con quello di una persona nel database e il test dà un risultato positivo. Vogliamo calcolare la probabilità che questa persona sia effettivamente il colpevole dato il risultato positivo, ovvero:
\[ P(C \mid T^+) \]
Passo 1: Calcolo della probabilità del test positivo \(P(T^+)\).
La probabilità di ottenere un test positivo può derivare da due scenari:
- Il test è positivo perché la persona è colpevole.
- Il test è positivo perché la persona è innocente ma ha ricevuto un falso positivo.
Utilizziamo la regola della probabilità totale:
\[ P(T^+) = P(T^+ \mid C) P(C) + P(T^+ \mid I) P(I) , \]
dove:
- \(P(T^+ \mid C) = 0.99\) (sensibilità del test)
- \(P(I) = 1 - P(C) \approx 0.99999998\) (probabilità che la persona sia innocente)
- \(P(T^+ \mid I) = 1 - P(T^- \mid I) = 1 - 0.9999997 = 0.0000003\) (tasso di falsi positivi)
Sostituendo i valori:
\[ P(T^+) = (0.99 \times 1.54 \times 10^{-8}) + (0.0000003 \times 0.99999998) \]
\[ P(T^+) = 1.5231 \times 10^{-8} + 2.9999994 \times 10^{-7} \]
\[ P(T^+) = 3.1523 \times 10^{-7} \]
Passo 2: Applicazione del teorema di Bayes.
Ora possiamo calcolare \(P(C \mid T^+)\), ovvero la probabilità che la persona sia colpevole dato un test positivo, usando il teorema di Bayes:
\[ P(C \mid T^+) = \frac{P(T^+ \mid C) P(C)}{P(T^+)} . \]
Sostituendo i valori calcolati:
\[ P(C \mid T^+) = \frac{(0.99 \times 1.54 \times 10^{-8})}{3.1523 \times 10^{-7}} \]
\[ P(C \mid T^+) = \frac{1.5231 \times 10^{-8}}{3.1523 \times 10^{-7}} \]
\[ P(C \mid T^+) \approx 0.0483 \]
Risultato: La probabilità che la persona sia effettivamente colpevole dopo un test del DNA positivo è solo 4.83%, nonostante la specificità estremamente elevata del test.
Interpretazione: Perché la probabilità è così bassa?
Nonostante il test sia altamente accurato, la bassa prevalenza del colpevole nella popolazione gioca un ruolo cruciale nel ridurre il valore predittivo del test.
Molti innocenti vengono testati e, anche se il tasso di falsi positivi è molto basso, il numero assoluto di falsi positivi è comunque elevato a causa della dimensione della popolazione testata.
Questo significa che un test positivo non è sufficiente per dimostrare la colpevolezza di un individuo. Affermare, per esempio, che “c’è solo una probabilità su 3 milioni che il sospetto sia innocente” è errato, perché si confonde la specificità del test con la probabilità effettiva di colpevolezza.
Conclusione: Il pericolo della fallacia del procuratore.
L’errore logico della fallacia del procuratore consiste nello scambiare:
- \(P(T^+ \mid I)\) (probabilità di ottenere un test positivo se la persona è innocente),
- \(P(I \mid T^+)\) (probabilità che la persona sia innocente dato un test positivo).
Questo errore porta a sovrastimare enormemente la colpevolezza basandosi su prove probabilistiche. È essenziale usare il teorema di Bayes per interpretare correttamente l’evidenza nei processi giudiziari ed evitare ingiustizie.
30.6.2 Principali insegnamenti
Un’elevata accuratezza del test non garantisce un valore predittivo positivo elevato.
Anche con una sensibilità e una specificità molto alte, l’interpretazione di un test deve considerare la prevalenza della condizione indagata. In popolazioni di grandi dimensioni con bassa prevalenza, il numero assoluto di falsi positivi può superare quello dei veri positivi, riducendo drasticamente la probabilità a posteriori che un test positivo corrisponda a un colpevole reale:
\[ P(C \mid T^+) = \frac{P(T^+ \mid C) P(C)}{P(T^+)} . \]
Questo spiega perché, nonostante un test altamente accurato, la probabilità di colpevolezza dopo un risultato positivo rimane bassa.La probabilità di colpevolezza post-test dipende dalla prevalenza iniziale.
L’errore principale della fallacia del procuratore consiste nel confondere la probabilità condizionata \(P(T^+ \mid I)\) (probabilità di un test positivo per un innocente) con \(P(I \mid T^+)\) (probabilità che un individuo sia innocente dato un test positivo).
Il valore predittivo positivo \(P(C \mid T^+)\) dipende non solo dalla specificità del test, ma anche dalla rarità della condizione investigata. Ignorare la probabilità a priori del colpevole porta a una sovrastima della colpevolezza, generando un rischio concreto di errori giudiziari.L’omissione del teorema di Bayes costituisce un errore metodologico critico.
Il teorema di Bayes fornisce l’unico quadro formale per aggiornare correttamente le credenze alla luce delle nuove evidenze. In ambito forense:
\[ P(C \mid T^+) \neq 1 - P(I \mid T^+), \] ma dipende dal rapporto tra prevalenza e potere diagnostico del test. L’uso improprio delle probabilità condizionate viola il principio di presunzione d’innocenza e può portare a decisioni errate basate su interpretazioni fallaci delle prove probabilistiche.
30.6.2.1 Conclusione epistemologica
L’impiego di test probabilistici in ambito giudiziario richiede un’applicazione rigorosa del teorema di Bayes per evitare distorsioni interpretative. Solo un corretto aggiornamento delle credenze, integrando:
-
la probabilità pre-test (\(P(C)\), prevalenza del colpevole nella popolazione investigata),
-
la potenza diagnostica del test (sensibilità e specificità),
- il tasso di errore strumentale (falsi positivi e falsi negativi),
consente di ridurre il rischio di errori giudiziari sistematici. In assenza di questa integrazione, anche test estremamente precisi possono condurre a ingiuste condanne, trasformando strumenti scientifici affidabili in fonti di distorsione probatoria.
30.7 Probabilità Inversa: Dal Problema Classico all’Inferenza Bayesiana
Gli esempi discussi in questo capitolo mettono in evidenza una distinzione fondamentale tra due tipi di domande probabilistiche:
-
Probabilità diretta:
-
“Qual è la probabilità di osservare un certo risultato, supponendo che un’ipotesi sia vera?”
-
“Qual è la probabilità di osservare un certo risultato, supponendo che un’ipotesi sia vera?”
-
Probabilità inversa:
- “Qual è la probabilità che un’ipotesi sia vera, dato il risultato osservato?”
Questa distinzione è il cuore del teorema di Bayes e della differenza tra l’approccio frequentista e quello bayesiano alla probabilità.
30.7.1 Esempi di Probabilità Diretta e Inversa
Per comprendere meglio questa differenza, consideriamo il caso del lancio di una moneta:
Probabilità diretta: Se ipotizziamo che la moneta sia equa (\(P(Testa) = 0.5\)), qual è la probabilità di ottenere zero teste in cinque lanci?
Questo è un problema di probabilità diretta, in cui calcoliamo:
\[ P(D \mid H) = (0.5)^5 = 0.03125. \]Probabilità inversa: Ora poniamo la domanda opposta. Supponiamo di aver lanciato una moneta cinque volte e di aver osservato zero teste. Quanto è probabile che la moneta sia effettivamente equa?
Qui non stiamo calcolando \(P(D \mid H)\), ma piuttosto \(P(H \mid D)\), ovvero l’ipotesi a posteriori data l’evidenza osservata. Questo richiede il teorema di Bayes, perché dobbiamo combinare la probabilità del dato con un’ipotesi a priori sulla moneta.
30.7.2 Dalla Probabilità Diretta alla Probabilità Inversa: Il Contributo di Bayes
Per molto tempo, lo studio della probabilità si è focalizzato esclusivamente sulla prima domanda, ossia la probabilità di osservare un certo esito sotto un’ipotesi data. Tuttavia, nel XVIII secolo, il reverendo Thomas Bayes si concentrò sulla seconda domanda, introducendo il concetto di probabilità inversa.
Questa intuizione ha dato origine a quello che oggi chiamiamo inferenza bayesiana, permettendoci di aggiornare la probabilità di un’ipotesi alla luce di nuove evidenze.
30.7.3 L’Impatto della Probabilità Inversa
L’idea di stimare la probabilità di un’ipotesi data l’evidenza osservata ha avuto un impatto enorme in numerosi campi:
-
Scienza e sperimentazione: Quanto è probabile che un’ipotesi scientifica sia vera, dato il risultato di un esperimento?
-
Medicina: Quanto è probabile che un paziente abbia una malattia, dato un test positivo?
- Giustizia: Quanto è probabile che un sospettato sia colpevole, dato il risultato di un test del DNA?
Tutti questi problemi richiedono non solo di calcolare la probabilità di osservare certi dati (\(P(D \mid H)\)), ma anche di aggiornare le nostre convinzioni sull’ipotesi stessa (\(P(H \mid D)\)).
In conclusione, l’inferenza bayesiana è essenziale per rispondere alla seconda domanda che abbiamo formulato sopra e rappresenta un’estensione fondamentale della teoria della probabilità. Il teorema di Bayes ci permette di passare dalla probabilità diretta alla probabilità inversa, aggiornando in modo rigoroso le nostre credenze in base alle nuove osservazioni. Senza questa prospettiva, molte domande scientifiche e decisionali rimarrebbero senza una risposta adeguata.
Abbiamo già discusso in precedenza il problema di Monty Hall. Vediamo ora come possa essere risolto utilizzando il Teorema di Bayes.
Ci sono tre porte:
- dietro una porta c’è un’automobile (il premio);
- dietro le altre due porte ci sono delle capre.
Il giocatore sceglie una porta (ad esempio, la porta 1). Successivamente, il conduttore (che sa cosa c’è dietro ogni porta) apre una delle due porte rimanenti, rivelando una capra (ad esempio, apre la porta 3). A questo punto, il giocatore può decidere se mantenere la scelta iniziale o cambiare porta.
Vogliamo calcolare la probabilità che l’automobile sia dietro la porta 2, sapendo che il conduttore ha aperto la porta 3.
Definizione degli eventi.
- A1, A2, A3: l’automobile si trova dietro la porta 1, 2 o 3, rispettivamente.
- P3: il conduttore apre la porta 3, rivelando una capra.
Vogliamo calcolare la probabilità condizionata \(P(A2 \mid P3)\), ovvero la probabilità che l’automobile sia dietro la porta 2, sapendo che il conduttore ha aperto la porta 3. La formula di Bayes è:
\[ P(A2 \mid P3) = \frac{P(P3 \mid A2) \cdot P(A2)}{P(P3)} \]
-
\(P(A2)\): probabilità iniziale che l’automobile sia dietro la porta 2.
- Poiché ci sono tre porte e solo un’automobile, \(P(A2) = \frac{1}{3}\).
-
\(P(P3 \mid A2)\): probabilità che il conduttore apra la porta 3, sapendo che l’automobile è dietro la porta 2.
- Se l’automobile è dietro la porta 2, il conduttore deve aprire la porta 3 (non può aprire la porta 1, scelta dal giocatore, né la porta 2, dove c’è l’automobile). Quindi, \(P(P3 \mid A2) = 1\).
-
\(P(P3)\): probabilità che il conduttore apra la porta 3.
- Il conduttore può aprire la porta 3 in due casi:
- Se l’automobile è dietro la porta 2 (con probabilità \(\frac{1}{3}\)).
- Se l’automobile è dietro la porta 1 (con probabilità \(\frac{1}{3}\)), e il conduttore sceglie casualmente tra la porta 2 e la porta 3 (con probabilità \(\frac{1}{2}\)).
- Quindi: \[ \begin{align} P(P3) &= P(P3 \mid A2) \cdot P(A2) + P(P3 \mid A1) \cdot P(A1) \notag\\ &= 1 \cdot \frac{1}{3} + \frac{1}{2} \cdot \frac{1}{3} = \frac{1}{3} + \frac{1}{6} = \frac{1}{2}.\notag \end{align} \]
- Il conduttore può aprire la porta 3 in due casi:
Sostituendo i valori calcolati:
\[ P(A2 \mid P3) = \frac{1 \cdot \frac{1}{3}}{\frac{1}{2}} = \frac{\frac{1}{3}}{\frac{1}{2}} = \frac{2}{3}. \]
In conclusione, la probabilità che l’automobile sia dietro la porta 2, sapendo che il conduttore ha aperto la porta 3, è \(\frac{2}{3}\) (circa 66.7%). Questo significa che cambiando porta, il giocatore ha una probabilità di vincita del 66.7%, mentre mantenendo la scelta iniziale la probabilità è solo del 33.3%.
Questo esempio mostra come il Teorema di Bayes permetta di aggiornare le probabilità in base a nuove informazioni. Nel contesto del problema di Monty Hall, cambiare porta raddoppia le possibilità di vincere l’automobile.
30.8 Riflessioni Conclusive
In questo capitolo abbiamo esplorato vari esempi, principalmente nel campo medico e forense, per illustrare come il teorema di Bayes permetta di combinare le informazioni derivate dalle osservazioni con le conoscenze precedenti (priori), aggiornando così il nostro grado di convinzione rispetto a un’ipotesi. Il teorema di Bayes fornisce un meccanismo razionale, noto come “aggiornamento bayesiano”, che ci consente di ricalibrare le nostre convinzioni iniziali alla luce di nuove evidenze.
Una lezione fondamentale che il teorema di Bayes ci insegna, sia nella ricerca scientifica che nella vita quotidiana, è che spesso non ci interessa tanto conoscere la probabilità che qualcosa accada assumendo vera un’ipotesi, quanto piuttosto la probabilità che un’ipotesi sia vera, dato che abbiamo osservato una certa evidenza. In altre parole, la forza del teorema di Bayes sta nella sua capacità di affrontare direttamente il problema inverso, cioè come dedurre la verità di un’ipotesi a partire dalle osservazioni.
Il framework bayesiano per l’inferenza probabilistica offre un approccio generale per comprendere come i problemi di induzione possano essere risolti in linea di principio e, forse, anche come possano essere affrontati dalla mente umana.
In questo capitolo ci siamo concentrati sull’applicazione del teorema di Bayes utilizzando probabilità puntuali. Tuttavia, il teorema esprime pienamente il suo potenziale quando sia l’evidenza che i gradi di certezza a priori delle ipotesi sono rappresentati attraverso distribuzioni di probabilità continue. Questo sarà l’argomento centrale nella prossima sezione della dispensa, dove approfondiremo il flusso di lavoro bayesiano e l’uso di distribuzioni continue nell’aggiornamento bayesiano.
Informazioni sull’Ambiente di Sviluppo
sessionInfo()
#> R version 4.4.2 (2024-10-31)
#> Platform: aarch64-apple-darwin20
#> Running under: macOS Sequoia 15.3.1
#>
#> Matrix products: default
#> BLAS: /Library/Frameworks/R.framework/Versions/4.4-arm64/Resources/lib/libRblas.0.dylib
#> LAPACK: /Library/Frameworks/R.framework/Versions/4.4-arm64/Resources/lib/libRlapack.dylib; LAPACK version 3.12.0
#>
#> locale:
#> [1] C/UTF-8/C/C/C/C
#>
#> time zone: Europe/Rome
#> tzcode source: internal
#>
#> attached base packages:
#> [1] stats graphics grDevices utils datasets methods base
#>
#> other attached packages:
#> [1] thematic_0.1.6 MetBrewer_0.2.0 ggokabeito_0.1.0 see_0.10.0
#> [5] gridExtra_2.3 patchwork_1.3.0 bayesplot_1.11.1 psych_2.4.12
#> [9] scales_1.3.0 markdown_1.13 knitr_1.49 lubridate_1.9.4
#> [13] forcats_1.0.0 stringr_1.5.1 dplyr_1.1.4 purrr_1.0.4
#> [17] readr_2.1.5 tidyr_1.3.1 tibble_3.2.1 ggplot2_3.5.1
#> [21] tidyverse_2.0.0 rio_1.2.3 here_1.0.1
#>
#> loaded via a namespace (and not attached):
#> [1] generics_0.1.3 stringi_1.8.4 lattice_0.22-6 hms_1.1.3
#> [5] digest_0.6.37 magrittr_2.0.3 evaluate_1.0.3 grid_4.4.2
#> [9] timechange_0.3.0 fastmap_1.2.0 rprojroot_2.0.4 jsonlite_1.9.1
#> [13] mnormt_2.1.1 cli_3.6.4 rlang_1.1.5 munsell_0.5.1
#> [17] withr_3.0.2 tools_4.4.2 parallel_4.4.2 tzdb_0.4.0
#> [21] colorspace_2.1-1 pacman_0.5.1 vctrs_0.6.5 R6_2.6.1
#> [25] lifecycle_1.0.4 htmlwidgets_1.6.4 pkgconfig_2.0.3 pillar_1.10.1
#> [29] gtable_0.3.6 glue_1.8.0 xfun_0.51 tidyselect_1.2.1
#> [33] rstudioapi_0.17.1 farver_2.1.2 htmltools_0.5.8.1 nlme_3.1-167
#> [37] rmarkdown_2.29 compiler_4.4.2