Nel Capitolo 2 abbiamo visto come definire la probabilità su insiemi finiti, ossia in situazioni dove ci sono un numero limitato di esiti (ad esempio, i risultati di un lancio di dado). In quel contesto, la probabilità di ogni evento veniva spesso assegnata contando i casi favorevoli su quelli totali.
Tuttavia, in molti casi reali, lo spazio degli esiti non è finito, ma infinito (ad esempio, l’insieme degli interi, o addirittura la retta reale). In queste situazioni, la somma dei casi favorevoli su quelli totali non ha più senso o diventa tecnicamente inapplicabile. Per passare dal caso discreto a quello continuo, abbiamo quindi bisogno di strumenti più sofisticati.
Uno di questi strumenti è la \(\sigma\)-algebra, che ci aiuta a definire in maniera rigorosa quali sottoinsiemi di uno spazio possiamo considerare “misurabili” e a cui possiamo assegnare una probabilità. In combinazione con gli assiomi di Kolmogorov, la \(\sigma\)-algebra permette di estendere la teoria della probabilità dal caso discreto (discusso nel Capitolo 2) al caso continuo, dove la situazione è più delicata e non tutti i sottoinsiemi possono ricevere una probabilità.
Panoramica del capitolo
Perché non possiamo sempre “misurare tutto” nello spazio continuo.
Come la \(\sigma\)-algebra ci fornisce un metodo per assegnare le probabilità negli spazi continui.
In che modo la \(\sigma\)-algebra sia cruciale per soddisfare gli assiomi di Kolmogorov.
Le differenze principali rispetto al caso discreto.
ConsiglioPrerequisiti
Leggere il capitolo Probability Models del testo di Chan & Kroese (2025).
Leggere il capitolo Probability and counting di Introduction to Probability(Blitzstein & Hwang, 2019).
Per poter definire in modo rigoroso una probabilità, non basta elencare i possibili esiti dello spazio campionario \(\Omega\). Occorre anche stabilire quali insiemi di esiti possono essere considerati “eventi” a cui associare una probabilità. Questa collezione di insiemi prende il nome di \(\sigma\)-algebra e viene indicata con \(\mathcal{F}\).
Una \(\sigma\)-algebra \(\mathcal{F}\) su \(\Omega\) deve rispettare tre condizioni fondamentali:
Lo spazio campionario è sempre un evento:
\[
\Omega \in \mathcal{F}.
\]
In altre parole, l’evento “qualcosa accade” deve poter avere una probabilità, che sarà sempre pari a 1.
Chiusura rispetto al complemento:
\[
\text{Se } A \in \mathcal{F}, \quad \text{allora anche } A^c = \Omega \setminus A \in \mathcal{F}.
\]
Se ha senso parlare della probabilità di un evento \(A\), deve avere senso anche parlare della probabilità che \(A\)non si verifichi.
Se possiamo considerare come eventi \(A_1, A_2, \dots\), allora possiamo considerare anche l’evento “almeno uno di essi si verifica”.
Queste proprietà garantiscono che il sistema sia coerente: applicando operazioni logiche sugli eventi (come prendere il complemento o combinarli in un’unione), non si esce mai dal mondo degli eventi a cui possiamo assegnare una probabilità.
3.2 Relazione tra la \(\sigma\)-algebra e gli assiomi di Kolmogorov
La presenza della \(\sigma\)-algebra non è un dettaglio tecnico, ma un elemento essenziale per dare coerenza logica al modello probabilistico.
La \(\sigma\)-algebra stabilisce quali insiemi di esiti possono essere considerati eventi. Non tutti i sottoinsiemi dello spazio campionario devono necessariamente avere una probabilità: la \(\sigma\)-algebra individua quelli “ammissibili”.
Gli assiomi di Kolmogorov definiscono come la funzione di probabilità \(P\) deve comportarsi sugli eventi ammessi: non-negatività, normalizzazione e additività numerabile.
Senza la struttura della \(\sigma\)-algebra, l’assioma di additività numerabile non avrebbe senso rigoroso: non potremmo garantire che l’unione (anche infinita) di eventi appartenga ancora all’insieme degli eventi considerati.
In altre parole, la funzione \(P\) e la \(\sigma\)-algebra lavorano insieme: la prima assegna i valori di probabilità, la seconda assicura che le operazioni sugli eventi siano sempre lecite. Grazie a questa costruzione, il calcolo delle probabilità può essere esteso senza ambiguità sia a situazioni discrete (come il lancio di un dado) sia a quelle continue (come la misurazione di un tempo di reazione).
NotaEsempio
3.2.1 Costruzione di una \(\sigma\)-algebra discreta
Consideriamo lo spazio campionario discreto:
\[
\Omega = \{1,2,3\}.
\]
La \(\sigma\)-algebra discreta. In questo caso, la \(\sigma\)-algebra più naturale è quella discreta, cioè l’insieme di tutti i sottoinsiemi di \(\Omega\):
\[
\mathcal{F} = \bigl\{\varnothing, \{1\}, \{2\}, \{3\}, \{1,2\}, \{1,3\}, \{2,3\}, \Omega \bigr\}.
\] Questa collezione contiene sia l’insieme vuoto che lo spazio campionario stesso, oltre a ogni possibile combinazione dei tre esiti.
Verifica delle proprietà. Per accertarci che \(\mathcal{F}\) sia davvero una \(\sigma\)-algebra, controlliamo le tre condizioni fondamentali:
Inclusione di \(\Omega\) e dell’insieme vuoto: per costruzione, \(\Omega \in \mathcal{F}\) e \(\varnothing \in \mathcal{F}\).
Chiusura rispetto al complemento: se \(A \in \mathcal{F}\), allora anche il suo complemento \(A^c = \Omega \setminus A\) appartiene a \(\mathcal{F}\). Ad esempio, \({1,2}^c = {3}\) e \({3}^c = {1,2}\).
Chiusura rispetto alle unioni (anche numerabili): unendo sottoinsiemi di \(\mathcal{F}\) si ottiene sempre un altro sottoinsieme di \(\Omega\), dunque ancora in \(\mathcal{F}\). Per esempio:
\[
\{1\} \cup \{2\} = \{1,2\} \in \mathcal{F}, \qquad
\{1,3\} \cup \{2\} = \Omega \in \mathcal{F}.
\] Poiché \(\mathcal{F}\) coincide con l’insieme delle parti di \(\Omega\), queste proprietà sono automaticamente garantite.
Interpretazione intuitiva. In una \(\sigma\)-algebra discreta tutti gli eventi possibili sono ammessi.
L’evento “esce 1 o 2” è rappresentato da \({1,2}\).
L’evento “non esce 3” corrisponde allo stesso sottoinsieme \({1,2}\), che è il complemento di \({3}\).
In altre parole, non ci sono restrizioni: qualunque sottoinsieme di \(\Omega\) è un evento lecito a cui possiamo associare una probabilità.
Esempio di funzione di probabilità. Supponiamo di avere un dado equo a tre facce, in cui ciascun esito elementare ha probabilità uguale:
\[
P(\{1\}) = P(\{2\}) = P(\{3\}) = \tfrac{1}{3}.
\] Le probabilità degli eventi composti si ottengono per additività:
\[
P(\{1,2\}) = P(\{1\}) + P(\{2\}) = \tfrac{2}{3}.
\] Gli assiomi di Kolmogorov risultano rispettati:
\[
P(\Omega) = 1, \qquad P(\varnothing) = 0.
\]
3.3 Dal discreto al continuo
Dopo aver introdotto il concetto di \(\sigma\)-algebra e il suo ruolo negli assiomi di Kolmogorov, è utile distinguere tra il caso discreto e il caso continuo, che si differenziano soprattutto nella costruzione della \(\sigma\)-algebra.
3.3.1 Caso discreto
Quando lo spazio campionario\(\Omega\) è finito o numerabile (ad esempio, \({1, 2, 3, \dots}\)), la situazione è semplice:
la \(\sigma\)-algebra naturale coincide con l’insieme di tutti i sottoinsiemi di \(\Omega\);
ogni sottoinsieme può essere considerato un evento;
gli assiomi di Kolmogorov si applicano direttamente;
la probabilità di un singolo esito elementare è sempre maggiore o uguale a zero e, in molti casi, può essere positiva (ad esempio \(P({3}) = 1/6\) nel lancio di un dado).
In questo contesto non sorgono particolari difficoltà: tutti gli eventi possibili sono automaticamente “misurabili”.
3.3.2 Caso continuo
Quando invece \(\Omega\) è un insieme non numerabile (ad esempio l’intervallo \([0,1]\) o l’insieme dei numeri reali \(\mathbb{R}\)), la costruzione è più delicata. Non è infatti possibile includere tutti i sottoinsiemi di \(\Omega\): alcuni insiemi sono “troppo irregolari” e non possono essere trattati in modo coerente. Un esempio celebre è l’insieme di Vitali, che porta a contraddizioni se si tenta di attribuirgli una probabilità. Inoltre, nei modelli continui la probabilità di un singolo punto è generalmente pari a zero: ciò che ha senso misurare sono intervalli o insiemi di intervalli.
3.3.3 La \(\sigma\)-algebra di Borel
Per gestire correttamente il caso continuo, si utilizza la \(\sigma\)-algebra di Borel. Questa non contiene tutti i sottoinsiemi di \(\Omega\), ma soltanto quelli che si possono costruire a partire dagli intervalli attraverso un numero finito o numerabile di operazioni di unione, intersezione e complemento.
Nella \(\sigma\)-algebra di Borel sono
inclusi gli intervalli come \([a,b]\), insiemi del tipo \((-\infty,0]\) e unioni numerabili di intervalli;
esclusi gli insiemi “patologici” come quello di Vitali, che non sono misurabili.
3.3.4 Confronto diretto
Caratteristica
Caso discreto
Caso continuo
Struttura di \(\Omega\)
Finito o numerabile (\({1,2,3,\dots}\))
Non numerabile (\(\[0,1]\), \(\mathbb{R}\), ecc.)
\(\sigma\)-algebra naturale
Insieme di tutte le parti di \(\Omega\)
\(\sigma\)-algebra di Borel
Esempio di evento
\({1}\), \({2,3}\)
\([a,b]\), \((-\infty,0]\), unioni di intervalli
Probabilità di un punto
Può essere positiva (es. \(1/6\))
In genere \(0\)
Problemi di misurabilità
Nessuno
Alcuni insiemi non sono misurabili
3.3.5 Un’idea intuitiva
Nel discreto possiamo immaginare di “contare” le probabilità sugli elementi di \(\Omega\).
Nel continuo invece dobbiamo “misurare” aree sotto una curva: per questo servono strutture matematiche più raffinate come la \(\sigma\)-algebra di Borel, che garantisce coerenza e impedisce paradossi.
Riflessioni conclusive
In questo capitolo, abbiamo esplorato come la probabilità possa essere estesa dal caso discreto, dove possiamo tranquillamente lavorare con insiemi finiti, al caso continuo, dove ci si confronta con spazi infinitamente densi. Abbiamo compreso che, in questa transizione, la \(\sigma\)-algebra gioca un ruolo cruciale, definendo quali sottoinsiemi sono “misurabili”, ovvero a quali possiamo assegnare una probabilità senza incappare in contraddizioni logiche o matematiche.
Attraverso la formalizzazione delle \(\sigma\)-algebre e l’applicazione degli assiomi di Kolmogorov, abbiamo stabilito le basi per un sistema probabilistico coerente e completo. Nel caso discreto, la costruzione della \(\sigma\)-algebra è diretta, potendo includere tutti i sottoinsiemi di uno spazio campionario finito o numerabile. Tuttavia, nel caso continuo, abbiamo appreso che non tutti i sottoinsiemi possono essere misurati con coerenza. La \(\sigma\)-algebra di Borel emerge come uno strumento essenziale per navigare questo terreno più complesso.
La distinzione tra il caso discreto e il continuo ci dimostra come la matematica possa affrontare con eleganza problemi di diversa natura. Nel discreto, ogni evento può avere una probabilità positiva e ogni sottoinsieme è misurabile. Nel continuo, invece, dobbiamo procedere con cautela, selezionando gli insiemi che possiamo “misurare” in modo coerente. In conclusione, la \(\sigma\)-algebra non è soltanto un artificio tecnico, ma un elemento fondamentale che permette di costruire un ponte tra il discreto e il continuo, garantendo la coerenza della teoria della probabilità.
ConsiglioEsercizio
Considera i seguenti esercizi basati sulla Satisfaction with Life Scale (SWLS).
Quali sottoinsiemi sono eventi ammissibili?
Supponiamo che i punteggi SWLS raccolti siano numeri interi tra 5 e 35.
Tra i seguenti insiemi, quali potrebbero essere inclusi in una \(\sigma\)-algebra su questo spazio campionario?
A: Tutti gli studenti con punteggio pari o superiore a 25.
B: Studenti con punteggio pari.
C: Studenti con punteggio multiplo di 3.
D: Studenti con punteggio superiore all’altezza media degli unicorni.
Quale criterio potremmo usare per decidere se un insieme è ammissibile in una \(\sigma\)-algebra?
Chiusura rispetto al complemento
Se l’evento A rappresenta gli studenti con punteggio SWLS ≥ 25, quale sarà l’evento complementare Aᶜ?
Esprimilo in termini di punteggi.
Se il 40% degli studenti ha punteggi ≥ 25, qual è la probabilità empirica dell’evento Aᶜ?
Esercizi sulle Operazioni tra Eventi 3. Unione di Eventi
Consideriamo i seguenti eventi:
B: “Studente ha un punteggio SWLS pari”.
C: “Studente ha un punteggio multiplo di 3”.
Elenca i punteggi che appartengono a B ∪ C (cioè lo studente ha un punteggio pari o multiplo di 3).
Se nel campione di 15 studenti, 8 hanno un punteggio in B e 5 in C, e 3 di essi appartengono a entrambi gli insiemi, calcola la probabilità empirica di B ∪ C usando la formula dell’unione.
Intersezione e additività numerabile
Se un evento D rappresenta gli studenti con punteggio ≥20 e ≤30, possiamo dire che è incluso nella \(\sigma\)-algebra se B e C lo sono? Perché?
Calcola l’intersezione B ∩ C e verifica se i dati raccolti rispettano l’additività.
Esercizi sugli Assiomi di Kolmogorov 5. Assioma della Normalizzazione
Supponiamo di assegnare probabilità a eventi definiti sui punteggi SWLS dei 15 studenti.
Se la somma delle probabilità di tutti gli eventi possibili non è 1, cosa significa?
Dai un esempio di una distribuzione di probabilità su SWLS che rispetti la normalizzazione.
Assioma dell’Additività
Supponiamo che P(A) = 0.4 e P(Aᶜ) = 0.6.
Verifica se questa distribuzione soddisfa l’assioma di Kolmogorov.
Se introduciamo un terzo evento E (punteggi tra 15 e 20), come possiamo calcolare P(A ∪ E) rispettando gli assiomi?
Esercizi su Spazi Misurabili e Applicazioni
Definire uno Spazio Misurabile
Consideriamo lo spazio campionario \(\Omega\) dei punteggi SWLS e la \(\sigma\)-algebra \(\mathcal{F}\) formata dai sottoinsiemi:
{Punteggi pari}
{Punteggi multipli di 5}
{Punteggi ≥ 25}
Questa collezione rispetta le condizioni di una \(\sigma\)-algebra? Perché?
Esempio di Probabilità in un Caso Continuo
Se invece di punteggi discreti avessimo misurato il tempo di risposta a un questionario SWLS (espresso in secondi con valori reali), il modello discreto funzionerebbe?
Prova a descrivere un possibile evento misurabile in un caso continuo e spiega perché sarebbe più complesso da gestire rispetto al caso discreto.
ConsiglioSoluzioni
1. Quali sottoinsiemi sono eventi ammissibili?
Gli insiemi che possono essere inclusi in una \(\sigma\)-algebra devono essere chiusi rispetto a unioni, intersezioni e complementi.
A (punteggi ≥ 25), B (punteggi pari), e C (punteggi multipli di 3) possono essere inclusi in una \(\sigma\)-algebra, perché sono definiti su criteri chiari e permettono operazioni insiemistiche.
D (punteggi superiori alla media degli unicorni) non è un evento misurabile, poiché dipende da valori soggettivi e non da una regola fissa applicabile all’intero spazio campionario.
2. Chiusura rispetto al complemento
L’evento complementare di A (punteggi ≥ 25) è Aᶜ (punteggi < 25).
Se la probabilità empirica di A è 0.4, la probabilità empirica di Aᶜ è: \[ P(Aᶜ) = 1 - P(A) = 1 - 0.4 = 0.6 \]
Soluzioni agli Esercizi sulle Operazioni tra Eventi
3. Unione di Eventi
I punteggi in B sono {6, 8, 10, 12, …, 34} e quelli in C sono {6, 9, 12, …, 33}.
B ∪ C è l’insieme {6, 8, 9, 10, 12, …, 34}.
Applicando la formula dell’unione: \[ P(B ∪ C) = P(B) + P(C) - P(B ∩ C) \]\[ P(B ∪ C) = \frac{8}{15} + \frac{5}{15} - \frac{3}{15} = \frac{10}{15} = 0.667 \]
4. Intersezione e additività numerabile
L’evento D (20 ≤ SWLS ≤ 30) è un sottoinsieme di B ∪ C, quindi se B e C sono inclusi in una \(\sigma\)-algebra, anche D lo sarà.
B ∩ C (punteggi pari e multipli di 3) = {6, 12, 18, …}.
Dalla distribuzione empirica, P(B ∩ C) = \(\frac{3}{15} = 0.2\).
Soluzioni agli Esercizi sugli Assiomi di Kolmogorov
5. Assioma della Normalizzazione
Se la somma delle probabilità degli eventi possibili non è 1, significa che il sistema di probabilità è mal definito.
Esempio corretto di distribuzione: \[ P(A) = 0.4, P(B) = 0.3, P(Aᶜ) = 0.6, P(Bᶜ) = 0.7 \] Tutti gli eventi coprono l’intero spazio campionario senza sovrapposizioni non gestite.
6. Assioma dell’Additività
Se P(A) = 0.4 e P(Aᶜ) = 0.6, allora: \[ P(A) + P(Aᶜ) = 1 \] Quindi gli assiomi di Kolmogorov sono rispettati.
Se introduciamo un evento E (SWLS tra 15 e 20) con P(E) = 0.2, possiamo usare la formula dell’unione per calcolare P(A ∪ E) se A ed E non sono disgiunti.
Soluzioni agli Esercizi su Spazi Misurabili e Applicazioni
7. Definire uno Spazio Misurabile
L’insieme \(\mathcal{F}\) con {Punteggi pari, Punteggi multipli di 5, Punteggi ≥ 25} rispetta:
Inclusione di \(\Omega\).
Chiusura rispetto al complemento.
Chiusura rispetto all’unione.
Quindi è una \(\sigma\)-algebra valida.
8. Probabilità nel Caso Continuo
Se misurassimo tempo di risposta al questionario SWLS in secondi (con valori reali), avremmo bisogno di una densità di probabilità anziché probabilità discrete.
Un evento misurabile potrebbe essere: “Tempo di risposta compreso tra 10 e 15 secondi”.
La probabilità di un singolo valore (es. esattamente 12 secondi) sarebbe zero nel caso continuo.