35  Probabilità congiunta

Prerequisiti

Concetti e Competenze Chiave

Preparazione del Notebook

here::here("code", "_common.R") |> 
  source()

35.1 Introduzione

In questo capitolo ci proponiamo di analizzare in dettaglio il concetto di probabilità congiunta, focalizzando l’attenzione sul caso di variabili aleatorie discrete. La probabilità congiunta rappresenta la misura della probabilità che due o più eventi si verifichino simultaneamente.

35.2 Funzione di Probabilità Congiunta

Finora ci siamo concentrati sulla probabilità associata a un singolo evento o, più precisamente, a un singolo valore assunto da una variabile aleatoria. Tuttavia, in molti contesti, siamo interessati a studiare la relazione tra due o più eventi o variabili aleatorie. La funzione di probabilità congiunta ci permette di estendere il concetto di probabilità al caso di più variabili aleatorie, descrivendo la probabilità che queste assumano specifici valori contemporaneamente.

Spesso, un esperimento aleatorio è descritto attraverso più di una variabile aleatoria. Ecco alcuni esempi:

  1. Altezze di un gruppo di persone: Supponiamo di selezionare casualmente \(n = 10\) persone e di osservare le loro altezze. Siano \(X_1, X_2, \dots, X_n\) le altezze individuali. In questo caso, siamo interessati a capire come le altezze dei singoli individui si relazionano tra loro.

  2. Lancio ripetuto di una moneta: Consideriamo un esperimento in cui lanciamo una moneta più volte. Definiamo \(X_i = 1\) se l’\(i\)-esimo lancio risulta in “testa” e \(X_i = 0\) altrimenti. L’esperimento è quindi descritto da una sequenza di variabili aleatorie di Bernoulli \(X_1, X_2, \dots\). Qui, potremmo voler studiare la probabilità che si verifichino determinate sequenze di risultati.

  3. Peso e altezza di una persona: Selezioniamo casualmente una persona da una grande popolazione e misuriamo il suo peso \(X\) e la sua altezza \(Y\). In questo caso, siamo interessati a capire come peso e altezza sono correlati, ad esempio, se persone più alte tendono a pesare di più.

Per descrivere il comportamento delle variabili aleatorie in questi esperimenti, non è sufficiente specificare la funzione di densità di probabilità (PDF) o la funzione di massa di probabilità (PMF) delle singole variabili. È necessario anche considerare l’interazione tra le variabili aleatorie. Ad esempio:

  • Nel terzo esperimento (peso e altezza), se l’altezza \(Y\) è grande, è probabile che anche il peso \(X\) sia grande. Questo suggerisce una dipendenza tra le due variabili.
  • Nei primi due esperimenti, invece, è ragionevole assumere che le variabili aleatorie siano indipendenti: conoscere il valore di una variabile non fornisce informazioni aggiuntive sulle altre.

Per catturare queste relazioni, abbiamo bisogno di specificare la distribuzione congiunta delle variabili aleatorie. La distribuzione congiunta descrive la probabilità che le variabili assumano specifici valori simultaneamente. Ad esempio:

  • Nel caso discreto, la funzione di massa di probabilità congiunta \(p(x, y)\) fornisce la probabilità che \(X = x\) e \(Y = y\) contemporaneamente.
  • Nel caso continuo, la funzione di densità di probabilità congiunta \(f(x, y)\) descrive la densità di probabilità associata ai valori \(X = x\) e \(Y = y\).

Consideriamo un esempio psicologico: supponiamo di voler studiare la relazione tra il punteggio \(X\) ottenuto in un test cognitivo e il livello di ansia \(Y\) riportato da un gruppo di partecipanti. La distribuzione congiunta di \(X\) e \(Y\) ci permette di rispondere a domande come:

  • Qual è la probabilità che un partecipante con un alto livello di ansia ottenga un punteggio basso nel test cognitivo?
  • Esiste una relazione tra ansia e prestazione cognitiva, e se sì, come possiamo quantificarla?

In questo contesto, la distribuzione congiunta ci aiuta a modellare la relazione tra due variabili psicologiche, fornendo una base per analisi più approfondite, come lo studio della correlazione o della dipendenza tra di esse.

In sintesi, la funzione di probabilità congiunta è uno strumento essenziale per analizzare la relazione tra due o più variabili aleatorie. Che si tratti di altezze e pesi, risultati di lanci di monete, o variabili psicologiche come ansia e prestazione cognitiva, la distribuzione congiunta ci permette di comprendere come queste variabili interagiscono e influenzano reciprocamente i loro valori.

35.3 Distribuzione Congiunta

Definizione 35.1 (Definizione: Distribuzione Congiunta) La distribuzione congiunta di due variabili aleatorie \(X\) e \(Y\) descrive la probabilità che \(X\) e \(Y\) assumano specifici valori simultaneamente. Nel caso discreto, è rappresentata dalla funzione di massa di probabilità congiunta \(p(x, y)\), mentre nel caso continuo dalla funzione di densità di probabilità congiunta \(f(x, y)\).

35.3.1 Proprietà della Distribuzione Congiunta

Una distribuzione di probabilità congiunta deve soddisfare le seguenti proprietà:

  1. Non negatività:
    Per ogni coppia di valori \((x_i, y_j)\), la probabilità congiunta è compresa tra 0 e 1: \[ 0 \leq P(x_i, y_j) \leq 1. \]

  2. Normalizzazione:
    La somma delle probabilità congiunte su tutte le possibili coppie \((x_i, y_j)\) deve essere uguale a 1: \[ \sum_{i} \sum_{j} P(x_i, y_j) = 1. \]

35.3.2 Calcolo della Probabilità di Eventi Specifici

Data la distribuzione di probabilità congiunta, è possibile determinare la probabilità di eventi definiti in termini delle variabili aleatorie \(X\) e \(Y\). Ad esempio, per calcolare la probabilità che \(X + Y \leq 1\), si sommano le probabilità di tutte le coppie \((x, y)\) che soddisfano questa condizione.

In conclusione, la distribuzione congiunta è uno strumento fondamentale per analizzare la relazione tra due o più variabili aleatorie. Attraverso di essa, possiamo calcolare probabilità di eventi complessi e comprendere come le variabili interagiscono tra loro.

Esempio 35.1 Supponiamo di avere la seguente distribuzione congiunta discreta per \(X\) e \(Y\):

\(Y = 0\) \(Y = 1\) \(Y = 2\)
\(X = 0\) \(\frac{1}{8}\) \(\frac{1}{8}\) \(\frac{1}{8}\)
\(X = 1\) \(\frac{1}{8}\) \(\frac{1}{8}\) \(\frac{1}{8}\)
\(X = 2\) \(\frac{1}{8}\) \(\frac{1}{8}\) \(0\)

Per calcolare \(P(X + Y \leq 1)\), identifichiamo le coppie \((x, y)\) che soddisfano \(x + y \leq 1\):

  • \((0, 0)\),
  • \((0, 1)\),
  • \((1, 0)\).

La probabilità è quindi: \[ P(X + Y \leq 1) = P(0, 0) + P(0, 1) + P(1, 0) = \frac{1}{8} + \frac{1}{8} + \frac{1}{8} = \frac{3}{8}. \]

Esempio 35.2 Per comprendere meglio il concetto di probabilità congiunta, immaginiamo di lanciare tre monete. Tutti i possibili risultati di questo esperimento (ad esempio, tre teste, due teste e una croce, ecc.) costituiscono quello che chiamiamo spazio campionario. In questo caso, lo spazio campionario \(\Omega\) è dato da:

\[ \Omega = \{TTT, TTC, TCT, CTT, CCT, CTC, TCC, CCC\}, \]

dove \(T\) indica “testa” e \(C\) indica “croce”. Assumendo che ogni lancio sia indipendente dagli altri, ogni risultato nello spazio campionario \(\Omega\) ha la stessa probabilità di verificarsi, ovvero \(1/8\).

Definiamo ora le seguenti variabili casuali sullo spazio campionario \(\Omega\):

  • \(X \in \{0, 1, 2, 3\}\) rappresenta il numero totale di teste ottenute nei tre lanci.
  • \(Y \in \{0, 1\}\) indica se il primo lancio ha dato testa (\(1\)) oppure croce (\(0\)).

La tabella seguente mostra lo spazio campionario con i valori di \(X\) e \(Y\) associati a ciascun esito, insieme alla probabilità di ciascun evento \(\omega\):

\(\omega\) \(X\) \(Y\) \(P(\omega)\)
\(\omega_1\) = TTT 3 1 1/8
\(\omega_2\) = TTC 2 1 1/8
\(\omega_3\) = TCT 2 1 1/8
\(\omega_4\) = CTT 2 0 1/8
\(\omega_5\) = CCT 1 0 1/8
\(\omega_6\) = CTC 1 0 1/8
\(\omega_7\) = TCC 1 1 1/8
\(\omega_8\) = CCC 0 0 1/8

Ora possiamo determinare la probabilità congiunta per ogni coppia \((X, Y)\), che rappresenta la probabilità di ottenere un determinato numero di teste \(X\) e un determinato risultato per il primo lancio \(Y\). Ad esempio:

\[P(X=0, Y=0) = P(\text{CCC}) = 1/8,\]

e così via per le altre coppie.

Le probabilità congiunte per tutte le possibili combinazioni \((X, Y)\) sono calcolate come segue:

\[ \begin{aligned} P(X = 0, Y = 0) &= 1/8, \\ P(X = 1, Y = 0) &= P(\text{CCT}) + P(\text{CTC}) = 1/4, \\ P(X = 1, Y = 1) &= P(\text{TCC}) = 1/8, \\ P(X = 2, Y = 0) &= P(\text{CTT}) = 1/8, \\ P(X = 2, Y = 1) &= P(\text{TTC}) + P(\text{TCT}) = 1/4, \\ P(X = 3, Y = 1) &= P(\text{TTT}) = 1/8. \end{aligned} \]

Queste probabilità costituiscono la distribuzione di probabilità congiunta delle variabili casuali \(X\) (numero di teste) e \(Y\) (testa al primo lancio). Questa distribuzione fornisce un quadro completo delle probabilità per tutte le combinazioni di risultati di queste due variabili.

35.4 Marginalizzazione

Immagina di condurre uno studio sul livello di stress tra studenti universitari, raccogliendo dati su variabili come l’anno di corso, il genere, il supporto sociale e il livello di stress. Se desideri comprendere come il livello di stress varia in funzione dell’anno di corso, indipendentemente dal genere e dal supporto sociale, puoi utilizzare la marginalizzazione.

La marginalizzazione consente di ottenere una distribuzione di probabilità focalizzata su una o più variabili di interesse, “eliminando” dal calcolo le variabili non rilevanti. Nel nostro esempio, per ottenere la distribuzione marginale del livello di stress rispetto all’anno di corso, occorre sommare (o integrare, nel caso di variabili continue) le probabilità associate a tutte le combinazioni di genere e supporto sociale, mantenendo fisso l’anno di corso. In questo modo, otteniamo una distribuzione che descrive come il livello di stress varia solo in relazione all’anno di corso.

Il termine “marginalizzazione” deriva dalle tabelle di contingenza: quando rappresentiamo una distribuzione di probabilità congiunta in una tabella, le probabilità marginali—che descrivono la distribuzione di una variabile indipendentemente dalle altre—si trovano nei margini della tabella (ovvero nelle righe e colonne finali).

35.4.1 Formalizzazione della Marginalizzazione

Data una distribuzione di probabilità congiunta \(P(X, Y)\) di due variabili casuali \(X\) e \(Y\), possiamo ottenere la distribuzione marginale di \(X\) sommando tutte le probabilità associate a \(Y\). Formalmente:

\[ P(X = x) = \sum_y P(X = x, Y = y), \]

dove \(P(X = x, Y = y)\) rappresenta la probabilità congiunta di \(X\) e \(Y\). La marginalizzazione garantisce inoltre che le distribuzioni siano normalizzate, cioè che le somme delle probabilità marginali per ciascuna variabile siano uguali a 1:

\[ \sum_x P(X = x) = 1 \quad \text{e} \quad \sum_y P(Y = y) = 1. \]

Nel caso di variabili continue, questa operazione di somma viene sostituita dall’integrazione.

Per chiarire, consideriamo il seguente esempio. Supponiamo di studiare l’efficacia di una terapia cognitivo-comportamentale per l’ansia, includendo variabili come l’età dei partecipanti e il livello iniziale di ansia. Se vogliamo valutare l’efficacia della terapia a prescindere dall’età e dal livello di ansia iniziale, marginalizziamo rispetto a queste due variabili, ottenendo così una distribuzione che riflette solo l’associazione tra terapia e riduzione dell’ansia.

In sintesi, la marginalizzazione:

  • permette di estrarre distribuzioni di probabilità per variabili specifiche, “dimenticando” quelle non rilevanti;
  • consiste nel sommare o integrare le probabilità attraverso tutte le possibili combinazioni delle variabili non rilevanti, concentrandosi su quelle di interesse.

In conclusione, la marginalizzazione è uno strumento essenziale per l’analisi statistica, facilitando lo studio delle relazioni tra variabili complesse e aiutandoci a isolare gli effetti delle variabili di interesse in modo rigoroso.

Esempio 35.3 Per fare un esempio, prendiamo come riferimento l’esperimento del lancio di tre monete equilibrate descritto precedentemente. Per calcolare le probabilità marginali di \(X\) e \(Y\), sommiamo le probabilità congiunte su una dimensione. La probabilità marginale di \(X\), \(P_X\), si ottiene sommando le probabilità lungo le colonne per ciascun valore fisso di \(X\); analogamente, la probabilità marginale di \(Y\), \(P_Y\), si calcola sommando le probabilità lungo le righe per ciascun valore fisso di \(Y\).

La tabella seguente mostra la distribuzione di probabilità congiunta \(P(X, Y)\) e le probabilità marginali \(P(X)\) e \(P(Y)\):

\(x \setminus y\) 0 1 \(P(x)\)
0 1/8 0 1/8
1 2/8 1/8 3/8
2 1/8 2/8 3/8
3 0 1/8 1/8
\(P(y)\) 4/8 4/8 1.0

35.4.2 Marginalizzazione per Variabili Casuali Continue

Nell’ambito della statistica bayesiana, il concetto di marginalizzazione gioca un ruolo cruciale. Un esempio di equazione che emerge da questo processo è:

\[ p(y) = \int_{\theta} p(y, \theta) \, d\theta = \int_{\theta} p(y \mid \theta) p(\theta) \, d\theta, \]

dove \(y\) e \(\theta\) sono variabili casuali continue, con \(y\) che rappresenta i dati osservati e \(\theta\) i parametri di un modello statistico. Questa equazione illustra come, in un contesto continuo, la marginalizzazione possa essere vista come l’estensione dell’approccio discreto a un continuum di valori per le variabili in esame.

35.5 Indipendenza tra Variabili Casuali

L’indipendenza tra variabili casuali è un concetto fondamentale in statistica e probabilità, parallelo all’idea di indipendenza tra eventi. Due variabili casuali si considerano indipendenti quando l’informazione su una non altera in alcun modo la distribuzione di probabilità dell’altra. Questa sezione offre una formalizzazione dell’indipendenza tra due variabili casuali discrete, basata sulla loro distribuzione di probabilità congiunta.

35.5.1 Definizione di Indipendenza

Due variabili casuali \(X\) e \(Y\), con una distribuzione congiunta, sono definite indipendenti se, e solo se, per ogni coppia di valori \((x, y)\) si verifica che:

\[ P_{X, Y}(x, y) = P_X(x) \cdot P_Y(y). \]

In termini pratici, ciò significa che se \(X\) e \(Y\) sono variabili casuali discrete indipendenti, la loro distribuzione di probabilità congiunta è il prodotto delle rispettive distribuzioni di probabilità marginali. Se invece \(P_{X, Y}(x, y) \neq P_X(x) \cdot P_Y(y)\), le variabili non sono indipendenti e si dicono associate o dipendenti.

Questo concetto si applica anche alle variabili casuali continue, mantenendo la stessa logica: l’indipendenza si verifica quando la funzione di densità congiunta è il prodotto delle funzioni di densità marginali.

35.5.2 Associazione tra Variabili Casuali

Quando due variabili casuali non sono indipendenti, si descrivono come associate o dipendenti. In questo contesto, è utile introdurre il concetto di covarianza (e correlazione) come misura del grado di associazione lineare tra due variabili casuali. La covarianza e la correlazione quantificano in che modo la variazione di una variabile è associata alla variazione dell’altra, fornendo un indice della loro interdipendenza lineare.

Riepilogando, l’indipendenza tra variabili casuali è un concetto chiave per comprendere le relazioni tra fenomeni aleatori. Riconoscere se due variabili sono indipendenti o associate è fondamentale per l’analisi statistica e per la modellazione di relazioni causali o di correlazione tra variabili.

35.6 Covarianza

La covarianza è un parametro statistico che quantifica il grado e la direzione della relazione lineare tra due variabili casuali, \(X\) e \(Y\). In termini semplici, misura come le variazioni di una variabile si accompagnano a quelle dell’altra. Per esempio, considerando l’altezza e il peso di giraffe, scopriremmo che queste due misure tendono ad aumentare insieme, evidenziando così una covarianza positiva. La covarianza è denotata come \(Cov(X, Y) = \sigma_{xy}\).

35.6.1 Definizione di Covarianza

Definizione 35.2 La covarianza tra due variabili casuali \(X\) e \(Y\) è definita come:

\[ Cov(X, Y) = \mathbb{E}\left[\left(X - \mathbb{E}[X]\right) \left(Y - \mathbb{E}[Y]\right)\right], \]

dove \(\mathbb{E}[X]\) e \(\mathbb{E}[Y]\) rappresentano i valori attesi (o medie) di \(X\) ed \(Y\), rispettivamente.

In termini più espliciti, la covarianza può essere espressa come:

\[ Cov(X, Y) = \sum_{(x, y) \in \Omega} (x - \mu_X) (y - \mu_Y) f(x, y), \]

dove \(\mu_X\) e \(\mu_Y\) sono le medie di \(X\) ed \(Y\), e \(f(x, y)\) è la funzione di probabilità congiunta delle variabili.

Questa definizione mostra una stretta analogia con la varianza, che è la covarianza di una variabile con se stessa:

\[ \mathbb{V}(X) = Cov(X, X). \]

Inoltre, la covarianza può essere calcolata attraverso la relazione:

\[ Cov(X, Y) = \mathbb{E}(XY) - \mathbb{E}(X)\mathbb{E}(Y). \]

35.6.2 Dimostrazione

La formula alternativa per la covarianza si dimostra come segue:

\[ \begin{align} Cov(X, Y) &= \mathbb{E}\left[\left(X - \mathbb{E}[X]\right) \left(Y - \mathbb{E}[Y]\right)\right]\\ &= \mathbb{E}(XY) - \mathbb{E}(X)\mathbb{E}(Y). \end{align} \]

Esempio 35.4 Consideriamo le variabili casuali \(X\) e \(Y\) con medie \(\mu_X = 1.5\) e \(\mu_Y = 0.5\). La covarianza di \(X\) e \(Y\) si calcola come:

\[ Cov(X, Y) = \sum_{(x, y) \in \Omega} (x - \mu_X) (y - \mu_Y) f(x, y) = \frac{1}{4}. \]

Questo risultato si può ottenere anche dalla formula alternativa, calcolando prima \(\mathbb{E}(XY)\):

\[ \mathbb{E}(XY) = 1.0. \]

Allora, la covarianza tra \(X\) e \(Y\) è:

\[ Cov(X, Y) = 1 - 1.5 \cdot 0.5 = 0.25. \]

Esempio 35.5 Per calcolare la covarianza \(Cov(X, Y)\) in R, consideriamo l’esempio in cui \(X\) è il numero totale di teste che si ottiene dal lancio di tre monete equilibrate e \(Y\) è il risultato del primo lancio (testa = 1, croce = 0). Procediamo creando il prodotto cartesiano di tutti i possibili valori di \(X\) e \(Y\).

# Creare il prodotto cartesiano di X (c3) e Y (c1)
c3 <- 0:3  # Numero totale di teste possibili
c1 <- 0:1  # Risultato del primo lancio (0 = croce, 1 = testa)
sample <- expand.grid(c1 = c1, c3 = c3)
sample
#>   c1 c3
#> 1  0  0
#> 2  1  0
#> 3  0  1
#> 4  1  1
#> 5  0  2
#> 6  1  2
#> 7  0  3
#> 8  1  3

Il primo numero di ogni coppia rappresenta il valore di \(Y\), mentre il secondo rappresenta il valore di \(X\). Tuttavia, queste coppie \((X, Y)\) non hanno tutte la stessa probabilità di verificarsi. La probabilità associata a ciascuna coppia è data dai seguenti valori: \(1/8, 2/8, 1/8, 0, 0, 1/8, 2/8, 1/8\). Questa è la distribuzione di massa di probabilità congiunta delle variabili casuali \(X\) e \(Y\). Applicando la formula per la covarianza:

\[ Cov(X, Y) = \sum_{i=1}^n (X_i - E[X])(Y_i - E[Y]) P(X_i, Y_i) \]

Calcoliamo la covarianza in R:

# Probabilità di ogni coppia (X, Y)
pmf <- c(1 / 8, 2 / 8, 1 / 8, 0, 0, 1 / 8, 2 / 8, 1 / 8)

# Calcolo della covarianza
res <- c()
for (i in 1:nrow(sample)) {
  res <- c(res, (sample$c1[i] - 0.5) * (sample$c3[i] - 1.5) * pmf[i])
}

# Somma dei prodotti ponderati
covariance <- sum(res)
covariance
#> [1] -0.125

La covarianza tra \(X\) e \(Y\) è dunque uguale a \(-0.125\).

35.7 Correlazione

Mentre la covarianza fornisce un’indicazione della tendenza di due variabili casuali a variare insieme, essa è influenzata dalle unità di misura delle variabili, rendendo difficile valutare l’intensità della loro relazione lineare. Per ovviare a questo, si utilizza la correlazione, che normalizza la covarianza attraverso le deviazioni standard delle variabili, offrendo così una misura standardizzata dell’associazione lineare tra di esse.

Definizione 35.3 Il coefficiente di correlazione tra due variabili casuali \(X\) e \(Y\), denotato come \(\rho(X,Y)\) o \(\rho_{X,Y}\), è definito come:

\[ \rho(X,Y) = \frac{Cov(X,Y)}{\sqrt{\mathbb{V}(X)\mathbb{V}(Y)}}, \]

dove \(\mathbb{V}(X)\) e \(\mathbb{V}(Y)\) rappresentano le varianze di \(X\) e \(Y\), rispettivamente.

Il coefficiente di correlazione \(\rho_{xy}\) è un valore adimensionale, ovvero non dipende dalle unità di misura delle variabili, e varia nell’intervallo \(-1 \leq \rho \leq 1\).

35.8 Proprietà

  • Covarianza con una Costante: La covarianza tra una variabile aleatoria \(X\) e una costante \(c\) è sempre nulla: \(Cov(c, X) = 0\).
  • Simmetria: La covarianza è simmetrica: \(Cov(X,Y) = Cov(Y,X)\).
  • Intervallo di Correlazione: Il coefficiente di correlazione \(\rho\) varia tra -1 e 1: \(-1 \leq \rho(X,Y) \leq 1\).
  • Indipendenza dalle Unità di Misura: La correlazione è indipendente dalle unità di misura: \(\rho(aX, bY) = \rho(X,Y)\) per ogni \(a, b > 0\).
  • Relazione Lineare Perfetta: Se \(Y = a + bX\) è una funzione lineare di \(X\), allora \(\rho(X,Y) = \pm 1\), a seconda del segno di \(b\).
  • Covarianza e Costanti: La covarianza tra \(X\) e \(Y\), ciascuna moltiplicata per una costante, è \(Cov(aX, bY) = ab \, Cov(X,Y)\).
  • Varianza della Somma/Differenza: \(\mathbb{V}(X \pm Y) = \mathbb{V}(X) + \mathbb{V}(Y) \pm 2Cov(X,Y)\).
  • Covarianza e Somma di Variabili: \(Cov(X + Y, Z) = Cov(X,Z) + Cov(Y,Z)\).
  • Varianza di una Somma di Variabili Aleatorie: Per variabili aleatorie \(X_1, \dots, X_n\), si ha \(\mathbb{V}(\sum_{i=1}^n X_i) = \sum_{i=1}^n \mathbb{V}(X_i) + 2\sum_{i<j} Cov(X_i, X_j)\).
  • Covarianza e Somme di Prodotti: \(Cov(\sum_{i=1}^n a_i X_i, \sum_{j=1}^m b_j Y_j) = \sum_{i=1}^n \sum_{j=1}^m a_i b_j Cov(X_i, Y_j)\).
  • Indipendenza e Covarianza di Somme: Se \(X_1, X_2, \dots, X_n\) sono indipendenti, allora \(Cov(\sum_{i=1}^n a_i X_i, \sum_{j=1}^n b_j X_j) = \sum_{i=1}^n a_i b_i \mathbb{V}(X_i)\).

35.8.1 Incorrelazione

Due variabili casuali \(X\) ed \(Y\) si dicono incorrelate, o linearmente indipendenti, se la loro covarianza è nulla:

\[ Cov(X,Y) = \mathbb{E}[(X - \mu_X)(Y - \mu_Y)] = 0, \]

equivalente a dire che \(\rho_{XY} = 0\) e \(\mathbb{E}(XY) = \mathbb{E}(X)\mathbb{E}(Y)\).

Questa condizione indica una forma di indipendenza più debole rispetto all’indipendenza stocastica. Tuttavia, \(Cov(X, Y) = 0\) non implica necessariamente che \(X\) ed \(Y\) siano stocasticamente indipendenti.

Esempio 35.6 Consideriamo una distribuzione di probabilità congiunta di due variabili aleatorie, \(X\) e \(Y\), definita come:

\[ f_{XY}(x,y) = \left\{ \begin{array}{ll} \frac{1}{4} & \text{per } (x,y) \in \{(0,0), (1,1), (1, -1), (2,0) \}, \\ 0 & \text{altrimenti.} \end{array} \right. \]

Questo implica che le variabili aleatorie \(X\) e \(Y\) assumono valori specifici con probabilità uniforme solo per determinate coppie \((x, y)\) e zero in tutti gli altri casi.

Distribuzioni Marginali

La distribuzione marginale di \(X\) si ottiene sommando le probabilità congiunte su tutti i possibili valori di \(Y\), e viceversa per \(Y\). Le distribuzioni marginali risultano essere:

  • Per \(X\):

    \[ f_X(x) = \left\{ \begin{array}{ll} \frac{1}{4} & \text{per } x=0, \\ \frac{1}{2} & \text{per } x=1, \\ \frac{1}{4} & \text{per } x=2. \end{array} \right. \]

  • Per \(Y\):

    \[ f_Y(y) = \left\{ \begin{array}{ll} \frac{1}{4} & \text{per } y=-1, \\ \frac{1}{2} & \text{per } y=0, \\ \frac{1}{4} & \text{per } y=1. \end{array} \right. \]

Medie e Varianze

Calcoliamo ora le medie e le varianze di \(X\) e \(Y\):

  • Media di \(X\):

    \[ \mathbb{E}(X) = 0 \cdot \frac{1}{4} + 1 \cdot \frac{1}{2} + 2 \cdot \frac{1}{4} = 1. \]

  • Varianza di \(X\):

    \[ \mathbb{V}(X) = \left(0^2 \cdot \frac{1}{4} + 1^2 \cdot \frac{1}{2} + 2^2 \cdot \frac{1}{4}\right) - \mathbb{E}(X)^2 = \frac{3}{2} - 1 = \frac{1}{2}. \]

  • Media di \(Y\):

    \[ \mathbb{E}(Y) = (-1) \cdot \frac{1}{4} + 0 \cdot \frac{1}{2} + 1 \cdot \frac{1}{4} = 0. \]

  • Varianza di \(Y\):

    \[ \mathbb{V}(Y) = \left((-1)^2 \cdot \frac{1}{4} + 0^2 \cdot \frac{1}{2} + 1^2 \cdot \frac{1}{4}\right) - \mathbb{E}(Y)^2 = \frac{1}{2}. \]

Covarianza tra X e Y

La covarianza si calcola come:

\[ Cov(X,Y) = \mathbb{E}(XY) - \mathbb{E}(X)\mathbb{E}(Y), \]

dove \(\mathbb{E}(XY)\) si trova sommando il prodotto delle coppie di valori \((x, y)\) per la loro probabilità congiunta:

\[ \mathbb{E}(XY) = 0. \]

Di conseguenza, la covarianza tra \(X\) e \(Y\) è zero:

\[ Cov(X,Y) = 0 - 1 \cdot 0 = 0. \]

Conclusioni

Sebbene \(X\) e \(Y\) siano incorrelate (covarianza nulla), ciò non implica la loro indipendenza. L’indipendenza richiede che la funzione di probabilità congiunta si possa esprimere come il prodotto delle funzioni di probabilità marginali per ogni \(x\) e \(y\), condizione che non si verifica in questo caso. Quindi, nonostante l’assenza di correlazione, \(X\) e \(Y\) non sono indipendenti, dimostrando che l’incorrelazione non garantisce l’indipendenza.

35.9 Variabili Continue

Passiamo ora a considerare le distribuzioni di densità per variabili continue. Nella figura seguente, tratta da Martin (2024), è illustrata la relazione tra la probabilità congiunta \(p(A, B)\), le probabilità marginali \(p(A)\) e \(p(B)\), e le probabilità condizionali \(p(A \mid B)\).

Distribuzioni di densità (figura tratta da Martin (2024)).

35.9.1 Probabilità Congiunta \(p(A, B)\)

La probabilità congiunta \(p(A, B)\) rappresenta la probabilità che le variabili \(A\) e \(B\) assumano determinati valori contemporaneamente. Nel caso di variabili continue, questa probabilità è data dall’integrazione della funzione di densità congiunta \(f(A, B)\) su una regione di interesse (ad esempio, un’area o un volume). Formalmente:

\[ P(A \in R_A, B \in R_B) = \iint_{R_A \times R_B} f(A, B) \, dA \, dB, \]

dove \(R_A\) e \(R_B\) sono intervalli di valori per \(A\) e \(B\), rispettivamente.

35.9.2 Probabilità Marginali \(p(A)\) e \(p(B)\)

Le probabilità marginali \(p(A)\) e \(p(B)\) rappresentano la probabilità di osservare un particolare valore di \(A\) (o \(B\)) indipendentemente dal valore assunto dall’altra variabile. Nel caso continuo, si ottengono integrando la funzione di densità congiunta rispetto all’altra variabile:

\[ p(A) = \int_{-\infty}^{+\infty} f(A, B) \, dB, \] \[ p(B) = \int_{-\infty}^{+\infty} f(A, B) \, dA. \]

Queste distribuzioni marginali descrivono il comportamento individuale di ciascuna variabile, ignorando l’informazione sull’altra.

35.9.3 Probabilità Condizionale \(p(A \mid B)\)

La probabilità condizionale \(p(A \mid B)\) esprime la probabilità che \(A\) assuma un certo valore, dato un valore specifico di \(B\). Nel contesto continuo, si calcola dividendo la funzione di densità congiunta per la densità marginale di \(B\):

\[ p(A \mid B) = \frac{f(A, B)}{p(B)}. \]

Questa definizione estende il concetto di probabilità condizionale al caso continuo, mantenendo la stessa interpretazione fondamentale: la probabilità di \(A\) dato \(B\).

35.9.4 Transizione da Variabili Discrete a Continue

La transizione dal trattamento delle variabili discrete a quello delle variabili continue richiede un cambiamento di strumenti matematici: le somme utilizzate nel caso discreto vengono sostituite da integrali nel caso continuo. Tuttavia, i concetti fondamentali di probabilità congiunta, marginale e condizionale rimangono invariati.

35.9.5 Interpretazione Grafica

Nel caso continuo, la probabilità \(P(X + Y \leq 1)\) corrisponde all’area sotto la curva della funzione di densità congiunta \(f(x, y)\) nella regione definita da \(x + y \leq 1\). Questa area può essere calcolata tramite un integrale doppio:

\[ P(X + Y \leq 1) = \iint_{x + y \leq 1} f(x, y) \, dx \, dy. \]

Questa rappresentazione grafica e matematica evidenzia come la probabilità sia legata all’area sotto la curva di densità, estendendo il concetto di probabilità a variabili continue.

In conclusione, le distribuzioni di densità per variabili continue permettono di analizzare la relazione tra due o più variabili in modo analogo al caso discreto, ma utilizzando strumenti matematici più avanzati come gli integrali. La probabilità congiunta, marginale e condizionale rimangono concetti chiave, applicabili sia nel contesto discreto che continuo, e forniscono una base solida per l’analisi statistica di fenomeni complessi.

35.10 Riflessioni Conclusive

In molti contesti, ogni elemento di una popolazione può essere associato a più variabili casuali. Ad esempio, consideriamo l’insieme di tutti gli studenti iscritti a un’università. Se selezioniamo uno studente a caso e misuriamo la sua altezza e il suo peso, ogni individuo della popolazione è associato a due variabili casuali: l’altezza \(X\) e il peso \(Y\). Questo scenario illustra come, in situazioni reali, sia comune avere più variabili casuali associate a ciascun elemento di una popolazione.

Quando si hanno due o più variabili casuali associate a ogni elemento di una popolazione, è possibile studiare la distribuzione congiunta di tali variabili. In questo capitolo, abbiamo esaminato:

  1. Distribuzione di Massa di Probabilità Congiunta: Abbiamo visto come rappresentare la probabilità congiunta \(p(X, Y)\) per due variabili casuali discrete, che descrive la probabilità che \(X\) e \(Y\) assumano specifici valori simultaneamente.

  2. Distribuzioni Marginali: Abbiamo mostrato come ottenere le distribuzioni marginali \(p(X)\) e \(p(Y)\) a partire dalla distribuzione congiunta, integrando (o sommando, nel caso discreto) rispetto all’altra variabile. Queste distribuzioni descrivono il comportamento individuale di ciascuna variabile, ignorando l’informazione sull’altra.

  3. Incorrelazione e Indipendenza: Abbiamo discusso i concetti di incorrelazione e indipendenza tra variabili casuali. Due variabili sono indipendenti se la loro distribuzione congiunta è il prodotto delle distribuzioni marginali: \[ p(X, Y) = p(X) \cdot p(Y). \] L’indipendenza implica incorrelazione, ma non vale il viceversa: due variabili possono essere incorrelate senza essere indipendenti.

La distribuzione congiunta è uno strumento fondamentale per analizzare la relazione tra due o più variabili casuali. Essa permette di rispondere a domande come:

  • Qual è la probabilità che uno studente abbia un’altezza compresa tra 170 cm e 180 cm e un peso compreso tra 70 kg e 80 kg?
  • Esiste una relazione tra altezza e peso, e se sì, come possiamo quantificarla?

Attraverso la distribuzione congiunta, possiamo studiare non solo il comportamento individuale delle variabili, ma anche le loro interazioni e dipendenze.

Il concetto di distribuzione congiunta può essere esteso a più di due variabili casuali, aprendo la strada all’analisi di fenomeni più complessi. Ad esempio, in uno studio psicologico, potremmo essere interessati a esaminare la relazione tra ansia, prestazione cognitiva e livello di stress, utilizzando una distribuzione congiunta a tre variabili.

In conclusione, lo studio delle distribuzioni congiunte fornisce una base solida per comprendere e modellare la relazione tra variabili casuali. Che si tratti di altezza e peso, ansia e prestazione, o altre coppie di variabili, la distribuzione congiunta ci permette di analizzare in modo rigoroso le interazioni tra di esse, aprendo la strada a previsioni e decisioni informate.

Esercizi

Esercizio 1: Distribuzione congiunta di due lanci di dado

Si lancia due volte un dado a sei facce equilibrato. Siano:

  • \(X\) il risultato del primo lancio.
  • \(Y\) il risultato del secondo lancio.
  1. Costruisci la tabella della distribuzione congiunta \(P(X, Y)\), considerando che tutti i risultati possibili hanno la stessa probabilità.
  2. Verifica che la somma delle probabilità sia 1.
  3. Determina la distribuzione marginale di \(X\) e di \(Y\).
  4. Le variabili \(X\) e \(Y\) sono indipendenti? Giustifica la risposta.

Esercizio 2: Somma di due dadi

Si lancia due volte un dado a sei facce. Definiamo:

  • \(S = X + Y\), la somma dei due risultati.
  1. Costruisci la tabella di probabilità congiunta \(P(X, Y)\).
  2. Calcola la distribuzione di probabilità della variabile aleatoria \(S\).
  3. Determina \(P(S = 7)\) e \(P(S \leq 5)\).
  4. Qual è il valore più probabile di \(S\)? E il meno probabile?

Esercizio 3: Lancio di tre monete

Si lanciano tre monete equilibrate. Definiamo:

  • \(X\) il numero di teste ottenute.
  • \(Y\) il risultato del primo lancio (1 se testa, 0 se croce).
  1. Determina lo spazio campionario e associa i valori delle variabili aleatorie \(X\) e \(Y\).
  2. Costruisci la distribuzione congiunta \(P(X, Y)\).
  3. Calcola \(P(X = 2 \mid Y = 1)\) e \(P(Y = 1 \mid X = 2)\).
  4. Le variabili \(X\) e \(Y\) sono indipendenti?

Esercizio 4: Minimo e massimo tra due dadi

Si lancia due volte un dado a sei facce. Definiamo:

  • \(X = \min \{X_1, X_2\}\), il valore minimo tra i due lanci.
  • \(Y = \max \{X_1, X_2\}\), il valore massimo tra i due lanci.
  1. Costruisci la tabella della distribuzione congiunta \(P(X, Y)\).
  2. Calcola \(P(X = 3, Y = 5)\) e \(P(X \geq 3, Y \leq 4)\).
  3. Determina la distribuzione marginale di \(X\) e di \(Y\).
  4. Calcola la covarianza tra \(X\) e \(Y\).

Esercizio 5: Differenza tra due dadi

Si lanciano due dadi a sei facce. Definiamo:

  • \(X\) il risultato del primo lancio.
  • \(Y\) la differenza assoluta tra i due risultati, ovvero \(Y = |X - X_2|\).
  1. Determina la tabella della distribuzione congiunta \(P(X, Y)\).
  2. Calcola la distribuzione marginale di \(Y\).
  3. Determina \(P(Y = 0)\) e \(P(Y = 3)\).
  4. Le variabili \(X\) e \(Y\) sono indipendenti? Giustifica la risposta.

Esercizio 1: Distribuzione congiunta di due lanci di dado

Abbiamo due variabili aleatorie discrete: - \(X\), risultato del primo lancio di un dado a sei facce. - \(Y\), risultato del secondo lancio.

1. Tabella della distribuzione congiunta \(P(X, Y)\) Poiché il dado è equo, ogni coppia di risultati \((x, y)\) ha la stessa probabilità. Esistono \(6 \times 6 = 36\) combinazioni possibili, e ognuna ha probabilità:

\[ P(X = x, Y = y) = \frac{1}{36}, \quad \text{per ogni } x, y \in \{1, 2, 3, 4, 5, 6\} \]

La tabella della distribuzione congiunta è:

\(X\)  \(Y\) 1 2 3 4 5 6
1 1/36 1/36 1/36 1/36 1/36 1/36
2 1/36 1/36 1/36 1/36 1/36 1/36
3 1/36 1/36 1/36 1/36 1/36 1/36
4 1/36 1/36 1/36 1/36 1/36 1/36
5 1/36 1/36 1/36 1/36 1/36 1/36
6 1/36 1/36 1/36 1/36 1/36 1/36

2. Verifica che la somma delle probabilità sia 1 La somma di tutte le probabilità è:

\[ \sum_{x=1}^{6} \sum_{y=1}^{6} P(X = x, Y = y) = 36 \times \frac{1}{36} = 1. \]

3. Distribuzione marginale di \(X\) e \(Y\) Per ottenere la distribuzione marginale di \(X\):

\[ P(X = x) = \sum_{y=1}^{6} P(X = x, Y = y) = 6 \times \frac{1}{36} = \frac{1}{6}, \quad \forall x. \]

Analogamente, per \(Y\):

\[ P(Y = y) = \sum_{x=1}^{6} P(X = x, Y = y) = \frac{1}{6}, \quad \forall y. \]

Entrambe seguono una distribuzione uniforme su \(\{1, 2, 3, 4, 5, 6\}\).

4. Indipendenza di \(X\) e \(Y\) Due variabili sono indipendenti se \(P(X = x, Y = y) = P(X = x) P(Y = y)\).

\[ \frac{1}{36} = \frac{1}{6} \times \frac{1}{6} = \frac{1}{36}, \quad \forall x, y. \]

Poiché questa relazione vale per tutti i valori, \(X\) e \(Y\) sono indipendenti.

Esercizio 2: Somma di due dadi

Abbiamo:

\[ S = X + Y \]

1. Tabella di probabilità congiunta \(P(X, Y)\) È la stessa tabella costruita nel primo esercizio.

2. Distribuzione di probabilità di \(S\) La somma \(S\) assume valori da \(2\) (1+1) a \(12\) (6+6). La probabilità di ogni valore di \(S\) si ottiene contando le coppie \((x, y)\) che lo producono:

\(S\) \(P(S)\)
2 1/36
3 2/36
4 3/36
5 4/36
6 5/36
7 6/36
8 5/36
9 4/36
10 3/36
11 2/36
12 1/36

3. Calcolo di \(P(S = 7)\) e \(P(S \leq 5)\) - \(P(S = 7) = 6/36 = 1/6\). - \(P(S \leq 5) = P(S = 2) + P(S = 3) + P(S = 4) + P(S = 5)\)

\[ \frac{1}{36} + \frac{2}{36} + \frac{3}{36} + \frac{4}{36} = \frac{10}{36} = \frac{5}{18}. \]

4. Valori più probabili e meno probabili - Il valore più probabile è \(S = 7\) (\(P(S=7) = 1/6\)). - I valori meno probabili sono \(S = 2\) e \(S = 12\) (\(P(S) = 1/36\)).

Esercizio 3: Lancio di tre monete

Abbiamo:

  • Tre monete equilibrare.
  • Variabili:
    • \(X\): numero di teste ottenute.
    • \(Y\): risultato del primo lancio (1 se testa, 0 se croce).

1. Spazio campionario e valori di \(X\) e \(Y\)

Lo spazio campionario dei lanci è:

\[ \{ (C, C, C), (C, C, T), (C, T, C), (C, T, T), (T, C, C), (T, C, T), (T, T, C), (T, T, T) \} \]

Ora assegniamo \(X\) e \(Y\):

Lancio \(X\) (num. teste) \(Y\) (primo lancio)
C, C, C 0 0
C, C, T 1 0
C, T, C 1 0
C, T, T 2 0
T, C, C 1 1
T, C, T 2 1
T, T, C 2 1
T, T, T 3 1

2. Distribuzione congiunta \(P(X, Y)\)

Poiché ogni lancio ha probabilità \(\frac{1}{8}\), la tabella di probabilità congiunta è:

\(X\)  \(Y\) 0 1
0 1/8 0
1 2/8 1/8
2 1/8 3/8
3 0 1/8

3. Probabilità condizionate \(P(X = 2 \mid Y = 1)\) \[ P(X = 2 \mid Y = 1) = \frac{P(X = 2, Y = 1)}{P(Y = 1)} = \frac{3/8}{5/8} = \frac{3}{5}. \]

\(P(Y = 1 \mid X = 2)\) \[ P(Y = 1 \mid X = 2) = \frac{P(X = 2, Y = 1)}{P(X = 2)} = \frac{3/8}{4/8} = \frac{3}{4}. \]

4. Indipendenza di \(X\) e \(Y\)

Verifichiamo se \(P(X = x, Y = y) = P(X = x) P(Y = y)\) per ogni coppia.

Esempio: \(P(X = 2, Y = 1) = 3/8\) ma \(P(X=2) P(Y=1) = (4/8)(5/8) = 20/64 = 5/16 \neq 3/8\).

Quindi \(X\) e \(Y\) non sono indipendenti.

Esercizio 4: Minimo e massimo tra due dadi

Abbiamo:

  • \(X = \min(X_1, X_2)\), il minimo tra i due lanci.
  • \(Y = \max(X_1, X_2)\), il massimo tra i due lanci.

1. Tabella della distribuzione congiunta

Poiché i due lanci sono indipendenti e simmetrici, ci sono 36 coppie \((X_1, X_2)\), e ogni coppia ha probabilità \(\frac{1}{36}\).

La tabella congiunta si costruisce considerando che \(X = \min(X_1, X_2)\) e \(Y = \max(X_1, X_2)\):

\(X\)  \(Y\) 1 2 3 4 5 6
1 1/36 2/36 3/36 4/36 5/36 6/36
2 - 1/36 2/36 3/36 4/36 5/36
3 - - 1/36 2/36 3/36 4/36
4 - - - 1/36 2/36 3/36
5 - - - - 1/36 2/36
6 - - - - - 1/36

2. Probabilità richieste

  • \(P(X = 3, Y = 5) = 3/36\).
  • \(P(X \geq 3, Y \leq 4) = P(X = 3, Y = 3) + P(X = 3, Y = 4) + P(X = 4, Y = 4) = 1/36 + 2/36 + 1/36 = 4/36 = 1/9\).

Esercizio 5: Differenza tra due dadi

Abbiamo:

  • \(X\) = primo lancio.
  • \(Y = |X - X_2|\).

1. Tabella della distribuzione congiunta \(P(X, Y)\)

\(Y\) assume valori da 0 a 5, a seconda della differenza tra i due dadi:

\(X\)  \(Y\) 0 1 2 3 4 5
1 1/6 1/6 1/6 1/6 1/6 1/6
2 1/6 2/6 1/6 1/6 1/6 0
3 1/6 2/6 2/6 1/6 0 0
4 1/6 2/6 2/6 1/6 0 0
5 1/6 2/6 1/6 1/6 0 0
6 1/6 1/6 1/6 1/6 0 0

2. Distribuzione marginale di \(Y\)

Sommiamo lungo \(X\):

\(Y\) \(P(Y)\)
0 6/36
1 10/36
2 8/36
3 6/36
4 4/36
5 2/36

3. Probabilità richieste

  • \(P(Y = 0) = 6/36 = 1/6\).
  • \(P(Y = 3) = 6/36 = 1/6\).

4. Indipendenza di \(X\) e \(Y\)

Come nell’esercizio 3, verifichiamo che \(P(X, Y) \neq P(X) P(Y)\) per alcune coppie. Essendo la tabella non simmetrica, \(X\) e \(Y\) non sono indipendenti.

Considera il seguente esperimento casuale: si estrae una pallina da un’urna contenente tre palline numerate con i valori \(1\), \(2\) e \(3\).

Dopo l’estrazione, si definiscono due variabili casuali:

  • \(X\), il valore della pallina estratta.
  • \(Y\), il valore di un’altra variabile definita come \(Y = X^2\).
  1. Costruisci la distribuzione congiunta di \(X\) e \(Y\).
  2. Calcola il valore atteso di \(X\) e \(Y\), ossia \(E[X]\) e \(E[Y]\).
  3. Calcola la covarianza tra \(X\) e \(Y\), ossia \(\text{Cov}(X, Y)\).
  4. Calcola la correlazione tra \(X\) e \(Y\), ossia \(\rho(X, Y)\).
  5. Interpreta il valore della correlazione: cosa indica il segno e il valore ottenuto?

1. Distribuzione congiunta di \(X\) e \(Y\)

Poiché ogni pallina ha la stessa probabilità di essere estratta, la distribuzione congiunta è:

\(X\) \(Y = X^2\) \(P(X, Y)\)
1 1 \(\frac{1}{3}\)
2 4 \(\frac{1}{3}\)
3 9 \(\frac{1}{3}\)

2. Calcolo di \(E[X]\) e \(E[Y]\)

\[ E[X] = \sum_{i} x_i P(X = x_i) = 1 \cdot \frac{1}{3} + 2 \cdot \frac{1}{3} + 3 \cdot \frac{1}{3} = \frac{1 + 2 + 3}{3} = 2 \]

\[ E[Y] = \sum_{i} y_i P(Y = y_i) = 1 \cdot \frac{1}{3} + 4 \cdot \frac{1}{3} + 9 \cdot \frac{1}{3} = \frac{1 + 4 + 9}{3} = \frac{14}{3} \]

3. Calcolo della covarianza \(\text{Cov}(X, Y)\)

La covarianza è definita come:

\[ \text{Cov}(X, Y) = E[XY] - E[X]E[Y] \]

Prima calcoliamo \(E[XY]\):

\[ E[XY] = \sum_{i} x_i y_i P(X = x_i, Y = y_i) = 1 \cdot 1 \cdot \frac{1}{3} + 2 \cdot 4 \cdot \frac{1}{3} + 3 \cdot 9 \cdot \frac{1}{3} \]

\[ = \frac{1 + 8 + 27}{3} = \frac{36}{3} = 12 \]

Ora possiamo calcolare la covarianza:

\[ \text{Cov}(X, Y) = E[XY] - E[X]E[Y] = 12 - \left(2 \cdot \frac{14}{3}\right) = 12 - \frac{28}{3} = \frac{36 - 28}{3} = \frac{8}{3} \]

4. Calcolo della correlazione \(\rho(X, Y)\)

La correlazione è definita come:

\[ \rho(X, Y) = \frac{\text{Cov}(X, Y)}{\sigma_X \cdot \sigma_Y} \]

Calcoliamo prima le varianze:

\[ \text{Var}(X) = E[X^2] - (E[X])^2 \]

\[ E[X^2] = 1^2 \cdot \frac{1}{3} + 2^2 \cdot \frac{1}{3} + 3^2 \cdot \frac{1}{3} = \frac{1 + 4 + 9}{3} = \frac{14}{3} \]

\[ \text{Var}(X) = \frac{14}{3} - 2^2 = \frac{14}{3} - 4 = \frac{14 - 12}{3} = \frac{2}{3} \]

Ora la varianza di \(Y\):

\[ \text{Var}(Y) = E[Y^2] - (E[Y])^2 \]

\[ E[Y^2] = 1^2 \cdot \frac{1}{3} + 4^2 \cdot \frac{1}{3} + 9^2 \cdot \frac{1}{3} = \frac{1 + 16 + 81}{3} = \frac{98}{3} \]

\[ \text{Var}(Y) = \frac{98}{3} - \left(\frac{14}{3}\right)^2 = \frac{98}{3} - \frac{196}{9} = \frac{98 \cdot 3 - 196}{9} = \frac{294 - 196}{9} = \frac{98}{9} \]

Calcoliamo le deviazioni standard:

\[ \sigma_X = \sqrt{\text{Var}(X)} = \sqrt{\frac{2}{3}} = \frac{\sqrt{6}}{3} \]

\[ \sigma_Y = \sqrt{\text{Var}(Y)} = \sqrt{\frac{98}{9}} = \frac{\sqrt{98}}{3} \]

Ora possiamo calcolare la correlazione:

\[ \rho(X, Y) = \frac{\text{Cov}(X, Y)}{\sigma_X \cdot \sigma_Y} = \frac{\frac{8}{3}}{\frac{\sqrt{6}}{3} \cdot \frac{\sqrt{98}}{3}} \]

\[ = \frac{\frac{8}{3}}{\frac{\sqrt{6 \cdot 98}}{9}} = \frac{8 \cdot 9}{3 \cdot \sqrt{6 \cdot 98}} = \frac{24}{\sqrt{588}} \]

Poiché \(\sqrt{588} = \sqrt{4 \cdot 147} = 2\sqrt{147} = 2\sqrt{49 \cdot 3} = 2 \cdot 7 \cdot \sqrt{3} = 14\sqrt{3}\):

\[ \rho(X, Y) = \frac{24}{14\sqrt{3}} = \frac{12}{7\sqrt{3}} = \frac{12\sqrt{3}}{21} \approx 0.995 \]

5. Interpretazione della correlazione

  • Il valore \(\rho(X, Y) \approx 0.995\) è molto vicino a 1, indicando una correlazione positiva quasi perfetta tra \(X\) e \(Y\).
  • Il segno positivo indica che all’aumentare di \(X\), anche \(Y\) tende ad aumentare.
  • L’alto valore (prossimo a 1) indica che la relazione tra \(X\) e \(Y\) è quasi perfettamente lineare, il che è coerente con la definizione \(Y = X^2\) nell’intervallo considerato (piccoli valori positivi di \(X\)).

35.11 Informazioni sull’Ambiente di Sviluppo

sessionInfo()
#> R version 4.4.2 (2024-10-31)
#> Platform: aarch64-apple-darwin20
#> Running under: macOS Sequoia 15.3.1
#> 
#> Matrix products: default
#> BLAS:   /Library/Frameworks/R.framework/Versions/4.4-arm64/Resources/lib/libRblas.0.dylib 
#> LAPACK: /Library/Frameworks/R.framework/Versions/4.4-arm64/Resources/lib/libRlapack.dylib;  LAPACK version 3.12.0
#> 
#> locale:
#> [1] C/UTF-8/C/C/C/C
#> 
#> time zone: Europe/Rome
#> tzcode source: internal
#> 
#> attached base packages:
#> [1] stats     graphics  grDevices utils     datasets  methods   base     
#> 
#> other attached packages:
#>  [1] thematic_0.1.6   MetBrewer_0.2.0  ggokabeito_0.1.0 see_0.10.0      
#>  [5] gridExtra_2.3    patchwork_1.3.0  bayesplot_1.11.1 psych_2.4.12    
#>  [9] scales_1.3.0     markdown_1.13    knitr_1.49       lubridate_1.9.4 
#> [13] forcats_1.0.0    stringr_1.5.1    dplyr_1.1.4      purrr_1.0.4     
#> [17] readr_2.1.5      tidyr_1.3.1      tibble_3.2.1     ggplot2_3.5.1   
#> [21] tidyverse_2.0.0  rio_1.2.3        here_1.0.1      
#> 
#> loaded via a namespace (and not attached):
#>  [1] generics_0.1.3    stringi_1.8.4     lattice_0.22-6    hms_1.1.3        
#>  [5] digest_0.6.37     magrittr_2.0.3    evaluate_1.0.3    grid_4.4.2       
#>  [9] timechange_0.3.0  fastmap_1.2.0     rprojroot_2.0.4   jsonlite_1.9.1   
#> [13] mnormt_2.1.1      cli_3.6.4         rlang_1.1.5       munsell_0.5.1    
#> [17] withr_3.0.2       tools_4.4.2       parallel_4.4.2    tzdb_0.4.0       
#> [21] colorspace_2.1-1  pacman_0.5.1      vctrs_0.6.5       R6_2.6.1         
#> [25] lifecycle_1.0.4   htmlwidgets_1.6.4 pkgconfig_2.0.3   pillar_1.10.1    
#> [29] gtable_0.3.6      glue_1.8.0        xfun_0.51         tidyselect_1.2.1 
#> [33] rstudioapi_0.17.1 farver_2.1.2      htmltools_0.5.8.1 nlme_3.1-167     
#> [37] rmarkdown_2.29    compiler_4.4.2

Bibliografia

Blitzstein, J. K., & Hwang, J. (2019). Introduction to probability. CRC Press.
Chan, J. C. C., & Kroese, D. P. (2025). Statistical Modeling and Computation (2ª ed.). Springer.
Martin, O. (2024). Bayesian analysis with python. Packt Publishing Ltd.