[Appendice B — Numeri e intervalli]{#sec-apx-numbers .quarto-section-identifier}

Appendice B — Numeri e intervalli

Perché questa appendice è importante

La teoria della probabilità richiede diversi tipi di numeri: interi per contare eventi, razionali per esprimere proporzioni, reali per rappresentare misure continue. Comprendere queste distinzioni è fondamentale per interpretare correttamente variabili casuali discrete e continue.

B.1 Numeri binari

I numeri binari rappresentano il sistema numerico più elementare utilizzato in informatica, poiché sono composti unicamente da due simboli: 0 e 1. Questa caratteristica li rende particolarmente adatti alla rappresentazione di situazioni dicotomiche (vero/falso, presente/assente) e consente ai computer di operare rapidamente ed efficacemente sui dati.

Un esempio semplice d’impiego dei valori logici binari si ottiene quando raccogliamo risposte a una domanda chiusa. Immaginiamo, ad esempio, di porre la domanda “Ritieni che l’apprendimento della statistica sia utile per la tua formazione?” a 10 studenti di psicologia. Se le risposte vengono memorizzate in R come valori logici (TRUE per “Sì” e FALSE per “No”), potremmo avere:

opinion <- c(TRUE, FALSE, TRUE, TRUE, TRUE, FALSE, TRUE, TRUE, TRUE, FALSE)
opinion

 [1]  TRUE FALSE  TRUE  TRUE  TRUE FALSE  TRUE  TRUE  TRUE FALSE

In questo caso, TRUE e FALSE corrispondono a 1 e 0 rispettivamente quando utilizzati in operazioni numeriche. Lo stesso avviene in Python, dove True è interpretato come 1 e False come 0. Questa rappresentazione binaria permette di ottenere facilmente statistiche sintetiche. Per esempio, per calcolare la proporzione di risposte positive rispetto al totale, è sufficiente sommare i valori (contando così il numero di TRUE) e dividere per la lunghezza del vettore:

sum(opinion) / length(opinion)

[1] 0.7

Questo fornisce immediatamente la percentuale di studenti che hanno risposto “Sì” alla domanda.

B.2 Numeri interi

I numeri interi sono caratterizzati dall’assenza di componenti decimali. Essi includono sia i numeri naturali (1, 2, 3, …), tradizionalmente utilizzati per il conteggio, sia i loro opposti negativi. L’insieme dei numeri naturali è indicato con \(\mathbb{N}\), mentre l’insieme dei numeri interi (che include i numeri naturali, i loro negativi e lo zero) si denota con \(\mathbb{Z}\):

\[ \mathbb{Z} = \{0, \pm 1, \pm 2, \pm 3, \dots\} \]

Applicazione in psicologia: I numeri interi sono utilizzati per contare eventi discreti, come il numero di risposte corrette in un test, il numero di partecipanti in uno studio, o il numero di volte che un comportamento si manifesta.

B.3 Numeri razionali

I numeri razionali sono quei numeri che possono essere espressi come il rapporto tra due numeri interi, con il denominatore diverso da zero. Essi formano l’insieme:

\[ \mathbb{Q} = \left\{\frac{m}{n} \mid m,n \in \mathbb{Z}, n \neq 0\right\}. \]

Poiché ogni numero naturale è anche un intero, e ogni intero può essere rappresentato come razionale (ad esempio \(5 = \frac{5}{1}\)), si ha una catena d’inclusioni tra i diversi insiemi di numeri:

\[ \mathbb{N} \subseteq \mathbb{Z} \subseteq \mathbb{Q}. \]

Se si desidera considerare solo i numeri razionali non negativi, si utilizza la notazione:

\[ \mathbb{Q}^+ = \{q \in \mathbb{Q} \mid q \geq 0\}. \]

Applicazione in psicologia: Le proporzioni e le percentuali (es. 0.75 = 75% di risposte corrette) sono numeri razionali. Anche i punteggi standardizzati come i rapporti sono razionali.

B.4 Numeri irrazionali

Non tutti i numeri possono essere espressi come rapporto di due interi. I numeri che non hanno questa proprietà sono detti irrazionali. Essi non possono essere scritti in forma frazionaria e la loro espansione decimale è infinita e non periodica. Esempi tipici di numeri irrazionali sono:

\(\sqrt{2}\)
\(\sqrt{3}\)
\(\pi = 3.141592...\)
\(e = 2.718281...\) (base del logaritmo naturale)

Nota: Sebbene i numeri irrazionali possano sembrare astratti, essi compaiono naturalmente nei calcoli statistici. Ad esempio, la costante \(e\) appare nella distribuzione normale, mentre \(\pi\) compare nella formula della densità gaussiana.

B.5 Numeri reali

I numeri razionali non coprono tutti i possibili punti sulla retta reale. Per rappresentare ogni possibile misura, grandezza o punto su una linea continua, si considerano i numeri reali, denotati con \(\mathbb{R}\). L’insieme dei numeri reali comprende sia i razionali sia gli irrazionali:

\[ \mathbb{N} \subseteq \mathbb{Z} \subseteq \mathbb{Q} \subseteq \mathbb{R}. \]

In statistica, la precisione con cui si esprime una misura è spesso legata al numero di cifre decimali utilizzate, sfruttando così appieno la “continuità” offerta dai numeri reali.

Applicazione in psicologia: Variabili continue come il tempo di reazione (in millisecondi), l’intensità di un’emozione misurata su scala continua, o il punteggio in un test psicometrico sono rappresentate come numeri reali.

B.6 Intervalli numerici

Definizione: Un intervallo numerico è un sottoinsieme connesso della retta reale. Intuitivamente, rappresenta tutti i numeri reali compresi tra due estremi, che possono o meno essere inclusi nell’intervallo stesso.

Classificazione degli intervalli: Gli intervalli vengono classificati in base all’inclusione o meno degli estremi:

Intervallo chiuso: Include entrambi gli estremi. Si indica con \([a, b]\) e rappresenta l’insieme dei numeri reali \(x\) tali che \(a \leq x \leq b\).
Intervallo aperto: Non include alcun estremo. Si indica con \((a, b)\) e rappresenta l’insieme dei numeri reali \(x\) tali che \(a < x < b\).
Intervalli semiaperti:
- Chiuso a sinistra e aperto a destra: Include l’estremo sinistro ma non quello destro. Si indica con \([a, b)\) e rappresenta l’insieme dei numeri reali \(x\) tali che \(a \leq x < b\).
- Aperto a sinistra e chiuso a destra: Include l’estremo destro ma non quello sinistro. Si indica con \((a, b]\) e rappresenta l’insieme dei numeri reali \(x\) tali che \(a < x \leq b\).

Tabella riassuntiva:

Intervallo	Notazione	Condizione	Esempio
Chiuso	\([a, b]\)	\(a \leq x \leq b\)	\([0, 1]\) include 0 e 1
Aperto	\((a, b)\)	\(a < x < b\)	\((0, 1)\) esclude 0 e 1
Chiuso a sinistra, aperto a destra	\([a, b)\)	\(a \leq x < b\)	\([0, 1)\) include 0, esclude 1
Aperto a sinistra, chiuso a destra	\((a, b]\)	\(a < x \leq b\)	\((0, 1]\) esclude 0, include 1

Osservazioni: * La scelta della notazione con parentesi quadre o tonde indica rispettivamente l’inclusione o l’esclusione degli estremi. * Gli intervalli infiniti sono indicati con i simboli \(-\infty\) e \(+\infty\). Ad esempio, \([0, +\infty)\) rappresenta tutti i numeri reali non negativi.

Perché gli intervalli sono fondamentali per la probabilità

Gli intervalli sono essenziali per definire e calcolare probabilità con variabili casuali continue:

Supporto delle distribuzioni: Il supporto di una variabile casuale continua è spesso un intervallo. Ad esempio:
- La distribuzione uniforme è definita su \([a, b]\)
- La distribuzione normale ha supporto \((-\infty, +\infty)\)
- La distribuzione Beta ha supporto \([0, 1]\)
Calcolo di probabilità: Per una variabile casuale continua \(X\), la probabilità che \(X\) cada in un intervallo \([a, b]\) è: \[ P(a \leq X \leq b) = \int_a^b f(x) \, dx \] dove \(f(x)\) è la funzione di densità di probabilità.
Intervalli di credibilità: Nell’inferenza bayesiana, gli intervalli di credibilità al 95% indicano un intervallo \([L, U]\) tale che: \[ P(L \leq \theta \leq U \mid \text{dati}) = 0.95 \]
Distinzione cruciale: Notare che per variabili continue, \(P(X = a) = 0\) per qualsiasi valore specifico \(a\). Solo gli intervalli hanno probabilità non nulla, da cui l’importanza di questa notazione.