Un piccolo ripasso

Simbologia di base

Per una scrittura più sintetica possono essere utilizzati alcuni simboli matematici.

  • L’operatore logico booleano \(\land\) significa “e” (congiunzione forte) mentre il connettivo di disgiunzione \(\lor\) significa “o” (oppure) (congiunzione debole).

  • Il quantificatore esistenziale \(\exists\) vuol dire “esiste almeno un” e indica l’esistenza di almeno una istanza del concetto/oggetto indicato. Il quantificatore esistenziale di unicità \(\exists!\) (“esiste soltanto un”) indica l’esistenza di esattamente una istanza del concetto/oggetto indicato. Il quantificatore esistenziale \(\nexists\) nega l’esistenza del concetto/oggetto indicato.

  • Il quantificatore universale \(\forall\) vuol dire “per ogni.”

  • L’implicazione logica “\(\Rightarrow\)” significa “implica” (se …allora). \(P \Rightarrow Q\) vuol dire che \(P\) è condizione sufficiente per la verità di \(Q\) e che \(Q\) è condizione necessaria per la verità di \(P\).

  • L’equivalenza matematica “\(\iff\)” significa “se e solo se” e indica una condizione necessaria e sufficiente, o corrispondenza biunivoca.

  • Il simbolo \(\vert\) si legge “tale che.”

  • Il simbolo \(\triangleq\) (o \(:=\)) si legge “uguale per definizione.”

  • Il simbolo \(\Delta\) indica la differenza fra due valori della variabile scritta a destra del simbolo.

  • Il simbolo \(\propto\) si legge “proporzionale a.”

  • Il simbolo \(\approx\) si legge “circa.”

  • Il simbolo \(\in\) della teoria degli insiemi vuol dire “appartiene” e indica l’appartenenza di un elemento ad un insieme. Il simbolo \(\notin\) vuol dire “non appartiene.”

  • Il simbolo \(\subseteq\) si legge “è un sottoinsieme di” (può coincidere con l’insieme stesso). Il simbolo \(\subset\) si legge “è un sottoinsieme proprio di.”

  • Il simbolo \(\#\) indica la cardinalità di un insieme.

  • Il simbolo \(\cap\) indica l’intersezione di due insiemi. Il simbolo \(\cup\) indica l’unione di due insiemi.

  • Il simbolo \(\emptyset\) indica l’insieme vuoto o evento impossibile.

Numeri binari, interi, razionali, irrazionali e reali {-}

Numeri binari

I più semplici sono i numeri binari, cioè zero o uno. Useremo spesso numeri binari per rappresentare se qualcosa è vero o falso, o presente o assente.

Supponiamo di chiedere a 10 studenti “Ti piacciono i mirtilli?” Poniamo che le risposte siano le seguenti:

opinion <- c('Yes','No','Yes','No','Yes','No','Yes','Yes','Yes','Yes')
opinion
#>  [1] "Yes" "No"  "Yes" "No"  "Yes" "No"  "Yes" "Yes" "Yes" "Yes"

Tali risposte possono essere ricodificate nei termini di valori di verità, ovvero, vero e falso, generalmente denotati rispettivamente come 1 e 0. In tale ricodifica può essere effettuata mediante l’operatore == che è un test per l’uguaglianza e restituisce il valore logico VERO se le due cose sono uguali e FALSO se non lo sono:

opinion <- opinion == "Yes"
opinion
#>  [1]  TRUE FALSE  TRUE FALSE  TRUE FALSE  TRUE  TRUE  TRUE  TRUE

R considera i valori di verità e i numeri binari in modo equivalente, con TRUE uguale a 1 e FALSE uguale a zero. Di conseguenza, possiamo effettuare operazioni algebriche sui valori logici VERO e FALSO. Nell’esempio, possiamo sommare i valori di verità, dividere per 10

sum(opinion) / length(opinion)
#> [1] 0.7

e concludere che 7 risposte su 10 sono positive.

Numeri interi

Un numero intero è un numero senza decimali. Si dicono naturali i numeri che servono a contare, come 1, 2, … L’insieme dei numeri naturali si indica con il simbolo \(\mathbb{N}\). È anche necessario introdurre i numeri con il segno per poter trattare grandezze negative. Si ottengono così l’insieme numerico dei numeri interi relativi: \(\mathbb{Z} = \{0, \pm 1, \pm 2, \dots \}\)

Numeri razionali

I numeri razionali sono i numeri frazionari \(m/n\), dove \(m, n \in N\), con \(n \neq 0\). Si ottengono così i numeri razionali: \(\mathbb{Q} = \{\frac{m}{n} \,\vert\, m, n \in \mathbb{Z}, n \neq 0\}\). È evidente che \(\mathbb{N} \subseteq \mathbb{Z} \subseteq \mathbb{Q}\). Anche in questo caso è necessario poter trattare grandezze negative. I numeri razionali non negativi sono indicati con \(\mathbb{Q^+} = \{q \in \mathbb{Q} \,\vert\, q \geq 0\}\).

Numeri irrazionali

Tuttavia, non tutti i punti di una retta \(r\) possono essere rappresentati mediante i numeri interi e razionali. È dunque necessario introdurre un’altra classe di numeri. Si dicono irrazionali, e sono denotati con \(\mathbb{R}\), i numeri che possono essere scritti come una frazione \(a / b\), con \(a\) e \(b\) interi e \(b\) diverso da 0. I numeri irrazionali sono i numeri illimitati e non periodici che quindi non possono essere espressi sotto forma di frazione. Per esempio, \(\sqrt{2}\), \(\sqrt{3}\) e \({\displaystyle \pi =3,141592\ldots}\) sono numeri irrazionali.

Numeri reali

I punti della retta \(r\) sono quindi “di più” dei numeri razionali. Per poter rappresentare tutti i punti della retta abbiamo dunque bisogno dei numeri reali. I numeri reali possono essere positivi, negativi o nulli e comprendono, come casi particolari, i numeri interi, i numeri razionali e i numeri irrazionali. Spesso in statisticac il numero dei decimali indica il grado di precisione della misurazione.

Intervalli

Un intervallo si dice chiuso se gli estremi sono compresi nell’intervallo, aperto se gli estremi non sono compresi. Le caratteristiche degli intervalli sono riportate nella tabella seguente.

Intervallo
chiuso \[a, b\] \(a \leq x \leq b\)
aperto (a, b) \(a < x < b\)
chiuso a sinistra e aperto a destra [a, b) \(a \leq x < b\)
aperto a sinistra e chiuso a destra (a, b] \(a < x \leq b\)

Insiemi

Un insieme (o collezione, classe, gruppo, …) è un concetto primitivo, ovvero è un concetto che già possediamo. Georg Cantor l’ha definito nel modo seguente:

un insieme è una collezione di oggetti, determinati e distinti, della nostra percezione o del nostro pensiero, concepiti come un tutto unico; tali oggetti si dicono elementi dell’insieme.

Mentre non è rilevante la natura degli oggetti che costituiscono l’insieme, ciò che importa è distinguere se un dato oggetto appartenga o meno ad un insieme. Deve essere vera una delle due possibilità: il dato oggetto è un elemento dell’insieme considerato oppure non è elemento dell’insieme considerato. Due insiemi \(A\) e \(B\) si dicono uguali se sono formati dagli stessi elementi, anche se disposti in ordine diverso: \(A=B\). Due insiemi \(A\) e \(B\) si dicono diversi se non contengono gli stessi elementi: \(A \neq B\). Ad esempio, i seguenti insiemi sono uguali: \[\{1, 2, 3\} = \{3, 1, 2\} = \{1, 3, 2\}= \{1, 1, 1, 2, 3, 3, 3\}.\] Gli insiemi sono denotati da una lettera maiuscola, mentre le lettere minuscole, di solito, designano gli elementi di un insieme. Per esempio, un generico insieme \(A\) si indica con \[A = \{a_1, a_2, \dots, a_n\}, \quad \text{con~} n > 0.\]

La scrittura \(a \in A\) dice che \(a\) è un elemento di \(A\). Per dire che \(b\) non è un elemento di \(A\) si scrive \(b \notin A.\)

Per quegli insiemi i cui elementi soddisfano una certa proprietà che li caratterizza, tale proprietà può essere usata per descrivere più sinteticamente l’insieme: \[ A = \{x ~\vert~ \text{proprietà posseduta da~} x\}, \] che si legge come “\(A\) è l’insieme degli elementi \(x\) per cui è vera la proprietà indicata.” Per esempio, per indicare l’insieme \(A\) delle coppie di numeri reali \((x,y)\) che appartengono alla parabola \(y = x^2 + 1\) si può scrivere: \[ A = \{(x,y) ~\vert~ y = x^2 + 1\}. \] Dati due insiemi \(A\) e \(B\), diremo che \(A\) è un sottoinsieme di \(B\) se e solo se tutti gli elementi di \(A\) sono anche elementi di \(B\): \[A \subseteq B \iff (\forall x \in A \Rightarrow x \in B).\] Se esiste almeno un elemento di \(B\) che non appartiene ad \(A\) allora diremo che \(A\) è un sottoinsieme proprio di \(B\): \[ A \subset B \iff (A \subseteq B, \exists~ x \in B ~\vert~ x \notin A). \] Un altro insieme, detto insieme delle parti, o insieme potenza, che si associa all’insieme \(A\) è l’insieme di tutti i sottoinsiemi di \(A\), inclusi l’insieme vuoto e \(A\) stesso. Per esempio, per l’insieme \(A = \{a, b, c\}\), l’insieme delle parti è: \[ \mathcal{P}(A) = \{ \emptyset, \{a\}, \{b\}, \{c\}, \{a, b\}, \{a, c\}, \{c, b\}, \{a, b, c\} \}. \]

Operazioni tra insiemi

Si definisce intersezione di \(A\) e \(B\) l’insieme \(A \cap B\) di tutti gli elementi \(x\) che appartengono ad \(A\) e contemporaneamente a \(B\): \[A \cap B = \{x ~\vert~ x \in A \land x \in B\}.\]

Si definisce unione di \(A\) e \(B\) l’insieme \(A \cup B\) di tutti gli elementi \(x\) che appartengono ad \(A\) o a \(B\), cioè \[ A \cup B = \{x ~\vert~ x \in A \lor x \in B\}. \]

Differenza. Si indica con \(A \setminus B\) l’insieme degli elementi di \(A\) che non appartengono a \(B\): \[A \setminus B = \{x ~\vert~ x \in A \land x \notin B\}.\]

Insieme complementare. Nel caso che sia \(B \subseteq A\), l’insieme differenza \(A \setminus B\) è detto insieme complementare di \(B\) in \(A\) e si indica con \(B^C\).

Dato un insieme \(S\), una partizione di \(S\) è una collezione di sottoinsiemi di \(S\), \(S_1, \dots, S_k\), tali che \[S = S_1 \cup S_2 \cup \dots S_k\] e \[S_i \cap S_j, \quad \text{con~} i \neq j.\]

La relazione tra unione, intersezione e insieme complementare è data dalle leggi di DeMorgan: \[(A \cup B)^c = A^c \cap B^c,\] \[(A \cap B)^c = A^c \cup B^c.\]

Diagrammi di Eulero-Venn

In molte situazioni è utile servirsi dei cosiddetti diagrammi di Eulero-Venn per rappresentare gli insiemi e verificare le proprietà delle operazioni tra insiemi (si veda la figura 30.5. I diagrammi di Venn sono così nominati in onore del matematico inglese del diciannovesimo secolo John Venn anche se Leibnitz e Eulero avevano già in precedenza utilizzato rappresentazioni simili. In tale rappresentazione, gli insiemi sono individuati da regioni del piano delimitate da una curva chiusa. Nel caso di insiemi finiti, è possibile evidenziare esplicitamente alcuni elementi di un insieme mediante punti, quando si possono anche evidenziare tutti gli elementi degli insiemi considerati.

In tutte le figure $S$ è la regione delimitata dal rettangolo, $L$ è la regione all'interno del cerchio di sinistra e $R$ è la regione all'interno del cerchio di destra. La regione evidenziata mostra l'insieme indicato sotto ciascuna figura.

Figura 30.5: In tutte le figure \(S\) è la regione delimitata dal rettangolo, \(L\) è la regione all’interno del cerchio di sinistra e \(R\) è la regione all’interno del cerchio di destra. La regione evidenziata mostra l’insieme indicato sotto ciascuna figura.

I diagrammi di Eulero-Venn che forniscono una dimostrazione delle leggi di DeMorgan sono forniti nella figura 30.6.

Dimostrazione delle leggi di DeMorgan.

Figura 30.6: Dimostrazione delle leggi di DeMorgan.

Coppie ordinate e prodotto cartesiano

Una coppia ordinata \((x,y)\) è l’insieme i cui elementi sono \(x \in A\) e \(y \in B\) e nella quale \(x\) è la prima componente (o prima coordinata), \(y\) la seconda. L’insieme di tutte le coppie ordinate costruite a partire dagli insiemi \(A\) e \(B\) viene detto prodotto cartesiano: \[A \times B = \{(x, y) ~\vert~ x \in A \land y \in B\}.\] Ad esempio, sia \(A = \{1, 2, 3\}\) e \(B = \{a, b\}\). Allora, \[\{1, 2\} \times \{a, b, c\} = \{(1, a), (1, b), (1, c), (2, a), (2, b), (2, c)\}.\]

Cardinalità

Si definisce cardinalità (o potenza) di un insieme finito il numero degli elementi dell’insieme. Viene indicata con \(\vert A\vert, \#(A)\) o \(\text{c}(A)\).

Proprietà degli stimatori dei minimi quadrati

Il coefficiente dei minimi quadrati \(b\) è una combinazione lineare delle osservazioni \(y_i\). Tale proprietà è importante perché consente di derivare la distribuzione di \(b\) dalla distribuzione delle \(y_i\). Può essere dimostrato che la formula per il calcolo di \(b\) si può scrivere nel modo seguente: \[\begin{aligned} b &= \sum_i \left[\frac{x_i-\bar{x}}{\sum_j(x_j-\bar{x})^2}\right]y_i = \textstyle\sum m_i y_i,\end{aligned}\] dove \(m_i \triangleq (x_i-\bar{x}) / \sum (x_j-\bar{x})^2\) è il peso associato a ciascun valore \(y_i\). Dato che i valori \(x_i\) sono fissi e \(m_i\) dipende solo da \(x_i\), anche i pesi \(m_i\) sono fissi.

Il valore atteso di \(b\) è uguale a \[\begin{aligned} E(b) &= \textstyle\sum m_i E(y_i)\notag\\ &= \textstyle\sum m_i (\alpha + \beta x_i)\notag\\ &= \textstyle\alpha\sum m_i + \beta \sum m_i x_i\notag\\ &= \frac{\alpha \sum(x_i-\bar{x})}{\sum(x_i-\bar{x})^2} + \beta \frac{\sum(x_i-\bar{x})x_i}{\sum(x_i-\bar{x})^2}\notag\\ &= 0 + \beta \frac{\sum x_i^2 -\bar{x}\sum x_i}{\sum(x_i-\bar{x})^2}\notag\\ &= \beta \frac{\sum x_i^2 - n\bar{x}^2}{\sum(x_i-\bar{x})^2}\notag\\ &= \beta.\end{aligned}\] Il coefficiente dei minimi quadrati \(b\) è dunque uno stimatore corretto di \(\beta\). In maniera equivalente si può dimostrare che \(E(a) = \alpha\).

Sotto le ipotesi di omoschedasticità \(\big[ \var(y_i) = \var(\varepsilon_i)=\sigma^2_{\varepsilon}\big]\) e indipendenza, la varianza di \(b\) è \[\begin{aligned} \var(b) &= \textstyle\var\big(\sum m_i y_i\big)\notag\\ &= \textstyle\mathop{\sum m_i^2} \var(y_i)\notag\\ &= \textstyle\mathop{\sum m_i^2} \sigma^2_{\varepsilon}\notag\\ &= \frac{\mathop{\sigma^2_{\varepsilon}} \textstyle\sum(x_i-\bar{x})^2}{\big[\textstyle\sum(x_i-\bar{x})^2\big]^2}\notag\\ &= \frac{\sigma^2_{\varepsilon}}{\sum(x_i-\bar{x})^2}.\end{aligned}\] In maniera simile si dimostra che la varianza di \(a\) è \[\var(a)= \frac{\sigma^2_{\varepsilon} \textstyle\sum x_i^2}{n \textstyle\sum (x_i-\bar{x})^2}.\]

Dato che sia \(a\) che \(b\) sono funzioni lineari di \(y_i\), se i valori \(y_i\) seguono la distribuzione gaussiana, allora anche \(a\) e \(b\) saranno distribuiti secondo una distribuzione normale. In conclusione, \[ \begin{aligned} b &\sim \mathcal{N}\bigg(\beta, \frac{\sigma^2_{\varepsilon}}{\sum(x_i-\bar{x})^2}\bigg),\\ a &\sim \mathcal{N}\bigg(\alpha, \frac{\sigma^2_{\varepsilon}\textstyle\sum x_i^2}{n \textstyle\sum (x_i-\bar{x})^2} \bigg). \end{aligned} \]