Sommatorie

Notazione sommatoria.

Author

Corrado Caudek

First Published

October 1, 2021

Il simbolo \(\sum_{i=1}^{\infty}\) indica che dobbiamo assegnare al numero intero \(i\) tutti i suoi valori \(1, 2, 3, ...\) ed eseguire la somma dei termini. (Jean-Baptiste Joseph Fourier)

Le somme si incontrano costantemente in svariati contesti matematici e statistici quindi abbiamo bisogno di una notazione adeguata che ci consenta di gestirle. Si veda, ad esempio, Wikipedia.

1 Simbolo di somma (sommatorie)

La somma dei primi \(n\) numeri interi può essere scritta come \(1+2+\dots+(n-1)+n\), dove `\(\dots\)’ ci dice di completare la sequenza definita dai termini che vengono prima e dopo. Ovviamente, una notazione come \(1+7+\dots+73.6\) non ha alcun senso senza qualche altro tipo di precisazione. In generale, si incontrano delle somme nella forma

\[\begin{equation} x_1+x_2+\dots+x_n, \end{equation}\]

dove \(x_i\) è un numero che è stato definito altrove. La notazione precedente, che fa uso dei tre puntini di sospensione, è utile in alcuni contesti ma in altri risulta ambigua. Pertanto la notazione di uso corrente è del tipo

\[\begin{equation} \sum_{i=1}^n x_i \end{equation}\]

e si legge “sommatoria per \(i\) che va da \(1\) a \(n\) di \(x_i\).” Il simbolo \(\sum\) (lettera sigma maiuscola dell’alfabeto greco) indica l’operazione di somma, il simbolo \(x_i\) indica il generico addendo della sommatoria, le lettere \(1\) ed \(n\) indicano i cosiddetti , ovvero l’intervallo (da \(1\) fino a \(n\) estremi inclusi) in cui deve variare l’indice \(i\) allorché si sommano gli addendi \(x_i\). Solitamente l’estremo inferiore è \(1\) ma potrebbe essere qualsiasi altri numero \(m < n\). Quindi [ {i=1}^n x_i = x_1 + x{2} + + x_{n}. ] Per esempio, se i valori \(x\) sono \(\{3, 11, 4, 7\}\), si avrà [ _{i=1}^4 x_i = 3+11+4+7 = 25 ] laddove \(x_1 = 3\), \(x_2 = 11\), eccetera. La quantità \(x_i\) nella formula precedente si dice l’ della sommatoria, mentre la variabile \(i\), che prende i valori naturali successivi indicati nel simbolo, si dice della sommatoria.

La notazione di sommatoria può anche essere fornita nella forma seguente \[\begin{equation} \sum_{P(i)} x_i \end{equation}\] dove \(P(i)\) è qualsiasi proposizione riguardante \(i\) che può essere vera o falsa. Quando è ovvio che si vogliono sommare tutti i valori di \(n\) osservazioni, la notazione può essere semplificata nel modo seguente: \(\sum_{i} x_i\) oppure \(\sum x_i\). Al posto di \(i\) si possono trovare altre lettere: \(k, j, l, \dots\),.

2 Manipolazione di somme

È conveniente utilizzare le seguenti regole per semplificare i calcoli che coinvolgono l’operatore della sommatoria.

2.1 Proprietà 1

La sommatoria di \(n\) valori tutti pari alla stessa costante \(a\) è pari a \(n\) volte la costante stessa: [ {i=1}^{n} a = {n~} = n a. ]

2.2 Proprietà 2 (proprietà distributiva)

Nel caso in cui l’argomento contenga una costante, è possibile riscrivere la sommatoria. Ad esempio con [ {i=1}^{n} a x_i = a x_1 + a x_2 + + a x_n ] è possibile raccogliere la costante \(a\) e fare \(a(x_1 +x_2 + \dots + x_n)\). Quindi possiamo scrivere [ {i=1}^{n} a x_i = a _{i=1}^{n} x_i. ]

2.3 Proprietà 3 (proprietà associativa)

Nel caso in cui [ {i=1}^{n} (a + x_i) = (a + x_1) + (a + x_1) + (a + x_n) ] si ha che [ {i=1}^{n} (a + x_i) = n a + {i=1}^{n} x_i. ] È dunque chiaro che in generale possiamo scrivere [ {i=1}^{n} (x_i + y_i) = {i=1}^{n} x_i + {i=1}^{n} y_i. ]

2.4 Proprietà 4

Se deve essere eseguita un’operazione algebrica (innalzamento a potenza, logaritmo, ecc.) sull’argomento della sommatoria, allora tale operazione algebrica deve essere eseguita prima della somma. Per esempio, [ {i=1}^{n} x_i^2 = x_1^2 + x_2^2 + + x_n^2 ({i=1}^{n} x_i )^2. ]

2.5 Proprietà 5

Nel caso si voglia calcolare \(\sum_{i=1}^{n} x_i y_i\), il prodotto tra i punteggi appaiati deve essere eseguito prima e la somma dopo: [ _{i=1}^{n} x_i y_i = x_1 y_1 + x_2 y_2 + + x_n y_n, ] infatti, \(a_1 b_1 + a_2 b_2 \neq (a_1 + a_2)(b_1 + b_2)\).

3 Doppia sommatoria

È possibile incontrare la seguente espressione in cui figurano una doppia sommatoria e un doppio indice: [ {i=1}^{n}{j=1}^{m} x_{ij}. ]

La doppia sommatoria comporta che per ogni valore dell’indice esterno, \(i\) da \(1\) ad \(n\), occorre sviluppare la seconda sommatoria per \(j\) da \(1\) ad \(m\). Quindi, [ {i=1}^{3}{j=4}^{6} x_{ij} = (x_{1, 4} + x_{1, 5} + x_{1, 6}) + (x_{2, 4} + x_{2, 5} + x_{2, 6}) + (x_{3, 4} + x_{3, 5} + x_{3, 6}). ]

Un caso particolare interessante di doppia sommatoria è il seguente: [ {i=1}^{n}{j=1}^{n} x_i y_j ]

Si può osservare che nella sommatoria interna (quella che dipende dall’indice \(j\)), la quantità \(x_i\) è costante, ovvero non dipende dall’indice (che è \(j\)). Allora possiamo estrarre \(x_i\) dall’operatore di sommatoria interna e scrivere [ {i=1}^{n} ( x_i {j=1}^{n} y_j ). ]

Allo stesso modo si può osservare che nell’argomento della sommatoria esterna la quantità costituita dalla sommatoria in \(j\) non dipende dall’indice \(i\) e quindi questa quantità può essere estratta dalla sommatoria esterna. Si ottiene quindi [ {i=1}{n}{j=1}^{n} x_i y_j = {i=1}{n} ( x_i {j=1}^{n} y_j ) = {i=1}^{n} x_i {j=1}^{n} y_j. ]

3.0.1 Esercizio

Si verifichi quanto detto sopra nel caso particolare di \(x = \{2, 3, 1\}\) e \(y = \{1, 4, 9\}\), svolgendo prima la doppia sommatoria per poi verificare che quanto così ottenuto sia uguale al prodotto delle due sommatorie.

3.0.1.1 Soluzione

\[\begin{align} \sum_{i=1}^3 \sum_{j=1}^3 x_i y_j &= x_1y_1 + x_1y_2 + x_1y_3 + x_2y_1 + x_2y_2 + x_2y_3 + x_3y_1 + x_3y_2 + x_3y_3 \notag\\ &= 2 \times (1+4+9) + 3 \times (1+4+9) + 2 \times (1+4+9) = 84,\notag \end{align}\] ovvero [ (2 + 3 + 1) (1+4+9) = 84. ]

4 Sommatorie con R

Per evitare errori di calcolo, possiamo usare R per risolvere questo tipo di problemi. I dati a cui facciamo riferimento sono codificati nella forma di un vettore, il che corrisponde semplicemente ad un insieme ordinato di numeri. Solitamente è ciò che chiamiamo variabile, ovvero quello che uno psicologo misura e vuole descrivere o analizzare in qualche modo. Per esempio, una variabile può corrispondere al QI di un insieme di individui. Abbiamo visto che, in R, possiamo definire questo insieme di dati usando la funzione c() (che crea un vettore).

Supponiamo di avere misurato il QI di 5 persone e di avere ottenuto i risultati seguenti: 102, 98, 122, 109, 89.

Per manipolare questi dati, dobbiamo prima renderli disponibili nel workspace della sessione di R:

x <- c(102, 98, 122, 109, 89)
x
[1] 102  98 122 109  89

Supponiamo di volere sommare questi valori: \[ \sum_{i = 1}^5 x_i \]

Se sviluppiamo la notazione precedente, per i dati dell’esempio avremo \[ \sum_{i = 1}^5 x_i = x_1 + x_2 + x_3 + x_4 + x_5 \] laddove \[ x_1 = 102 \quad x_2 = 98 \quad x_3 = 122 \quad x_4 = 109 \quad x_5 = 89. \]

In R una sommatoria si svolge utilizzando la funzione sum(). Quindi, nel caso presente, avremo

sum(x)
[1] 520

La notazione della sommatoria viene utilizzata, per esempio, nel calcolo della media:

\[ \bar{x} = \frac{\sum_{i = 1}^{n} x_i}{n} \]

Nella formula precedente, sommiamo prima i valori contenuti nel vettore x e poi dividiamo il risultato ottenuto per n = 5, ovvero 520 / 5 = 104.

In R abbiamo

sum(x) / length(x)
[1] 104

laddove la funzione length(x) ci restituisce i numero di elementi che costituiscono il vettore x, ovvero 5 nel caso dell’esempio.

In maniera equivalente, per le proprietà delle sommatorie presentate sopra, la formula della media può essere scritta come \[ \bar{x} = \frac{1}{n}\sum_{i = 1}^{n} x_i = \sum_{i = 1}^{n}\frac{1}{n} x_i, \] il che significa che possiamo prima moltiplicare ciascun elemento di x per 1/n e poi sommare, come indicato qui di seguito: \[ (1/5 \times 102) + (1/5 \times 98) + (1/5 \times 122) + (1/5 \times 109) + (1/5 \times 89) \]

In R questo diventa

sum(1/5 * x)
[1] 104

perché

1/5 * x
[1] 20.4 19.6 24.4 21.8 17.8

corrisponde al vettore \[ (1/5 \times 102) + (1/5 \times 98) + (1/5 \times 122) + (1/5 \times 109) + (1/5 \times 89) \] dopodiché sommiamo utilizzando la funzione sum().

La cosa importante da ricordare è che le operazioni algebriche (in questo caso moltiplicare per 1/5), quando vengono applicate ad un vettore (nel nostro caso (102, 98, 122, 109, 89)) si calcolano elemento per elemento. Ovvero, a ciascun elemento viene applicata l’operazione algebrica indicata, cioè il valore 102 viene moltiplicato per 1/5, il valore 98 viene moltiplicato per 1/5, ecc.