18.4 Le regole di Wright

Lo scopo della path analysis è quello di decomporre la correlazione (o la covarianza) nei termini della somma di tutti i percorsi (diretti e indiretti) che legano le due variabili tramite i coefficienti detti path coefficients. Usando il path diagram, Sewall Wright (1921, 1934) enunciò le regole che, attraverso le cosiddette tracing rules, legano le correlazioni (o covarianze) delle variabili ai parametri del modello. Le tracing rules possono essere espresse nei termini seguenti:

  • è possibile procedere prima all’indietro lungo una freccia e poi in avanti, seguendo la direzione di una freccia, ma non si può andare prima avanti e poi tornare indietro;
  • un percorso composto non deve transitare due volte per la stessa variabile (non devono esserci loop);
  • un percorso non può comprendere più di una linea curva.

Si chiama “percorso” il tracciato che unisce due variabili; è costituito da sequenze di frecce direzionali e di curve non direzionali. A ciascun percorso legittimo (ovvero, che soddisfa le regole di Wright) viene assegnato un valore numerico pari al prodotto dei coefficienti incontrati sul percorso medesimo. I coefficienti di percorso possono essere o coefficienti parziali di regressione standardizzati, se il legame ha una direzione, oppure coefficienti di correlazione, se il legame è bidirezionale.

18.4.1 Scomposizione delle correlazioni (covarianze)

Il principio di base è stato espresso da Sewall Wright (1934) nel modo seguente: “Any correlation between variables in a network of sequential relations can be analyzed into contributions from all the paths (direct or through common factors) by which the two variables are connected, such that the value of each contribution is the product of the coefficients pertaining to the elementary paths. If residual correlations are present (represented by bidirectional arrows) one (but never more than one) of the coefficients thus multiplied together to give the contribution of the connecting path, may be a correlation coefficient. The others are all path coefficients.”

Possiamo così enunciare la regola di scomposizione della correlazione.

Definizione 18.1 La correlazione fra due variabili può essere decomposta in tanti addendi quanto sono i percorsi che le collegano; ogni addendo è dato dal prodotto dei coefficienti incontrati sul percorso.

Si consideri il diagramma rappresesentato nella Figura 18.2. La variabile endogena è la \(y\). Le variabili esogene, correlate tra loro, sono \(x_1\) e \(x_2\).

Il diagramma di percorso corrisponde alla seguente equazione:

\[ y = 0.50 x_1 + 0.40 x_2 + e, \]

dove le variabili \(x_1\) e \(x_2\) sono incorrelate con \(e\).

La correlazione tra \(y\) e \(x_1\) è uguale alla somma dell’effetto diretto che \(x_1\) esercita sulla \(y\) e dell’effetto indiretto che \(x_1\) esercita sulla \(y\) tramite la correlazione con \(x_2\). In base alle regole di Wright, \(x_1\) e \(y\) risultano collegate da due percorsi legittimi: il percorso costituito dalla freccia dritta \(x_1 \rightarrow y\); il percorso composto dalla freccia dritta \(x_2 \rightarrow y\) e dalla curva non direzionale \(x_1 \leftrightarrow x_2\). Il valore numerico del primo percorso è \(0.50\). Il valore numerico del secondo percorso è \(0.50\times 0.40\). La correlazione tra le variabili \(x_1\) e \(y\) è dunque uguale alla somma dei valori numerici dei due percorsi legittimi che legano \(x_1\) alla \(y\):

\[\begin{equation} \begin{aligned} r_{x_1,y} &= \beta_{y,x_1} + r_{x_1,x_2} \beta_{y,x_2}\notag\\ &= 0.50 + 0.50 \times 0.40 = 0.70.\notag \end{aligned} \end{equation}\]

La correlazione tra \(x_2\) e \(y\) è invece uguale a:

\[\begin{equation} \begin{aligned} r_{yx_2} &=\beta_{yx_2} + r_{x_1x_2} \beta_{yx_1}\notag\\ &= 0.40 + 0.50 \times 0.50 = 0.65.\notag \end{aligned} \end{equation}\]

18.4.2 Scomposizione della varianza

La varianza di una variabile endogena si decompone in una quota di varianza spiegata dalle variabili agenti causalmente su di essa e in una quota di varianza non spiegata.

Definizione 18.2 La varianza spiegata è data dalla somma di tanti addendi quanti sono i percorsi che consentono di collegare la variabile a se stessa rispettando le tracing rules di Wright.

Facendo riferimento alla Figura 18.2, si possono individuare quattro percorsi legittimi che collegano \(y\) a se stessa:

  1. \(0.50 \times 1.00 \times 0.50\),
  2. \(0.40 \times 1.00 \times 0.40\),
  3. \(0.50 \times 0.50 \times 0.40\),
  4. \(0.40 \times 0.50 \times 0.50\).

La varianza della variabile endogena \(y\) che viene spiegata dalle variabili esogene \(x_1\) e \(x_2\) è dunque uguale a

\[ 0.25 + 0.16 + 0.10 + 0.10= 0.61. \]

Inoltre, dato che le variabili rappresentate nel diagramma sono standardizzate, la varianza complessiva della \(y\) è uguale a 1.00. La varianza della \(y\) non spiegata dalle variabili \(x_1\) e \(x_2\) è quindi uguale a

\[ 1-0.61 = 0.39. \]