27.1 Indicatori continui

27.1.1 Intercette degli item

In generale, i modelli di equazioni strutturali vengono utilizzati per modellare unicamente la matrice di covarianza delle variabili osservate in un set di dati. Ricordiamo che, quando abbiamo introdotto il modello dell’analisi fattoriale,

\[ y_i = \mu + \lambda_j \xi_k + \delta_i, \]

per semplicità abbiamo ignorato la media \(\mu\) degli indicatori esprimendo i dati osservati nei termini degli scarti dalla media, \(y_i -\mu\), in quanto ciò lascia immutate le covarianze. Tuttavia, in alcune applicazioni (quali, appunto, l’invarianza di misura), è utile considerare anche le medie delle variabili osservate. Per includere nel modello fattoriale le informazioni sulle medie facciamo esplicito riferimento all’intercetta della precedente equazione. Usando la sintassi lavaan, la media di una variabile manifesta viene inserita nel modello specificando l’intercetta dell’equazione precedente come segue

my_item ~ 1

La parte sinistra dell’espressione precedente contiene il nome della variabile manifesta a cui si fa riferimento; la parte destra dell’espressione precedente specifica la presenza dell’intercetta.

Per esempio, nella specificazione di un modello a due fattori comuni, è possibile aggiungere al modello le medie delle variabili manifeste nel modo seguente:

mod1 <- "
  # two-factor model
  f1 =~ x1 + x2 + x3
  f2 =~ x4 + x5 + x6
  # intercepts
  x1 ~ 1
  x2 ~ 1
  x3 ~ 1
  x4 ~ 1
  x5 ~ 1
  x6 ~ 1
"

Tuttavia, è più conveniente omettere le intercette nella specificazione del modello e aggiungere l’argomento meanstructure = TRUE nella funzione cfa().

mod2 <- "
  f1 =~ x1 + x2 + x3
  f2 =~ x4 + x5 + x6
"

fit <- cfa(
  mod2,
  data = d,
  meanstructure = TRUE
)

Si noti che modelli con o senza meanstructure avranno la stessa statistica chi-quadrato e lo stesso numero di gradi di libertà. Il motivo è che, nel caso di un modello con meanstructure, vengono introdotti \(p\) nuovi dati (ovvero, il valore della media per ciascuno dei \(p\) indicatori) ma vengono anche stimati ulteriori \(p\) parametri (ovvero, un’intercetta per ciascuno dei \(p\) indicatori). Il risultato finale è che la bontà dell’adattamento resta immutata. In pratica, l’unico motivo per aggiungere le intercette nella sintassi del modello è quello di introdurre dei vincoli nella stima di tali parametri.

27.1.2 Terminologia

La discussione dell’invarianza di misura nel contesto della CFA fa uso della seguente terminologia.

L’invarianza configurale (configural invariance) verifica se la struttura dei fattori sia la stessa tra i gruppi, ovvero verifica la presenza dello stesso numero di fattori e della stessa struttura fattoriale (nella CFA) tra i gruppi.
L’invarianza metrica (metric invariance) o invarianza fattoriale debole (weak factorial invariance) verifica inoltre se le saturazioni fattoriali rimangono invariante tra i gruppi.
L’invarianza scalare (scalar invariance) o invarianza fattoriale forte verifica inoltre se le intercette degli item rimangono invariate tra i gruppi.
L’invarianza fattoriale rigorosa (strict factorial invariance) verifica inoltre se i residui degli indicatori rimangono invarianti tra i gruppi.

27.1.3 Un esempio concreto

Consideriamo qui un esempio discusso da Brown (2015). Il modello CFA riguarda un modello di misurazione per la depressione maggiore così come è definita nel DSM-IV. Il campione include 9 indicatori:

MDD1, depressed mood;
MDD2, loss of interest in usual activities;
MDD3, weight/appetite change;
MDD4, sleep disturbance;
MDD5, psychomotor agitation/retardation;
MDD6, fatigue/loss of energy;
MDD7, feelings of worthlessness/guilt;
MDD8, concentration difficulties;
MDD9, thoughts of death/suicidality.

Leggiamo i dati in \(\mathsf{R}\):

d <- readRDS(
  here::here("data", "mdd_sex.RDS")
)

I due gruppi considerati corrispondono al genere. Il problema riguarda l’invarianza fattoriale in funzione del genere. Consideriamo il seguente modello:

model_mdd <- "
  MDD =~ mdd1 + mdd2 + mdd3 + mdd4 + mdd5 + mdd6 + mdd7 + mdd8 +
         mdd9
  mdd1 ~~ mdd2
"

Si noti la presenza di una correlazione residua tra gli indicatori mdd1 e mdd2.

Esaminiamo dunque di seguito le varie forme di invarianza fattoriale. Si notino i vincoli che vengono via via introdotti quando vengono specificati modelli via via più restrittivi. Nella sintassi lavaan i vincoli vengono specificati dall’argomento group.equal.

Le forme di invarianza fattoriale qui verificate sono leggermente diverse da quelle elencate sopra.

# configural invariance
fit_ef <- cfa(
  model_mdd,
  data = d,
  group = "sex",
  meanstructure = TRUE
)
# plus equal factor loadings- metric invariance
fit_efl <- update(
  fit_ef,
  group.equal = c("loadings")
)
# plus equal indicator intercepts
fit_eii <- update(
  fit_efl,
  group.equal = c("loadings", "intercepts")
)
# plus equal indicator error variances
fit_eir <- update(
  fit_eii,
  group.equal = c("loadings", "intercepts", "residuals")
)
# plus equal factor variances
fit_fv <- update(
  fit_eir,
  group.equal = c(
    "loadings", "intercepts", "residuals",
    "lv.variances"
  )
)
# plus equal latent means
fit_fm <- update(
  fit_fv,
  group.equal = c(
    "loadings", "intercepts", "residuals",
    "lv.variances", "means"
  )
)

Confrontiamo i modelli:

lavTestLRT(fit_ef, fit_efl, fit_eii, fit_eir, fit_fv, fit_fm)
#> 
#> Chi-Squared Difference Test
#> 
#>         Df   AIC   BIC   Chisq Chisq diff    RMSEA Df diff Pr(>Chisq)
#> fit_ef  52 27526 27784  98.911                                       
#> fit_efl 60 27514 27736 102.839     3.9286 0.000000       8     0.8635
#> fit_eii 68 27510 27695 115.309    12.4699 0.038600       8     0.1314
#> fit_eir 77 27502 27645 125.021     9.7115 0.014520       9     0.3743
#> fit_fv  78 27501 27639 125.814     0.7931 0.000000       1     0.3732
#> fit_fm  79 27501 27635 127.734     1.9201 0.049533       1     0.1659

Il confronto tra i precedenti modelli nidificati che introducono vincoli sempre più stringenti sui parametri indica che non vi è una “significativa” perdita di bontà dell’adattamento passando dal modello congenerico al modello che assume l’uguaglianza delle saturazioni fattoriali, delle intercette, delle varianze residue, delle varianze delle variabili latenti e delle medie dei due gruppi. Per i dati discussi da Brown (2015), dunque, possiamo concludere che vi sono forti evidenze di invarianza fattoriale tra maschi e femmine in relazione al costrutto di depressione maggiore. L’invarianza fattoriali giustifica, per questi dati, un confronto tra le medie dei punteggi totali del test calcolate nei due gruppi.

References

Brown, Timothy A. 2015. Confirmatory Factor Analysis for Applied Research. Guilford publications.