23.5 Metodo di massima verosimiglianza

L’applicazione del metodo di massima verosimiglianza è indicata quando si può assumere che le variabili manifeste seguono una distribuzione normale multivariata. Sotto tali condizioni, tale metodo produce le stime dei pesi fattoriali che più verosimilmente hanno prodotto le correlazioni osservate. Gli stimatori di massima verosimiglianza sono preferibili a quelli ottenuti con altri metodi, sempre che siano pienamente realizzate le premesse. La funzione \(F\) da minimizzare rappresenta una misura di “distanza” tra la matrice di covarianza osservata e quella predetta dal modello. Uguagliando a zero le derivate di \(F\) rispetto a \(\boldsymbol{\Lambda}\) e \(\boldsymbol{\Psi}\) si ottengono le equazioni per le stime di massima verosimiglianza di \(\hat{\boldsymbol{\Lambda}}\) e \(\hat{\boldsymbol{\Psi}}\). Risolvendo tali equazioni rispetto alle incognite \(\hat{\boldsymbol{\Lambda}}\) e \(\hat{\boldsymbol{\Psi}}\) si ricavano le stime di massima verosimiglianza.

Non esistendo una soluzione analitica per queste equazioni, si ricorre a procedimenti numerici iterativi che talvolta presentano problemi di convergenza. La soluzione, pur presentando la possibilità di fornire delle stime di comunalità superiori a 1 (caso di Heywood), è equivariante rispetto a cambiamenti di scala: le stime di massima verosimiglianza sono indipendenti dall’unità di misura delle variabili manifeste. Pertanto, si ottiene la stessa soluzione sia che si analizzi la matrice delle varianze e covarianze, sia che si analizzi la matrice delle correlazioni.

Consideriamo nuovamente i dati dell’esempio precedente. Le istruzioni sono le seguenti:

factanal(covmat = R, factors = 2, rotation = "none", n.obs = 225)
#> 
#> Call:
#> factanal(factors = 2, covmat = R, n.obs = 225, rotation = "none")
#> 
#> Uniquenesses:
#>     K     I     H     L     J 
#> 0.005 0.268 0.055 0.008 0.005 
#> 
#> Loadings:
#>   Factor1 Factor2
#> K  0.955  -0.289 
#> I  0.528   0.673 
#> H  0.720  -0.653 
#> L  0.954  -0.287 
#> J  0.764   0.642 
#> 
#>                Factor1 Factor2
#> SS loadings      3.203   1.457
#> Proportion Var   0.641   0.291
#> Cumulative Var   0.641   0.932
#> 
#> Test of the hypothesis that 2 factors are sufficient.
#> The chi square statistic is 648.09 on 1 degree of freedom.
#> The p-value is 5.81e-143