Inferenza frequentista#
Nell’inferenza statistica, esistono due approcci principali: la statistica frequentista e la statistica bayesiana. Entrambi i metodi permettono di trarre conclusioni sulla popolazione di interesse analizzando i dati. Sebbene entrambi siano utilizzati per stimare quantità sconosciute, fare previsioni e testare ipotesi, differiscono nella loro interpretazione della probabilità e nell’integrazione di conoscenze precedenti ed evidenze.
Come visto precedentemente, la statistica bayesiana interpreta la probabilità come una misura di convinzione o grado di certezza riguardo a un evento. Questo approccio consente di incorporare conoscenze pregresse ed evidenze nell’analisi statistica utilizzando il teorema di Bayes. In questo contesto, il vero valore di un parametro della popolazione è trattato come una variabile casuale ed è costantemente aggiornato man mano che nuovi dati vengono raccolti. Ciò porta alla formazione di una distribuzione completa nello spazio dei parametri, nota come distribuzione a posteriori, che può essere utilizzata per fare previsioni probabilistiche e quantificare l’incertezza associata.
D’altra parte, la statistica frequentista interpreta la probabilità come la frequenza relativa a lungo termine di un evento in un numero infinito di prove. Questo approccio si basa sull’idea che il vero valore di un parametro della popolazione sia fisso ma sconosciuto e debba essere stimato dai dati. In questo contesto, le inferenze statistiche vengono ottenute dai dati osservati utilizzando varie tecniche statistiche e facendo alcune assunzioni riguardo al processo sottostante che genera i dati.
In questa sezione della dispensa, esamineremo i metodi frequentisti della stima puntuale, degli intervalli di confidenza e del test di ipotesi. Metteremo in evidenza i limiti dell’inferenza frequentista, riconosciuti negli ultimi decenni come una delle principali cause della crisi della riproducibilità dei risultati della ricerca [Bak16]. Infine, discuteremo gli errori di tipo S e di tipo M, concetti introdotti da Gelman and Carlin [GC14], che hanno contribuito a migliorare la comprensione dei limiti della statistica frequentista.