Capitolo 10 Terminologia
10.1 Metodi e procedure della psicologia
Una teoria psicologica di un qualche aspetto del comportamento umano (o della mente) ha le seguenti proprietà:
- descrive le caratteristiche del comportamento in questione,
- formula predizioni sulle caratteristiche future del comportamento,
- è sostenuta da evidenze empiriche,
- deve essere falsificabile (ovvero, in linea di principio, deve potere fare delle predizioni su aspetti del fenomeno considerato che non sono ancora noti e che, se venissero indagati, potrebbero portare a rigettare la teoria, se si dimostrassero incompatibili con essa).
L’analisi dei dati consente di valutare una teoria psicologica utilizzando i seguenti strumenti statistici:
- la misurazione,
- l’analisi descrittiva,
- l’inferenza.
Prima di affrontare il primo dei tre ambiti elencati sopra, ovvero quello della misurazione, prenderemo qui in esame la terminologia che verrà utilizzata.
10.2 Variabili e costanti
L’analisi dei dati inizia con l’individuazione delle unità portatrici di informazioni circa il fenomeno di interesse. Si dice popolazione (o universo) l’insieme \(\Omega\) delle entità capaci di fornire informazioni sul fenomeno oggetto dell’indagine statistica. Possiamo dunque scrivere \(\Omega = \{\omega_i\}_{i=1, \dots, n}= \{\omega_1, \omega_2, \dots, \omega_n\}\) oppure \(\Omega = \{\omega_1, \omega_2, \dots \}\) nel caso di popolazioni finite o infinite, rispettivamente. Gli elementi \(\omega_i\) dell’insieme \(\Omega\) sono detti unità statistiche. Un sottoinsieme della popolazione viene chiamato campione. Ciascuna unità statistica \(\omega_i\) (abbreviata con u.s.) è portatrice dell’informazione che verrà rilevata mediante un’operazione di misurazione.
Definiamo variabile statistica la proprietà (o grandezza) che è oggetto di studio nell’analisi dei dati. Una variabile è una proprietà di un fenomeno che può essere espressa in più valori sia numerici sia categoriali. Il termine “variabile” si contrappone al termine “costante” che descrive una proprietà invariante di tutte le unità statistiche.
Si dice modalità ciascuna delle varianti con cui una variabile statistica può presentarsi. Definiamo insieme delle modalità di una variabile statistica l’insieme \(M\) di tutte le possibili espressioni con cui la variabile può manifestarsi. Le modalità osservate e facenti parte del campione si chiamano dati (si veda la Tabella 1.1).
Fenomeno studiato | Popolazione | Variabile | Modalità | Tipo |
---|---|---|---|---|
Intelligenza | Tutti gli italiani | WAIS-IV | \(112\), \(92\), \(121\), … | Quantitativo discreto |
Velocità di esecuzione nel compito Stroop | Bambini dai 6 agli 8 anni | Reciproco dei tempi di reazione | \(1/2.36\) s, \(1/4.72\) s, \(1/3.81\) s, … | Quantitativo continuo |
Disturbo di personalità | Detenuti nelle carceri italiane | Assessment del disturbo di personalità tramite interviste cliniche strutturate | Cluster A, Cluster B, Cluster C proposti dal DSM-V | Qualitativo |
10.3 Variabili indipendenti e variabili dipendenti
Un primo compito fondamentale in qualsiasi analisi statistica è l’identificazione delle variabili dipendenti (\(Y\)) e delle variabili indipendenti (\(X\)). Le variabili dipendenti sono anche chiamate variabili di esito o di risposta e le variabili indipendenti sono anche chiamate predittori o covariate. Ad esempio, nell’analisi di regressione, che esamineremo in seguito, la domanda centrale è quella di capire come \(Y\) cambia al variare di \(X\). Più precisamente, la domanda che viene posta è: se il valore della variabile indipendente \(X\) cambia, qual è la conseguenza per la variabile dipendente \(Y\)? In parole povere, le variabili indipendenti e dipendenti sono analoghe a “cause” ed “effetti,” laddove le virgolette usate qui sottolineano che questa è solo un’analogia e che la determinazione delle cause può avvenire soltanto mediante l’utilizzo di un appropriato disegno sperimentale e di un’adeguata analisi statistica.
Se una variabile è una variabile indipendente o dipendente dipende dalla domanda di ricerca. A volte può essere difficile decidere quale variabile è dipendente e quale è indipendente, in particolare quando siamo specificamente interessati ai rapporti di causa/effetto. Ad esempio, supponiamo di indagare l’associazione tra esercizio fisico e insonnia. Vi sono evidenze che l’esercizio fisico (fatto al momento giusto della giornata) può ridurre l’insonnia. Ma l’insonnia può anche ridurre la capacità di una persona di fare esercizio fisico. In questo caso, dunque, non è facile capire quale sia la causa e quale l’effetto, quale sia la variabile dipendente e quale la variabile indipendente. La possibilità di identificare il ruolo delle variabili (dipendente/indipendente) dipende dalla nostra comprensione del fenomeno in esame.
10.4 La matrice dei dati
Le realizzazioni delle variabili esaminate in una rilevazione statistica vengono organizzate in una matrice dei dati. Le colonne della matrice dei dati contengono gli insiemi dei dati individuali di ciascuna variabile statistica considerata. Ogni riga della matrice contiene tutte le informazioni relative alla stessa unità statistica. Una generica matrice dei dati ha l’aspetto seguente: \[D_{m,n} = \begin{pmatrix} \omega_1 & a_{1} & b_{1} & \cdots & x_{1} & y_{1}\\ \omega_2 & a_{2} & b_{2} & \cdots & x_{2} & y_{2}\\ \vdots & \vdots & \vdots & \ddots & \vdots & \vdots \\ \omega_n & a_{n} & b_{n} & \cdots & x_{n} & y_{n} \end{pmatrix}\] dove, nel caso presente, la prima colonna contiene il nome delle unità statistiche, la seconda e la terza colonna si riferiscono a due mutabili statistiche (variabili categoriali; \(A\) e \(B\)) e ne presentano le modalità osservate nel campione mentre le ultime due colonne si riferiscono a due variabili statistiche (\(X\) e \(Y\)) e ne presentano le modalità osservate nel campione. Generalmente, tra le unità statistiche \(\omega_i\) non esiste un ordine progressivo; l’indice attribuito alle unità statistiche nella matrice dei dati si riferisce semplicemente alla riga che esse occupano.