3  La misurazione in psicologia

In questo capitolo imparerai a
  • conoscere le proprietà delle scale di misura di Stevens;
  • comprendere quali operazioni aritmetiche possono essere applicate a ciascun livello di scala e perchè;
  • distinguere tra variabili continue e discrete;
  • comprendere il concetto di bias.
Prerequisiti

3.1 Introduzione

La scienza si avvale di modelli per interpretare i dati, ma opera sempre con teorie incomplete e misurazioni soggette a errori. Di conseguenza, è fondamentale riconoscere le incertezze quando si cerca di estrarre informazioni dalle misurazioni utilizzando i nostri modelli. Nessuna misurazione, spiegazione o previsione è perfettamente accurata e precisa, e non possiamo mai conoscere con esattezza l’entità dei loro errori. Questo riconoscimento è alla base della teoria della misurazione, che cerca di quantificare e gestire queste incertezze per migliorare la qualità delle nostre conclusioni scientifiche.

Questa incertezza viene catturata in tre equazioni fondamentali. La prima è l’Equazione di Misurazione, che riconosce l’errore osservativo:

\[ y = z + \varepsilon_y, \]

dove \(y\) rappresenta il valore misurato, \(z\) il valore reale e \(\varepsilon_y\) l’errore di misurazione. La seconda è l’Equazione di Modellazione, che esprime la presenza di un diverso tipo di errore:

\[ z = f(x, \theta) + \varepsilon_\text{model}, \]

dove \(f\) è il modello, \(x\) sono le condizioni ambientali per cui eseguiamo il modello, \(\theta\) sono i valori dei parametri del modello e \(\varepsilon_\text{model}\) rappresenta l’errore del modello, che sorge perché \(f\), \(x\) e \(\theta\) saranno tutti in qualche misura imprecisi.

Combinando queste due equazioni, otteniamo l’Equazione della Scienza:

\[ y = f(x, \theta) + \varepsilon_\text{model} + \varepsilon_y. \]

La scienza è il tentativo di spiegare le osservazioni \(y\) utilizzando un modello \(f\), cercando di minimizzare l’errore di misurazione \(\varepsilon_y\) e l’errore del modello \(\varepsilon_\text{model}\), in modo che il modello possa essere utilizzato per fare previsioni sul mondo reale (\(z\)). L’approccio bayesiano alla scienza riconosce e quantifica le incertezze su tutti e sei gli elementi dell’Equazione della Scienza: \(y\), \(f\), \(x\), \(\theta\), \(\varepsilon_\text{model}\) e \(\varepsilon_y\).

3.2 La teoria della Misurazione

La teoria della misurazione, oggetto di questo capitolo, si concentra sull’errore di misurazione e sull’equazione fondamentale \(y = z + \varepsilon_y\). Questa equazione può essere esaminata da tre prospettive distinte. La prima concerne l’affidabilità della misura, rappresentata dal termine \(\varepsilon_y\). La psicometria, branca dedicata alla teoria della misurazione psicologica, si occupa di quantificare l’affidabilità delle misure psicologiche attraverso metodi come la Teoria Classica dei Test e la Teoria di Risposta all’Item.

La seconda prospettiva riguarda la validità delle misure psicologiche, ovvero quanto adeguatamente la misura \(y\) rappresenti il costrutto \(z\). Questo aspetto, più complesso dell’affidabilità, non può essere risolto meramente con metodi statistici, ma richiede una profonda comprensione delle teorie psicologiche e della loro capacità di descrivere e prevedere i fenomeni psicologici.

La terza prospettiva si concentra sulle procedure di assegnazione dei valori a \(y\), esplorando quali metodi (questionari, interviste, esperimenti) siano più appropriati e come valutarne l’adeguatezza.

3.2.1 Costrutti Psicologici

La teoria della misurazione sottolinea l’importanza di distinguere tra la procedura di misurazione e il costrutto che si intende misurare. Ad esempio, mentre la temperatura è un costrutto, il termometro è lo strumento di misurazione. Analogamente, l’abilità matematica è un costrutto, mentre un test di matematica è la procedura per misurarla.

Nelle scienze psicologiche e sociali, la misurazione presenta sfide uniche rispetto alle scienze fisiche, poiché i costrutti in esame sono spesso astratti e non direttamente osservabili. Ciò richiede una particolare attenzione alla validità e all’affidabilità degli strumenti di misurazione, nonché una costante riflessione sulle limitazioni e le potenziali fonti di errore.

Il capitolo introduce concetti fondamentali relativi alla misurazione quantitativa delle caratteristiche psicologiche, con un focus sulla teoria delle scale di misura di Stevens (1946). Questa teoria fornisce un quadro concettuale per comprendere i diversi tipi di scale di misurazione e le operazioni matematiche appropriate per ciascuna. Inoltre, vengono esplorate alcune procedure di scaling psicologico, ovvero l’assegnazione di numeri all’intensità di fenomeni psicologici.

3.2.2 Scaling Psicologico

Lo scaling psicologico si occupa della trasformazione dei dati empirici raccolti durante uno studio psicologico in misure o punteggi che rappresentino accuratamente le caratteristiche psicologiche oggetto di indagine.

Scaling di Guttman. Uno dei metodi di scaling più noti è lo «Scaling di Guttman», che viene utilizzato per rappresentare relazioni ordinate tra gli elementi di una scala. Ad esempio, in un questionario sui sintomi dell’ansia, le domande possono essere disposte in ordine di intensità crescente dei sintomi. Secondo il modello di Guttman, se un partecipante risponde “sì” a una domanda che riflette un sintomo più intenso, ci si aspetta che abbia risposto “sì” anche a tutte le domande precedenti, che rappresentano sintomi di intensità minore. Questo approccio consente di costruire una scala che riflette in modo sistematico e coerente la gravità dei sintomi.

Scaling Thurstoniano. Lo «Scaling Thurstoniano» è un metodo utilizzato per misurare preferenze o giudizi soggettivi. Ad esempio, per valutare la preferenza tra diversi tipi di cibi, i partecipanti confrontano due cibi alla volta ed esprimono una preferenza. Le risposte vengono poi utilizzate per assegnare punteggi che riflettono la preferenza media per ciascun cibo.

Scaling Fechneriano. Lo scaling fechneriano si basa sulla legge di Fechner, secondo cui la percezione di uno stimolo aumenta in modo logaritmico rispetto alla sua intensità fisica. La misura fondamentale è la JND (Just Noticeable Difference), ovvero la minima differenza percepibile tra due stimoli. Secondo Fechner, sommando le JND si ottiene una scala psicologica dell’intensità percepita, utile per studiare grandezze sensoriali come luminosità, peso e suono (per es., Domini & Caudek, 2009).

Questionari Likert. I questionari Likert richiedono ai partecipanti di esprimere il loro grado di accordo con una serie di affermazioni su una scala a più livelli, che va da «fortemente in disaccordo» a «fortemente d’accordo». I punteggi ottenuti vengono sommati per rappresentare la posizione complessiva dell’individuo rispetto all’oggetto di studio.

3.2.3 Metodi di Valutazione delle Scale Psicologiche

Per valutare le proprietà delle scale psicologiche, vengono utilizzati vari metodi. Ad esempio, l’affidabilità delle misure può essere analizzata utilizzando il coefficiente alpha di Cronbach o il coefficiente Omega di McDonald, entrambi utilizzati per misurare la coerenza interna delle risposte ai diversi item di un questionario. Inoltre, la validità delle scale può essere esaminata confrontando i risultati ottenuti con misure simili o attraverso analisi statistiche che verificano se la scala cattura accuratamente il costrutto psicologico che si intende misurare. La validità di costrutto è particolarmente cruciale, poiché riguarda la capacità della scala di misurare effettivamente il concetto psicologico che si intende esplorare.

3.2.4 Prospettive Moderne

Negli ultimi anni, il dibattito sulla misurazione psicologica si è arricchito di nuove prospettive, grazie all’avvento di tecnologie avanzate e all’integrazione di approcci interdisciplinari. Ecco alcune delle tendenze più rilevanti.

Teoria della Risposta agli Item. La Teoria della Risposta agli Item (IRT) ha guadagnato popolarità per la sua capacità di fornire stime più precise delle abilità latenti rispetto ai modelli classici. La IRT considera la probabilità che un individuo risponda correttamente a un item in funzione della sua abilità e delle caratteristiche dell’item stesso, offrendo una visione più dettagliata delle proprietà psicometriche degli strumenti di misurazione.

Approcci Bayesiani. Gli approcci bayesiani stanno rivoluzionando il campo della psicometria, permettendo di incorporare informazioni a priori nelle stime e di aggiornare le credenze sulla base di nuovi dati. Questi metodi sono particolarmente utili per affrontare la complessità e l’incertezza inerenti alla misurazione psicologica.

Analisi di Rete. L’analisi di rete è un’altra metodologia emergente che vede i costrutti psicologici non come variabili latenti indipendenti, ma come reti di sintomi interconnessi. Questo approccio può offrire nuove intuizioni sulla struttura delle psicopatologie e sulla dinamica dei sintomi.

3.3 Le scale di misurazione

Le scale di misurazione sono strumenti fondamentali per assegnare numeri ai dati osservati, rappresentando le proprietà psicologiche. La teoria delle scale di Stevens (1946) identifica quattro tipi di scale di misurazione: nominali, ordinali, a intervalli e di rapporti. Ognuna di queste scale consente di effettuare operazioni aritmetiche diverse, poiché ciascuna di esse è in grado di “catturare” solo alcune delle proprietà dei fenomeni psicologici che si intende misurare.

Scale di misurazione.

3.3.1 Scala nominale

La scala nominale è il livello di misurazione più semplice e corrisponde ad una tassonomia o classificazione delle categorie che utilizziamo per descrivere i fenomeni psicologici. I simboli o numeri che costituiscono questa scala rappresentano i nomi delle categorie e non hanno alcun valore numerico intrinseco. Con la scala nominale possiamo solo distinguere se una caratteristica psicologica è uguale o diversa da un’altra.

I dati raccolti con la scala nominale sono suddivisi in categorie qualitative e mutuamente esclusive, in cui ogni dato appartiene ad una sola categoria. In questa scala, esiste solo la relazione di equivalenza tra le misure delle unità di studio: gli elementi del campione appartenenti a classi diverse sono differenti, mentre tutti quelli della stessa classe sono tra loro equivalenti.

L’unica operazione algebrica consentita dalla scala nominale è quella di contare le unità di studio che appartengono ad ogni categoria e il numero totale di categorie. Di conseguenza, la descrizione dei dati avviene tramite le frequenze assolute e le frequenze relative.

Dalla scala nominale è possibile costruire altre scale nominali equivalenti alla prima, trasformando i valori della scala di partenza in modo tale da cambiare i nomi delle categorie, ma lasciando inalterata la suddivisione delle unità di studio nelle medesime classi di equivalenza. In altre parole, cambiando i nomi delle categorie di una variabile misurata su scala nominale, si ottiene una nuova variabile esattamente equivalente alla prima.

3.3.2 Scala ordinale

La scala ordinale mantiene la caratteristica della scala nominale di classificare ogni unità di misura all’interno di una singola categoria, ma introduce la relazione di ordinamento tra le categorie. In quanto basata su una relazione di ordine, una scala ordinale descrive solo il rango di ordine tra le categorie e non fornisce informazioni sulla distanza tra di esse. Non ci dice, ad esempio, se la distanza tra le categorie \(a\) e \(b\) è uguale, maggiore o minore della distanza tra le categorie \(b\) e \(c\).

Un esempio classico di scala ordinale è quello della scala Mohs per la determinazione della durezza dei minerali. Per stabilire la durezza dei minerali si usa il criterio empirico della scalfittura. Vengono stabiliti livelli di durezza crescente da 1 a 10 con riferimento a dieci minerali: talco, gesso, calcite, fluorite, apatite, ortoclasio, quarzo, topazio, corindone e diamante. Un minerale appartenente ad uno di questi livelli se scalfisce quello di livello inferiore ed è scalfito da quello di livello superiore.

La scala di durezza dei minerali di Mohs. Un oggetto è considerato più duro di X se graffia X. Sono incluse anche misure di durezza relativa utilizzando uno sclerometro, da cui emerge la non linearità della scala di Mohs (Burchard, 2004).

3.3.3 Scala ad intervalli

La scala ad intervalli di misurazione include le proprietà della scala nominale e della scala ordinale e permette di misurare le distanze tra le coppie di unità statistiche in termini di un intervallo costante, chiamato “unità di misura”, a cui viene attribuito il valore “1”. L’origine della scala, ovvero il punto zero, è scelta arbitrariamente e non indica l’assenza della proprietà che si sta misurando. Ciò significa che la scala ad intervalli consente anche valori negativi e lo zero non viene attribuito all’unità statistica in cui la proprietà risulta assente.

La scala ad intervalli equivalenti consente l’esecuzione di operazioni algebriche basate sulla differenza tra i numeri associati ai diversi punti della scala, operazioni algebriche non possibili con le scale di misura nominale o ordinale. Tuttavia, il limite della scala ad intervalli è che non consente di calcolare il rapporto tra coppie di misure. È possibile affermare la differenza tra \(a\) e \(b\) come la metà della differenza tra \(c\) e \(d\) o che le due differenze sono uguali, ma non è possibile affermare che \(a\) abbia una proprietà misurata in quantità doppia rispetto a \(b\). In altre parole, non è possibile stabilire rapporti diretti tra le misure ottenute. Solo le differenze tra le modalità permettono tutte le operazioni aritmetiche, come la somma, l’elevazione a potenza o la divisione, che sono alla base della statistica inferenziale.

Nelle scale ad intervalli equivalenti, l’unità di misura è arbitraria e può essere cambiata attraverso una dilatazione, ovvero la moltiplicazione di tutti i valori della scala per una costante positiva. Inoltre, la traslazione, ovvero l’aggiunta di una costante a tutti i valori della scala, è ammessa poiché non altera le differenze tra i valori della scala. La scala rimane invariata rispetto a traslazioni e dilatazioni e dunque le uniche trasformazioni ammissibili sono le trasformazioni lineari:

\[ y' = a + by, \quad b > 0. \]

Infatti, l’uguaglianza dei rapporti fra gli intervalli rimane invariata a seguito di una trasformazione lineare.

Esempio di scala ad intervalli è la temperatura misurata in gradi Celsius o Fahrenheit, ma non Kelvin. Come per la scala nominale, è possibile stabilire se due modalità sono uguali o diverse: \(30^\circ C \neq 20^\circ C\). Come per la scala ordinale è possibile mettere due modalità in una relazione d’ordine: \(30^\circ C > 20^\circ C\). In aggiunta ai casi precedenti, però, è possibile definire una unità di misura per cui è possibile dire che tra \(30^\circ C\) e \(20^\circ C\) c’è una differenza di \(30^\circ - 20^\circ = 10^\circ C\). I valori di temperatura, oltre a poter essere ordinati secondo l’intensità del fenomeno, godono della proprietà che le differenze tra loro sono direttamente confrontabili e quantificabili.

Il limite della scala ad intervalli è quello di non consentire il calcolo del rapporto tra coppie di misure. Ad esempio, una temperatura di \(80^\circ C\) non è il doppio di una di \(40^\circ C\). Se infatti esprimiamo le stesse temperature nei termini della scala Fahrenheit, allora i due valori non saranno in rapporto di 1 a 2 tra loro. Infatti, \(20^\circ C = 68^\circ F\) e \(40^\circ C = 104^\circ F\). Questo significa che la relazione “il doppio di” che avevamo individuato in precedenza si applicava ai numeri della scala centigrada, ma non alla proprietà misurata (cioè la temperatura). La decisione di che scala usare (Centigrada vs. Fahrenheit) è arbitraria. Ma questa arbitrarietà non deve influenzare le inferenze che traiamo dai dati. Queste inferenze, infatti, devono dirci qualcosa a proposito della realtà empirica e non possono in nessun modo essere condizionate dalle nostre scelte arbitrarie che ci portano a scegliere la scala Centigrada piuttosto che quella Fahrenheit.

Consideriamo ora l’aspetto invariante di una trasformazione lineare, ovvero l’uguaglianza dei rapporti fra intervalli. Prendiamo in esame, ad esempio, tre temperature: \(20^\circ C = 68^\circ F\), \(15^\circ C = 59^\circ F\), \(10^\circ C = 50 ^\circ F\).

È facile rendersi conto del fatto che i rapporti fra intervalli restano costanti indipendentemente dall’unità di misura che è stata scelta:

\[ \frac{20^\circ C - 10^\circ C}{20^\circ C - 15^\circ C} = \frac{68^\circ F - 50^\circ F}{68^\circ F-59^\circ F} = 2. \]

3.3.4 Scala di rapporti

Nella scala a rapporti equivalenti, lo zero non è arbitrario e rappresenta l’elemento che ha intensità nulla rispetto alla proprietà misurata. Per costruire questa scala, si associa il numero 0 all’elemento con intensità nulla e si sceglie un’unità di misura \(u\). Ad ogni elemento si assegna un numero \(a\) definito come \(a = d / u\), dove \(d\) rappresenta la distanza dall’origine. In questo modo, i numeri assegnati riflettono le differenze e i rapporti tra le intensità della proprietà misurata.

In questa scala, è possibile effettuare operazioni aritmetiche non solo sulle differenze tra i valori della scala, ma anche sui valori stessi della scala. L’unica scelta arbitraria è l’unità di misura, ma lo zero deve sempre rappresentare l’intensità nulla della proprietà considerata.

Le trasformazioni ammissibili in questa scala sono chiamate trasformazioni di similarità e sono del tipo \(y' = by\), dove \(b > 0\). In questa scala, i rapporti tra i valori rimangono invariati dopo le trasformazioni. In altre parole, se rapportiamo due valori originali e due valori trasformati, il rapporto rimane lo stesso: \(\frac{y_i}{y_j} = \frac{y'_i}{y'_j}\).

3.4 Gerarchia dei livelli delle scale di misurazione

Secondo Stevens (1946), esiste una gerarchia dei livelli delle scale di misurazione, denominati “livelli di scala”. Questi livelli sono organizzati in modo gerarchico, in cui la scala nominale rappresenta il livello più basso della misurazione, mentre la scala a rapporti equivalenti rappresenta il livello più alto.

  • Scala nominale: Classifica le categorie senza un ordine specifico.
  • Scala ordinale: Classifica le categorie in un ordine specifico, ma senza una misura precisa delle distanze.
  • Scala a intervalli: Misura le distanze tra le categorie con un intervallo costante, ma senza un punto zero assoluto.
  • Scala di rapporti: Misura le distanze con un intervallo costante e un punto zero assoluto.

Relazioni tra i livelli di misurazione.

Passando da un livello di misurazione ad uno più alto aumenta il numero di operazioni aritmetiche che possono essere compiute sui valori della scala.

3.4.1 Variabili Discrete e Continue

Le variabili possono essere classificate come variabili a livello di intervalli o di rapporti e possono essere sia discrete che continue.

  • Variabili discrete: Assumono valori specifici ma non possono assumere valori intermedi.
  • Variabili continue: Possono assumere qualsiasi valore all’interno di un intervallo specificato.

Variabili discrete e continue.

3.5 Interazione tra Teoria Sostanziale e Misurazione nella Ricerca Scientifica

3.5.1 Un caso studio sul mind-body healing

Un esempio di lettura critica della letteratura scientifica è offerto dall’analisi di uno studio sul mind-body healing pubblicato su Nature Aungle & Langer (2023). La ricerca riporta miglioramenti nella salute fisica associati a pratiche mente-corpo, ma è stata oggetto di severe critiche metodologiche da parte del statistico Andrew Gelman sul blog Statistical Modeling. Questo caso rivela due aspetti fondamentali spesso trascurati: il ruolo della teoria sostanziale e i criteri di misurazione rigorosa.

3.5.2 La Teoria Sostanziale come Fondamento

Gelman evidenzia un deficit epistemologico centrale: l’assenza di un framework teorico convincente che spieghi i meccanismi causali ipotizzati. Senza una teoria che:

  • Definisca in modo univoco i costrutti (es.: “guarigione mente-corpo”)
  • Identifichi pathways biologici o psicologici plausibili
  • Si integri con conoscenze consolidate (es.: neuroscienze, immunologia),

i risultati empirici perdono significato scientifico, rischiando di degenerare in quella che Gelman definisce “junk science”. Una teoria solida non è solo un optional descrittivo, ma una precondizione per:

  1. Formulare ipotesi verificabili
  2. Interpretare correlazioni in termini causali
  3. Evitare inferenze speculative o tautologiche.

3.5.3 Criticità nella Misurazione

Lo studio presenta inoltre problemi operazionali rilevanti:

3.5.3.1 A. Validità degli strumenti

  • La misurazione delle pratiche mente-corpo non controlla adeguatamente:
    • Fattori confondenti (aspettative dei partecipanti, effetto placebo)
    • Bias di autovalutazione
  • Gli outcome clinici utilizzano scale non validate, compromettendo la comparabilità dei risultati.

3.5.3.2 Questioni di validità

  • Interna: L’assenza di blinding e randomizzazione rigorosa mina l’attribuzione causale.
  • Esterna: Campioni non rappresentativi limitano la generalizzabilità (per approfondimenti, si veda Capitolo 34).

Come discusso nella letteratura metodologica (Accuracy and Precision), la qualità delle misurazioni determina direttamente l’affidabilità delle conclusioni. Misure distorte o imprecise generano un “rumore” statistico che oscura eventuali segnali reali.

3.5.4 Verso una Valutazione Integrata

La lettura critica di questo articolo mostra come la critica scientifica deve simultaneamente considerare due piani:

Dimensione Rischi di Negligenza
Teorica Interpretazioni ad hoc, ipotesi non falsificabili
Operativa Artefatti metodologici, misurazioni inadeguate, conclusioni spurie

Una ricerca rigorosa richiede un circolo ermeneutico tra teoria e dati: le misurazioni devono testare ipotesi derivate da framework teorici, mentre i risultati empirici devono raffinare le teorie stesse. Senza questo dialogo, si cade nel dualismo sterile tra:

  • Empirismo naïve (raccolta dati acritica)
  • Teorizzazione dogmatica (slegata dall’evidenza).

In sintesi, la lettura critica di articoli scientifici esige:

  • competenza transdisciplinare (statistica, epistemologia, conoscenze del dominio),
  • consapevolezza sui limiti della misurazione di costrutti.

Come illustrato nell’analisi di Gelman, solo integrando valutazioni teoriche e metodologiche è possibile distinguere scienza robusta da pseudoscienza. Questo approccio non è meramente “difensivo”, ma costituisce il motore stesso del progresso scientifico, come approfondito nelle riflessioni su validità interna/esterna.

3.6 Riflessioni Conclusive

La misurazione in psicologia non è un semplice atto di raccolta di dati, ma un processo fondamentale per garantire che le osservazioni empiriche siano interpretabili alla luce di modelli teorici solidi. Una buona misurazione non si limita a ridurre l’errore, ma consente di attribuire un significato coerente ai punteggi ottenuti, facilitando così il progresso della conoscenza scientifica. Senza strumenti adeguati per la misurazione, il rischio è quello di costruire teorie su basi incerte, compromettendo la validità delle conclusioni tratte.

Due pilastri sostengono dunque una ricerca psicologica rigorosa: la teoria e la misurazione. La teoria fornisce il quadro concettuale entro cui si interpretano i dati, definendo le ipotesi e orientando le analisi. La misurazione, invece, è il ponte tra i costrutti astratti e le osservazioni empiriche, traducendo concetti complessi in variabili operative affidabili. Nessuna delle due componenti può reggersi senza l’altra: una teoria senza misurazione adeguata rischia di rimanere speculativa, mentre una misurazione priva di un solido fondamento teorico può portare a dati privi di significato.

Nella valutazione di un qualsiasi studio psicologico, un approccio critico richiede quindi di esaminare sia la solidità del quadro teorico sia la qualità degli strumenti di misurazione adottati. Il progresso della ricerca dipende dalla capacità di integrare questi due elementi, attraverso metodologie che riducano l’incertezza e migliorino la precisione delle inferenze. Le moderne tecniche di analisi dei dati, i modelli psicometrici avanzati e le tecnologie digitali stanno ampliando le possibilità di misurazione, offrendo strumenti più sensibili e adattabili alla complessità dei fenomeni psicologici. Tuttavia, la sfida principale rimane la stessa: garantire che la misurazione sia non solo accurata, ma anche teoricamente fondata, affinché le conoscenze acquisite possano davvero contribuire alla comprensione della mente e del comportamento umano.

Esercizi

Esercizio 1: Identificazione del Livello di Misurazione

Obiettivo: Comprendere i diversi livelli di misurazione applicati alla psicologia.

  1. Identifica il livello di misurazione (nominale, ordinale, intervalli, rapporti) per ciascuna delle seguenti variabili psicologiche:

      1. Tipo di terapia psicologica (Cognitivo-comportamentale, Psicodinamica, Umanistica)
      1. Livello di ansia auto-riferito su una scala da 1 a 10
      1. Numero di episodi depressivi in un anno
      1. Tempo di reazione in millisecondi in un test cognitivo

Esercizio 2: Confronto tra Scale

Obiettivo: Comprendere le differenze tra le scale di misurazione.

  1. Spiega la differenza tra una scala ordinale e una scala a intervalli utilizzando l’esempio della soddisfazione lavorativa.
  2. Perché il punteggio QI è misurato su una scala a intervalli e non su una scala a rapporti?
  3. In che modo il punteggio di una scala di autostima su una scala Likert differisce da una misurazione su una scala di rapporti?

Esercizio 3: Operazioni Aritmetiche Consentite

Obiettivo: Comprendere le operazioni matematiche consentite per ciascun livello di misurazione.

  1. Quali operazioni aritmetiche sono ammissibili per una scala nominale?
  2. Può avere senso calcolare la media di punteggi su una scala ordinale? Perché?
  3. Se hai misurato il tempo di reazione in secondi, quali operazioni aritmetiche puoi eseguire?

Esercizio 4: Trasformazioni Ammissibili

Obiettivo: Comprendere le trasformazioni possibili per ogni scala di misurazione.

  1. Se una variabile è misurata su una scala nominale, quale tipo di trasformazione è consentita?
  2. Per una scala a intervalli, quali trasformazioni matematiche sono permesse senza alterare le proprietà della scala?
  3. Quale tipo di trasformazione è consentita su una scala di rapporti?

Esercizio 5: Applicazione delle Scale a Dati Psicologici

Obiettivo: Applicare i concetti a contesti psicologici reali.

  1. Una scala di ansia clinica fornisce punteggi compresi tra 0 e 100. Quale livello di misurazione è più appropriato e perché?
  2. Un esperimento misura la memoria dichiarativa chiedendo ai partecipanti di ricordare un elenco di parole. Come dovrebbe essere misurata la variabile “numero di parole ricordate”?
  3. In uno studio sulla personalità, i tratti vengono classificati come “estroverso” e “introverso”. Qual è il livello di misurazione?

Esercizio 6: Valutazione della Scala di Misurazione

Obiettivo: Identificare la corretta scala di misurazione per vari fenomeni psicologici.

  1. Il livello di aggressività misurato su una scala da 1 a 5 è nominale, ordinale, intervalli o rapporti? Giustifica la tua risposta.
  2. Il numero di attacchi di panico in una settimana può essere considerato su scala ordinale? Perché sì o perché no?
  3. Un test di intelligenza misura il QI con una media di 100 e una deviazione standard di 15. Qual è il livello di misurazione e quali sono le implicazioni per l’analisi statistica?

Esercizio 7: Costruzione di una Scala Psicologica

Obiettivo: Creare una scala di misurazione per una variabile psicologica.

  1. Se dovessi costruire una scala per misurare la resilienza, quale livello di misurazione sceglieresti e perché?
  2. Come potresti trasformare una scala nominale di preferenza musicale in una scala ordinale?
  3. Un questionario sulla qualità della vita chiede ai partecipanti di valutare la loro felicità su una scala da 1 a 10. È una scala a intervalli o ordinale? Giustifica.

Esercizio 8: Interpretazione Statistica dei Dati

Obiettivo: Collegare il livello di misurazione alle tecniche statistiche appropriate.

  1. Perché una mediana è più appropriata della media per dati ordinali?
  2. Quale test statistico sarebbe più adatto per confrontare due gruppi su una variabile nominale?
  3. Quali analisi possono essere condotte su dati raccolti su una scala a rapporti?

Esercizio 9: Misurazione e Inferenze Psicologiche

Obiettivo: Riflettere su come il livello di misurazione influisce sulle conclusioni di una ricerca.

  1. Se un test di personalità usa una scala Likert da 1 a 7, quali precauzioni devono essere prese nell’interpretare le differenze tra punteggi?
  2. Un questionario di benessere assegna punteggi tra 0 e 100, ma non ha uno zero assoluto. Quale scala è questa e quali sono le limitazioni?
  3. In uno studio sulla depressione, i sintomi vengono codificati come “assenti”, “moderati” o “gravi”. Che tipo di scala è questa e quali statistiche possono essere usate per analizzarla?

Esercizio 10: Esperimenti Psicologici e Misurazione

Obiettivo: Applicare la teoria della misurazione nella progettazione di esperimenti psicologici.

  1. Se un esperimento misura la memoria a breve termine con un compito di richiamo di parole, quale scala di misurazione utilizzeresti?
  2. Come la scelta della scala di misurazione può influenzare le inferenze che si possono trarre da un esperimento?
  3. Quali tipi di analisi statistica sono appropriati per dati misurati su scala ordinale rispetto a scala di rapporti?

Esercizio 1: Identificazione del Livello di Misurazione

Obiettivo: Comprendere i diversi livelli di misurazione applicati alla psicologia.

  1. Identifica il livello di misurazione (nominale, ordinale, intervalli, rapporti) per ciascuna delle seguenti variabili psicologiche:
      1. Nominale (Tipo di terapia psicologica è una classificazione senza ordine)
      1. Ordinale (Scala da 1 a 10, con ordine ma senza distanze uguali)
      1. Rapporti (Numero di episodi depressivi ha uno zero assoluto e si possono fare rapporti tra valori)
      1. Rapporti (Tempo di reazione ha uno zero assoluto e permette operazioni di rapporto)

Esercizio 2: Confronto tra Scale

Obiettivo: Comprendere le differenze tra le scale di misurazione.

  1. La scala ordinale fornisce un ordine ma non permette di calcolare differenze precise, mentre la scala a intervalli ha differenze costanti tra i valori. Ad esempio, “soddisfazione lavorativa” su una scala da 1 a 5 è ordinale, mentre il punteggio di un test psicologico è a intervalli.
  2. Il punteggio QI è a intervalli perché la differenza tra punteggi è significativa, ma non ha uno zero assoluto che rappresenta l’assenza di intelligenza.
  3. Una scala Likert misura il livello di accordo con una dichiarazione, quindi è generalmente considerata ordinale, nonostante sia trattata spesso come una scala a intervalli.

Esercizio 3: Operazioni Aritmetiche Consentite

Obiettivo: Comprendere le operazioni matematiche consentite per ciascun livello di misurazione.

  1. Nella scala nominale si può solo contare la frequenza delle categorie (ad es., il numero di partecipanti che usano un tipo di terapia).
  2. No, la media su dati ordinali può essere fuorviante perché le distanze tra le categorie non sono necessariamente uguali. Meglio usare la mediana.
  3. Sul tempo di reazione si possono eseguire tutte le operazioni aritmetiche, inclusa la media, la moltiplicazione e i rapporti tra valori.

Esercizio 4: Trasformazioni Ammissibili

Obiettivo: Comprendere le trasformazioni possibili per ogni scala di misurazione.

  1. Sulla scala nominale, solo le trasformazioni di ricodifica (ad esempio, cambiare i nomi delle categorie) sono permesse.
  2. Per una scala a intervalli, si possono effettuare trasformazioni lineari della forma y’ = a + by con b > 0.
  3. Per una scala di rapporti, sono consentite trasformazioni di similarità della forma y’ = by, dove b > 0.

Esercizio 5: Applicazione delle Scale a Dati Psicologici

Obiettivo: Applicare i concetti a contesti psicologici reali.

  1. Scala a intervalli, perché ha differenze costanti tra i punteggi ma nessuno zero assoluto.
  2. Scala di rapporti, perché il numero di parole ricordate ha uno zero assoluto e consente operazioni di rapporto.
  3. Nominale, perché non vi è un ordine gerarchico tra le categorie “estroverso” e “introverso”.

Esercizio 6: Valutazione della Scala di Misurazione

Obiettivo: Identificare la corretta scala di misurazione per vari fenomeni psicologici.

  1. Ordinale, perché il livello di aggressività segue un ordine, ma le differenze tra i livelli non sono necessariamente uguali.
  2. No, perché il numero di attacchi di panico è una variabile discreta e misurabile su scala di rapporti.
  3. Intervalli, perché il punteggio QI ha distanze costanti tra i valori, ma non ha uno zero assoluto.

Esercizio 7: Costruzione di una Scala Psicologica

Obiettivo: Creare una scala di misurazione per una variabile psicologica.

  1. Ordinale o a intervalli, a seconda della precisione della misurazione della resilienza.
  2. Si potrebbe assegnare un valore numerico crescente alle categorie di preferenza musicale per ottenere una scala ordinale.
  3. È una scala ordinale, perché la differenza tra livelli non è necessariamente costante.

Esercizio 8: Interpretazione Statistica dei Dati

Obiettivo: Collegare il livello di misurazione alle tecniche statistiche appropriate.

  1. Perché la mediana è meno sensibile ai valori estremi rispetto alla media.
  2. Un test chi-quadrato è adatto per confrontare frequenze di dati nominali tra gruppi.
  3. Si possono calcolare media, deviazione standard e utilizzare test parametrici come t-test o ANOVA.

Esercizio 9: Misurazione e Inferenze Psicologiche

Obiettivo: Riflettere su come il livello di misurazione influisce sulle conclusioni di una ricerca.

  1. I punteggi Likert sono ordinali, quindi confronti tra differenze di punteggio devono essere interpretati con cautela.
  2. Intervalli, perché non ha uno zero assoluto, il che limita l’uso di operazioni moltiplicative.
  3. Ordinale, e si possono usare test non parametrici come il test di Kruskal-Wallis o il test di Mann-Whitney.

Esercizio 10: Esperimenti Psicologici e Misurazione

Obiettivo: Applicare la teoria della misurazione nella progettazione di esperimenti psicologici.

  1. Rapporti, perché il numero di parole ricordate è una variabile discreta con uno zero assoluto.
  2. Se si usa una scala ordinale, bisogna essere cauti nell’uso della media e della deviazione standard.
  3. Scala ordinale → test non parametrici (Mann-Whitney); scala di rapporti → test parametrici (t-test, ANOVA).

Esercizio 1 – Teoria Sostanziale e “Junk Science”

Obiettivo: Riconoscere il ruolo di una teoria sostanziale solida e comprendere come la sua assenza possa compromettere uno studio.

  1. Leggi la sezione in cui Gelman critica l’assenza di una teoria solida nello studio sulle pratiche mente-corpo.
  2. Spiega, in massimo 10 righe, perché secondo Gelman la mancanza di una teoria coerente rende i risultati del suddetto studio “poco significativi” o addirittura “junk science”.
  3. Proponi un esempio ipotetico (non correlato al mind-body healing) di uno studio psicologico che, pur presentando dati numerosi e analizzati con metodi statistici sofisticati, risulti privo di una teoria solida. Descrivi sinteticamente perché questo potrebbe rientrare nel concetto di “junk science”.

Esercizio 2 – Problemi di Misurazione

Obiettivo: Identificare le criticità più comuni nella misurazione dei fenomeni psicologici.

  1. Elenca almeno tre possibili fattori confondenti che potrebbero influenzare la misurazione dell’efficacia di un intervento psicologico (ad esempio, l’effetto placebo, le aspettative dei partecipanti, ecc.).
  2. Spiega come questi fattori confondenti potrebbero compromettere la validità interna dello studio.
  3. Indica almeno due caratteristiche fondamentali che una buona scala di misurazione (per una variabile psicologica) dovrebbe possedere per essere ritenuta affidabile e valida.

Esercizio 3 – Precisione e Bias

Obiettivo: Chiarire la distinzione tra precisione e distorsione (bias) e come questi aspetti si riflettano nella validità delle conclusioni.

  1. Definisci, con parole tue, i concetti di precisione e bias in ambito psicometrico.
  2. Fornisci un esempio concreto di uno strumento di misura preciso ma distorto (bias elevato) e di uno strumento poco preciso ma non distorto (bias basso).
  3. Spiega come la combinazione di scarsa precisione e alto bias possa influire sulla possibilità di trarre conclusioni affidabili in uno studio psicologico.

Esercizio 4 – Validità Interna ed Esterna

Obiettivo: Approfondire come le scelte di misurazione influiscano sulla validità interna ed esterna di uno studio.

  1. In riferimento allo studio sul mind-body healing discusso nel capitolo, identifica due fattori che potrebbero compromettere la validità interna e due fattori che potrebbero limitarne la validità esterna.
  2. Descrivi in 5-8 righe le differenze principali tra validità interna e validità esterna, utilizzando esempi presi sia dal contesto della guarigione mente-corpo sia da altri contesti psicologici (ad esempio, studi sull’apprendimento o sulla motivazione).
  3. Proponi una modifica al disegno di ricerca (ipotetico) che potrebbe migliorare la validità interna dello studio originale. Spiega brevemente come questa modifica ne influenzerebbe anche la validità esterna.

Esercizio 5 – Integrare Teoria e Misurazione: Breve Progetto di Ricerca

Obiettivo: Mettere in pratica i concetti di teoria e misurazione attraverso la progettazione di uno studio.

  1. Immagina di voler condurre uno studio su un intervento di “training di rilassamento mentale” finalizzato a ridurre l’ansia negli studenti universitari.
  2. Sviluppa una breve traccia di progetto (massimo 15 righe) rispondendo ai seguenti punti:
    • Teoria di base: Qual è la teoria sostanziale dietro l’efficacia del training di rilassamento? Quali meccanismi psicologici verrebbero attivati?
    • Ipotesi: Quale effetto prevedi sull’ansia degli studenti?
    • Misurazione: Che tipo di strumento useresti per valutare il livello di ansia e perché (ad esempio, questionari self-report validati, misure fisiologiche come battito cardiaco, ecc.)?
    • Controllo dei confondenti: Quali variabili secondarie possono influire sui risultati e come intendi gestirle?
    • Validità: Come assicureresti una buona validità interna? Che strategie adotteresti per aumentare la validità esterna?
  3. Spiega brevemente in che modo la combinazione di un solido quadro teorico e di una misurazione accurata permette di evitare che lo studio venga etichettato come “junk science”.

Esercizio 1 – Teoria Sostanziale e “Junk Science”

  1. Perché la mancanza di una teoria solida rende i risultati poco significativi?
  • Gelman critica lo studio sul mind-body healing perché non vi è un modello teorico convincente che spieghi il meccanismo causale tra pratiche mente-corpo e miglioramenti di salute.
  • Senza un quadro teorico robusto, i risultati sono interpretati in modo esplorativo e rischiano di essere attribuiti a variabili non controllate (effetto placebo, regressione alla media, ecc.).
  • Una teoria ben formulata aiuta a delimitare le ipotesi, guidare il disegno di ricerca e interpretare correttamente i dati. In assenza di ciò, i numeri raccolti potrebbero essere viziati da fattori confondenti o da semplici correlazioni spurious.
  1. “Junk science” in massimo 10 righe

Esempio di testo in 10 righe (circa)

**Lo studio sul mind-body healing viene talvolta definito “junk science” da Gelman perché, in mancanza di una teoria sostanziale solida, i dati raccolti non forniscono indicazioni chiare sui processi psicologici o fisiologici coinvolti. Una ricerca classificata come “junk science” è priva di rigore metodologico o teorico, e può presentare gravi problemi di replicabilità o di interpretazione dei risultati. In particolare, se non vi è un modello plausibile che colleghi in modo coerente la pratica mente-corpo ai cambiamenti in variabili biologiche e comportamentali, i risultati empirici rischiano di essere semplici coincidenze. L’assenza di un costrutto ben definito e di ipotesi derivanti da una teoria coerente rende difficile capire se i cambiamenti osservati siano reali, casuali o dovuti ad altre cause non considerate (per esempio, l’effetto placebo). Infine, senza un’adeguata cornice teorica, gli studiosi non sanno come interpretare o generalizzare i dati, e la scienza non progredisce realmente.*

  1. Esempio di uno studio privo di teoria solida (ipotesi di “junk science”)
  • Situazione ipotetica: Uno studio che raccoglie decine di variabili sulla personalità e sul benessere, poi usa tecniche statistiche sofisticate (analisi di big data, reti neurali, ecc.) per trovare correlazioni fra i tratti di personalità e centinaia di indicatori fisici.
  • Perché “junk science”: Se lo studio non definisce a priori quali ipotesi testare e non ha una teoria chiara che spieghi perché certe caratteristiche di personalità dovrebbero correlarsi con determinati parametri fisici, i risultati trovati potrebbero essere frutto di coincidenze casuali. Inoltre, in assenza di un modello teorico solido, anche risultati statisticamente significativi possono essere privi di significato dal punto di vista psicologico.

Esercizio 2 – Problemi di Misurazione

  1. Tre possibili fattori confondenti nell’efficacia di un intervento psicologico
  • Effetto placebo: I partecipanti migliorano perché si aspettano di migliorare, non per l’effettiva efficacia dell’intervento.
  • Aspettative dei partecipanti: Se sanno di partecipare a uno studio, potrebbero modificare il proprio comportamento (effetto Hawthorne).
  • Desiderabilità sociale: I partecipanti forniscono risposte che ritengono socialmente desiderabili, falsando i risultati (ad esempio, sottostimando i livelli di ansia o stress).
  1. Come questi fattori confondenti compromettono la validità interna
  • La validità interna riguarda il grado in cui è possibile concludere che sia effettivamente la variabile indipendente (l’intervento) a causare le modifiche osservate nella variabile dipendente (es. livelli di ansia).
  • Se subentrano l’effetto placebo, aspettative non controllate o tendenze alla desiderabilità sociale, diventa difficile stabilire un nesso causale chiaro. Esiste sempre il dubbio che altri processi cognitivi o sociali (non l’intervento in sé) abbiano prodotto il risultato.
  1. Due caratteristiche fondamentali di una buona scala di misurazione
  • Affidabilità: Capacità dello strumento di fornire misure stabili e coerenti nel tempo (ad esempio, coerenza interna, stabilità test-retest).
  • Validità: Capacità dello strumento di misurare effettivamente ciò che si propone di misurare (validità di contenuto, di costrutto, di criterio).

Esercizio 3 – Precisione e Bias

  1. Definizioni di precisione e bias
  • Precisione: Indica il grado di dispersione (o variabilità) delle misurazioni. Uno strumento preciso produce misure molto simili fra loro se ripetute nelle stesse condizioni (bassa varianza).
  • Bias (distorsione): Indica l’errore sistematico, ossia la tendenza a sovra- o sottostimare sistematicamente il fenomeno in esame. Uno strumento può essere molto coerente nelle misure, ma se è “tarato” male, darà sempre un risultato distorto.
  1. Esempio concreto di misura “precisa ma distorta” e “poco precisa ma non distorta”
  • Precisa ma distorta: Un cronometro che, a causa di un difetto di fabbricazione, parte sempre con 2 secondi di ritardo ma poi misura i tempi con estrema coerenza. Risultato: tutte le misure saranno molto simili (alta precisione), ma sempre sfasate di 2 secondi (alto bias).
  • Poco precisa ma non distorta: Un termometro vecchio che a volte segna 36,2°C, altre 36,7°C, altre 37,1°C, senza un pattern sistematico. In media potrebbe risultare vicino ai 36,5°C, quindi senza un bias chiaro, ma con un’alta variabilità tra una misurazione e l’altra (bassa precisione).
  1. Conseguenze di scarsa precisione e alto bias
  • Se uno strumento è poco preciso (alta variabilità) e altamente distorto (bias elevato), i risultati ottenuti non solo oscillano in modo imprevedibile, ma sono costantemente lontani dal valore “vero”.
  • In queste condizioni, le conclusioni diventano inaffidabili, poiché è quasi impossibile distinguere l’effetto reale (casuale o causale) dalle deformazioni introdotte dallo strumento e dall’errore di misura.

Esercizio 4 – Validità Interna ed Esterna

  1. Due fattori che compromettono la validità interna e due fattori che compromettono la validità esterna (nell’esempio del mind-body healing)
  • Validità interna:

    • Assegnazione non casuale ai gruppi: se i partecipanti scelgono autonomamente di aderire alle pratiche mente-corpo, potrebbero essere più motivati o avere caratteristiche iniziali diverse.
    • Mancata o inadeguata gestione dell’effetto placebo: non sapere se l’intervento “mente-corpo” sia stato percepito come particolarmente “speciale” dai partecipanti può introdurre differenze di aspettativa.
  • Validità esterna:

    • Campione non rappresentativo: se lo studio è condotto solo su persone che frequentano un determinato tipo di centro di benessere, i risultati potrebbero non essere generalizzabili all’intera popolazione.
    • Contesto specifico: pratiche mente-corpo svolte in un ambiente estremamente controllato (es. un laboratorio o un ritiro speciale) potrebbero non replicarsi nella vita quotidiana di chiunque.
  1. Differenze tra validità interna ed esterna (5-8 righe di esempio)

La validità interna si riferisce alla correttezza del disegno di ricerca nel dimostrare un effetto causale. Un alto livello di validità interna implica che i ricercatori siano ragionevolmente sicuri che l’intervento (ad esempio, una tecnica mente-corpo) abbia causato i risultati osservati (miglioramento della salute). La validità esterna, invece, riguarda la possibilità di generalizzare i risultati a contesti, persone e tempi differenti. Se un intervento è stato testato in condizioni molto specifiche, potrebbe funzionare bene solo in quel contesto e con quel particolare campione. Per esempio, un intervento sul mind-body healing con individui altamente motivati potrebbe non dare gli stessi risultati in una popolazione generalizzata. Allo stesso modo, uno studio sull’apprendimento condotto in un laboratorio altamente controllato potrebbe non riflettere le reali dinamiche di un’aula scolastica.

  1. Modifica al disegno di ricerca per migliorare la validità interna e conseguenze sulla validità esterna
  • Proposta: Introdurre un gruppo di controllo con un intervento placebo o un’attività simile ma priva di contenuto “mente-corpo” (ad es. sessioni di lettura rilassante). In questo modo, si può confrontare l’effetto “specífico” dell’intervento.
  • Come influenza la validità interna: Con un gruppo di controllo placebo, diventa più semplice escludere che il miglioramento sia dovuto solo alle aspettative dei partecipanti. Questo riduce il rischio di confondenti e aumenta la validità interna.
  • Come influenza la validità esterna: Potrebbe rendere il contesto dello studio più artificiale (un gruppo fa “meditazione”, l’altro legge in silenzio), il che potrebbe ridurre la naturalezza della situazione e potenzialmente limitare la generalizzabilità ad ambienti reali (validità esterna).

Esercizio 5 – Integrare Teoria e Misurazione: Breve Progetto di Ricerca

  1. Breve traccia di progetto: “Training di rilassamento mentale per ridurre l’ansia negli studenti universitari”
  • Teoria di base
    Il training di rilassamento mentale si fonda sul presupposto teorico che le tecniche di riduzione dello stress (es. respirazione consapevole, rilassamento muscolare progressivo) possano agire sui livelli di attivazione fisiologica e sui pensieri intrusivi. Riducendo l’iperattivazione del sistema nervoso simpatico e favorendo uno stato di calma, diminuisce l’ansia percepita.

  • Ipotesi
    Gli studenti che seguono il training di rilassamento per 4 settimane mostreranno una riduzione significativa nei punteggi di ansia, rispetto a un gruppo di controllo che non partecipa al training.

  • Misurazione
    Utilizzo di una scala validata come lo STAI (State-Trait Anxiety Inventory) per misurare il livello di ansia pre e post intervento. Possibile integrazione con misure fisiologiche (battito cardiaco a riposo) per avere dati oggettivi.

  • Controllo dei confondenti

    • Registrare la storia clinica dei partecipanti (per escludere coloro che assumono farmaci ansiolitici).
    • Richiedere che i partecipanti non modifichino drasticamente le proprie abitudini di studio o di vita durante l’intervento.
    • Assicurarsi che i valutatori non sappiano chi fa parte del gruppo di training o del gruppo di controllo (blinding parziale).
  • Validità

    • Validità interna: Uso di un gruppo di controllo e assegnazione casuale (randomizzazione) per assicurare che i due gruppi siano comparabili.
    • Validità esterna: Inclusione di studenti provenienti da diverse facoltà, così da riflettere una maggiore eterogeneità di popolazione.
  1. Come teoria solida e misurazione accurata evitano la “junk science”
  • Una solida cornice teorica spiega i meccanismi psicologici e fisiologici che legano l’intervento (training di rilassamento) all’esito (riduzione dell’ansia).
  • Una misurazione accurata e validata (STAI, misure fisiologiche) riduce errori e distorsioni. Se le misure sono ripetute nel tempo (pre e post), si possono confrontare i cambiamenti effettivi.
  • Integrando teoria e misurazione, i risultati assumono un significato scientifico più robusto. Non basta osservare un miglioramento: occorre dimostrare come e perché tale miglioramento avvenga, evitando di cadere in semplici correlazioni prive di spiegazione (e quindi potenzialmente “junk science”).

Esercizio 1 – Trasformazioni in Scala Nominale

Situazione
Un ricercatore vuole indagare la percezione di appartenenza sociale tra studenti universitari di Psicologia. A ciascuno studente viene chiesto di rispondere alla domanda: “Qual è il gruppo studentesco a cui ritieni di appartenere maggiormente?”, scegliendo una tra le seguenti categorie:

    1. Gruppo A (focalizzato su ricerca e studio)
    1. Gruppo B (focalizzato su attività ricreative)
    1. Gruppo C (focalizzato su volontariato e progetti sociali)

Istruzioni

  1. Identifica la scala di misurazione utilizzata per classificare gli studenti (nominale, ordinale, a intervalli o di rapporti).
  2. Indica quali trasformazioni sono ammissibili su questa scala e spiega perché non è possibile applicare operazioni di tipo aritmetico (somme, differenze, etc.).
  3. Proponi un esempio di nuova scala nominale equivalente, ossia una nuova denominazione delle categorie che rispetti la suddivisione originale. (Esempio: rinominarle in Gruppo X, Gruppo Y, Gruppo Z, oppure usare colori, animali-simbolo, ecc.). Spiega perché questa trasformazione non altera i risultati dell’indagine.

Esercizio 2 – Trasformazioni in Scala Ordinale

Situazione
In un questionario sul benessere psicologico, agli studenti viene chiesto di classificare il loro stato di motivazione allo studio su una scala da 1 (bassa motivazione) a 5 (alta motivazione). Si ottiene così un dato ordinalmente misurato.

Istruzioni

  1. Spiega perché tale variabile (“livello di motivazione”) rappresenta una scala ordinale. Quali proprietà la rendono diversa da una semplice scala nominale?
  2. Descrivi in che modo è possibile ridenominare i valori della scala (ad esempio, da [1,2,3,4,5] a [“Molto bassa”, “Bassa”, “Media”, “Alta”, “Molto alta”]) senza alterare il rapporto d’ordine tra le categorie.
  3. Proponi un esempio di trasformazione non ammissibile: qual è un’operazione aritmetica che non avrebbe senso applicare su una scala ordinale e perché (ad esempio, calcolare “il doppio di motivazione”)?

Esercizio 3 – Trasformazioni in Scala ad Intervalli

Situazione
Un gruppo di ricercatori in Psicometria vuole confrontare i punteggi di un test d’intelligenza (misurati secondo la scala tradizionale del QI, con media 100 e deviazione standard 15) con un nuovo test sperimentale. Come ben noto, la scala del QI è considerata, nelle sue approssimazioni psicometriche, una scala ad intervalli.

Istruzioni

  1. Spiega in cosa consiste la trasformazione lineare ammessa (del tipo \(y' = a + b y\), con \(b > 0\)) e perché tale trasformazione preserva le differenze tra i punteggi.
  2. Fai un esempio concreto di trasformazione lineare: supponi di voler “riscalare” i punteggi del QI in modo che la nuova media sia 50. Definisci i valori di \(a\) e \(b\) (indicando un’ipotesi di calcolo) e mostra come viene modificato il punteggio di un individuo con QI = 115.
  3. Discuta perché, nonostante la somiglianza con le scale ordinale e nominale (puoi comunque distinguere punteggi e ordinarli), una scala ad intervalli consente operazioni matematiche più complesse (ad esempio, differenze) che non sarebbero valide negli altri due livelli.

Esercizio 4 – Trasformazioni in Scala di Rapporti

Situazione
Un laboratorio di psicofisiologia misura i tempi di reazione (in millisecondi) a uno stimolo luminoso. Poiché il tempo di reazione pari a 0 ms significa realmente assenza di risposta (ovvero, impossibile da misurare in pratica, ma concettualmente corrisponde a intensità nulla del fenomeno “tempo di reazione”), ci troviamo in una scala di rapporti.

Istruzioni

  1. Spiega perché il tempo di reazione soddisfa i requisiti di una scala di rapporti, inclusa la presenza di uno zero assoluto e la possibilità di confrontare i punteggi con rapporti (ad esempio, “il tempo di reazione del partecipante A è il doppio di quello del partecipante B”).
  2. Quali sono le trasformazioni ammissibili su una scala di rapporti? Fornisci un esempio numerico (per esempio, se moltiplichi tutti i tempi di reazione per 2, che cosa accade al rapporto tra i punteggi di due partecipanti?).
  3. Descrivi il motivo per cui è possibile dire che A ha una latenza doppia di B usando i millisecondi, ma non è sempre possibile fare asserzioni analoghe usando scale ad intervalli. Fai un parallelo, ad esempio, con le temperature in Celsius.

Esercizio 5 – Riconoscere e Applicare le Trasformazioni nei Quattro Livelli di Scala

Situazione
Un docente di Psicologia sperimentale ha raccolto quattro serie di dati su vari aspetti:

  1. Orientamento politico (liberale, conservatore, centrista, ecc.).
  2. Classifica di soddisfazione sul tirocinio (1° posto, 2° posto, 3° posto, etc.).
  3. Punteggi di un test di personalità su un fattore (con media = 100, deviazione standard = 10) trattato come scala ad intervalli.
  4. Frequenza cardiaca a riposo misurata in battiti al minuto (bpm).

Istruzioni

  1. Identifica per ciascuno dei quattro insiemi di dati il livello di scala (nominale, ordinale, intervalli, rapporti).
  2. Per ognuno dei quattro livelli di scala elenca almeno una trasformazione ammessa (ad es. ridenominazione delle categorie per la nominale, traslazione e dilatazione per l’intervalli, ecc.) e una non ammessa (esempio: non puoi sommare categorie nominali, non puoi calcolare la radice quadrata di un rango ordinale dandogli significato, ecc.).
  3. Rifletti in breve (2-3 righe) su come queste differenze nelle trasformazioni ammissibili incidano sull’interpretazione dei dati e sulle analisi statistiche che il docente potrà validamente utilizzare (ad esempio, test non parametrici per variabili ordinarie, test parametrici per scale ad intervalli/rapporti).

Esercizio 1 – Trasformazioni in Scala Nominale

  1. Identificazione della scala La classificazione degli studenti in “Gruppo A/B/C” è scala nominale. Non esiste alcun ordine intrinseco tra le categorie; si tratta semplicemente di etichette qualitative.

  2. Trasformazioni ammissibili

  • Trasformazioni ammissibili: ridenominare o rinominare le categorie senza modificare la partizione del campione (esempio: A → “Studio”, B → “Ricreazione”, C → “Volontariato”).
    • L’unica operazione aritmetica consentita è il conteggio delle frequenze nelle varie categorie.
  • Operazioni non consentite: non è possibile sommare o sottrarre etichette, né confrontare categorie in termini di “più/meno grande” o “rapporto”.
  1. Esempio di nuova scala nominale equivalente
  • Potresti chiamare i gruppi: “Alpha, Beta, Gamma” (oppure con colori: “Rosso, Blu, Verde”).
  • Questa trasformazione non altera la classificazione in sé: tutti gli studenti del Gruppo A rimangono nel “nuovo” gruppo Alpha, e così via.
  • Non cambia la struttura dei dati e di conseguenza non altera i risultati della ricerca (restano invariate le frequenze e la suddivisione nelle categorie).

Esercizio 2 – Trasformazioni in Scala Ordinale

  1. Perché è una scala ordinale? La variabile “livello di motivazione” da 1 (bassa) a 5 (alta) indica:
  • Classificazione in categorie (come in una scala nominale).
  • Relazione d’ordine chiara (1 < 2 < 3 < 4 < 5).
  • Non fornisce alcuna informazione sulle distanze reali tra i punti (non è detto che la differenza tra 1 e 2 sia uguale a quella tra 3 e 4).
    È quindi una scala ordinale e non semplicemente nominale.
  1. Ridenominazione dei valori mantenendo l’ordine
  • Puoi sostituire i numeri con etichette testuali rispettando lo stesso ordine:
    1 → “Molto bassa”
    2 → “Bassa”
    3 → “Media”
    4 → “Alta”
    5 → “Molto alta”
  • L’ordine rimane lo stesso: “Molto bassa” < “Bassa” < … < “Molto alta”.
  1. Esempio di trasformazione non ammissibile
  • Calcolare “il doppio di motivazione”: dire che la categoria 4 è “il doppio” della categoria 2 non ha senso, perché non c’è un’unità di misura fissa che quantifichi la differenza tra i livelli. Le categorie ordinali servono solo a ordinare, non a quantificare in modo assoluto.

Esercizio 3 – Trasformazioni in Scala ad Intervalli

  1. Trasformazione lineare ammessa
  • Forma generale: \(y' = a + b y\), con \(b > 0\).
  • Preserva le differenze tra i valori (ad esempio, \((y_2 - y_1) = (y'_2 - y'_1) / b\)), perché la traslazione aggiunge una costante a tutti i punteggi e la dilatazione (moltiplicazione per \(b\)) mantiene le proporzioni fra gli intervalli.
  1. Esempio concreto
  • Scala QI: media = 100, deviazione standard = 15.
  • Vuoi che la nuova media sia 50.
    • Per semplificare, supponiamo di voler “spostare” ogni valore verso una nuova scala centrata a 50, mantenendo una deviazione standard proporzionale.

    • Una possibile trasformazione lineare:

      \[ y' = (y - 100) + 50 = y - 50. \]

    • In questo caso, \(a = -50\), \(b = 1\).

    • Se un individuo ha QI = 115, allora \(y' = 115 - 50 = 65\).

  • Se invece volessi anche cambiare la deviazione standard, potresti usare un fattore \(b \neq 1\). Ad esempio, se desideri una deviazione standard = 10, potresti usare \(b = \frac{10}{15} \approx 0.67\).
  1. Differenze rispetto alle scale nominali/ordinali
  • Con una scala ad intervalli puoi:
    • Ordinare i punteggi.
    • Stabilire differenze (es. un individuo A ha 15 punti in più di B).
  • Non puoi invece stabilire rapporti (es. “A ha il doppio di X rispetto a B” non è lecito), perché lo zero è arbitrario e la distanza “0” non rappresenta l’assenza del fenomeno (come invece avviene nella scala di rapporti).

Esercizio 4 – Trasformazioni in Scala di Rapporti

  1. Perché il tempo di reazione è in una scala di rapporti?
  • Zero assoluto: un tempo di reazione (teoricamente) pari a 0 ms significherebbe nessun tempo trascorso → totale assenza del fenomeno misurato (impossibile nella pratica, ma concettualmente definisce uno zero non arbitrario).
  • Puoi confrontare i punteggi con rapporti: “il tempo di reazione di A è il doppio di quello di B” (200 ms vs. 100 ms).
  1. Trasformazioni ammissibili
  • Trasformazione di similarità: \(y' = b y\) con \(b > 0\).

  • Se hai due tempi di reazione \(y_1\) e \(y_2\), il rapporto \(\frac{y_1}{y_2}\) rimane invariato anche dopo la trasformazione:

    \[ \frac{y'_1}{y'_2} = \frac{b y_1}{b y_2} = \frac{y_1}{y_2}. \]

  • Esempio numerico: se i tempi di reazione di due partecipanti sono 100 ms e 200 ms, il rapporto è 2. Se moltiplichi entrambi per 2, ottieni 200 ms e 400 ms, e il rapporto rimane 2.

  1. Confronto con scala ad intervalli (esempio delle temperature)
  • In una scala di rapporti puoi dire “A ha una latenza doppia di B” perché lo zero non è arbitrario.
  • Con la temperatura (scala ad intervalli) lo zero (es. 0°C) non rappresenta l’assenza di calore, quindi non ha senso dire che 80°C è “il doppio” di 40°C. Cambiando la scala (ad es. Fahrenheit) il rapporto cambia.

Esercizio 5 – Riconoscere e Applicare le Trasformazioni nei Quattro Livelli di Scala

  1. Identificazione del livello di scala
  • Orientamento politico: scala nominale (categorie qualitative prive di ordine).
  • Classifica di soddisfazione (1°, 2°, 3°, …): scala ordinale (c’è un ordine, ma non si conosce la “distanza” fra i posti).
  • Punteggi di un test di personalità (con media=100, dev.st=10), considerati approssimazione di una scala ad intervalli (si assumono le differenze significative, lo zero è arbitrario).
  • Frequenza cardiaca a riposo (bpm): scala di rapporti (zero assoluto e rapporti confrontabili).
  1. Trasformazioni ammesse e non ammesse
  • Nominale:
    • Ammessa: cambiare etichette (A → “Liberale”, B → “Conservatore” ecc.).
    • Non ammessa: sommare categorie, ordinare, calcolare media delle categorie.
  • Ordinale:
    • Ammessa: rietichettare i ranghi (1° → “Migliore”, 2° → “Secondo posto”…).
    • Non ammessa: calcolare rapporti (il 2° posto non è “il doppio” del 1°), sommare posizioni in modo significativo.
  • A intervalli:
    • Ammessa: trasformazione lineare (traslazione + dilatazione).
    • Non ammessa: dire che un punteggio è “tre volte” un altro; lo zero è arbitrario.
  • A rapporti:
    • Ammessa: trasformazione di similarità (\(y' = b y\)), in cui i rapporti rimangono invariati.
    • Non ammessa: aggiunta di una costante a tutti i valori (questa sposterebbe lo zero, rendendolo arbitrario e trasformando la scala in una scala ad intervalli).
  1. Implicazioni per l’interpretazione e le analisi
  • Una variabile nominale consente solo frequenze e test non parametrici basati su conteggi (es. Chi-quadrato).
  • Una variabile ordinale permette test di ordinamento (es. test di rank, come il Wilcoxon), ma non calcoli di media con significato forte.
  • Una scala ad intervalli permette di usare statistiche parametriche (calcolo di media, varianza, test come t-test, ANOVA), assumendo che l’interpretazione delle differenze sia coerente.
  • Una scala di rapporti permette, in più, il confronto di rapporti (ad esempio, si possono applicare modelli parametrici che includano il concetto di proporzioni o slope logico su dati che abbiano senso a zero assoluto).

Bibliografia

Aungle, P., & Langer, E. (2023). Physical healing as a function of perceived time. Scientific Reports, 13(1), 22432.
Domini, F., & Caudek, C. (2009). The intrinsic constraint model and Fechnerian sensory scaling. Journal of Vision, 9(2), 25–25.
Lilienfeld, S. O., & Strother, A. N. (2020). Psychological measurement and the replication crisis: Four sacred cows. Canadian Psychology/Psychologie Canadienne, 61(4), 281–288.
Maul, A., Irribarra, D. T., & Wilson, M. (2016). On the philosophical foundations of psychological measurement. Measurement, 79, 311–320.