here::here("code", "_common.R") |>
source()
# Load packages
if (!requireNamespace("pacman")) install.packages("pacman")
pacman::p_load(dslabs, ggrepel, stringr)17 Principi della visualizzazione scientifica
Dall’intuizione visiva alla comunicazione rigorosa
Prerequisiti
Edward Tufte:
- The Visual Display of Quantitative Information (1983)
- Envisioning Information (1990)
William Cleveland:
- The Elements of Graphing Data (1985)
- Visualizing Data (1993)
Alberto Cairo:
- The Truthful Art (2016)
- How Charts Lie (2019)
Articoli chiave:
- Testing Statistical Charts di Vanderplas, Cook & Hofmann (2020)
- Dynamite plots must die di Irizarry (2019)
- The top ten worst graphs di Broman
17.1 Quando i numeri non bastano
I numeri, da soli, raramente raccontano una storia completa. Consideriamo i dati sugli omicidi con armi da fuoco negli Stati Uniti. Una tabella potrebbe dirci, ad esempio, che in California se ne sono registrati 1257, in Texas 805 e a New York 517. Ma questi valori, privi di contesto, sono poco informativi.
La California ha davvero il tasso più alto? Il Sud è effettivamente più violento del Nord-Est? Senza conoscere la popolazione di ogni stato o un termine di paragone, i dati grezzi lasciano più domande aperte che risposte chiare. La vera comprensione emerge solo quando i numeri vengono messi in relazione, normalizzati e visualizzati in un quadro più ampio.
head(murders, 8)
#> state abb region population total
#> 1 Alabama AL South 4779736 135
#> 2 Alaska AK West 710231 19
#> 3 Arizona AZ West 6392017 232
#> 4 Arkansas AR South 2915918 93
#> 5 California CA West 37253956 1257
#> 6 Colorado CO West 5029196 65
#> 7 Connecticut CT Northeast 3574097 97
#> 8 Delaware DE South 897934 38Un grafico, al contrario, rende queste relazioni visibili in modo immediato. L’adozione di una scala logaritmica su entrambi gli assi permette di rappresentare efficacemente tanto gli stati più popolosi, come la California, quanto quelli con un ridotto numero di abitanti, come il Wyoming, mantenendo al tempo stesso la chiarezza e la leggibilità dell’intera visualizzazione.
In pochi secondi è possibile cogliere schemi che richiederebbero minuti di analisi tabellare: la chiara relazione tra numero di abitanti e omicidi; la tendenza degli stati del Sud a posizionarsi costantemente al di sopra della media nazionale; il posizionamento del Nord-Est al di sotto di essa; la maggiore variabilità registrata negli stati occidentali. Il Distretto di Columbia (DC) si distingue come un caso eclatante, con una popolazione ridotta ma un tasso di omicidi sproporzionatamente elevato.
Questo è il potere della visualizzazione: trasformare strutture astratte e complesse in configurazioni spaziali che il nostro sistema visivo elabora in modo immediato e intuitivo. Tale potere, tuttavia, comporta un’analoga responsabilità: così come un grafico ben progettato può rivelare verità nascoste nei dati, uno costruito in modo approssimativo o ingannevole può generare illusioni altrettanto convincenti.
17.2 I tre pilastri: Tufte, Cleveland, Cairo
17.2.1 Edward Tufte: l’economia visiva
Il principio fondamentale introdotto da Edward Tufte è quello del data-ink ratio, ovvero il rapporto tra l’inchiostro utilizzato per rappresentare l’informazione vera e propria e l’inchiostro totale impiegato nel grafico:
\[ \text{Rapporto inchiostro-dati} = \frac{\text{inchiostro usato per i dati}}{\text{inchiostro totale del grafico}} . \]
Un grafico efficace punta a massimizzare questo rapporto, eliminando senza esitazioni ogni elemento che non contribuisce in modo diretto alla comprensione dei dati. Tufte ha coniato il termine chartjunk (“spazzatura grafica”) per descrivere tutto ciò che distrae lo sguardo senza aggiungere valore.
Principi fondamentali secondo Tufte:
- Prima di tutto, mostra i dati – L’informazione deve prevalere su ogni decorazione superflua.
-
Massimizza l’inchiostro per i dati – Ogni segno grafico deve avere una ragione informativa per esistere.
-
Elimina l’inchiostro non-dati – Riduci al minimo griglie, cornici, sfondi ed elementi puramente decorativi.
-
Elimina le ridondanze nell’inchiostro-dati – Ogni informazione dovrebbe essere trasmessa una sola volta, nel modo più diretto.
- Rivedi e modifica – Nessuna visualizzazione nasce perfetta; la revisione è parte essenziale della comunicazione visiva.
17.2.2 William Cleveland: la gerarchia percettiva
Attraverso studi sperimentali, William Cleveland misurò l’accuratezza con cui gli osservatori umani decodificano diversi encodings visivi. I suoi risultati hanno definito una gerarchia percettiva degli elementi grafici, ordinata dalla rappresentazione più precisa a quella meno precisa:
- Posizione su una scala comune – Plot a dispersione (scatter plot), grafici a linee.
- Posizione su scale non allineate – Grafici a pannelli (small multiples).
- Lunghezza – Diagrammi a barre, grafici a bastoncini (lollipop chart).
- Direzione e angolazione – Campi vettoriali, diagrammi radiali.
- Area – Diagrammi a bolle (bubble chart), mappe ad albero (treemap).
- Volume / densità – Visualizzazioni tridimensionali, superfici.
- Tonalità / saturazione cromatica – Mappe di calore (heatmap).
L’implicazione metodologica è chiara: per confronti quantitativi precisi, è preferibile utilizzare elementi posizionali (come punti o linee) o lunghezze. Se l’obiettivo è differenziare categorie o evidenziare pattern qualitativi, il colore può essere sufficiente. Per comunicare differenze in cui la precisione assoluta non è critica, si possono impiegare efficacemente variazioni di area o di colore.
17.2.3 Alberto Cairo: l’onestà visiva
Alberto Cairo sposta l’attenzione dall’efficienza tecnica e percettiva verso la dimensione etica della comunicazione visiva. Secondo Cairo, un grafico può essere tecnicamente impeccabile ma moralmente ingannevole se sfrutta consapevolmente i bias percettivi del lettore per suggerire conclusioni non supportate dai dati.
I cinque pilastri della visualizzazione etica secondo Cairo:
- Veridicità (Truthfulness): il grafico rappresenta i dati in modo accurato e privo di distorsioni?
- Funzionalità (Functionality): il grafico è efficace per lo scopo comunicativo che si prefigge?
- Bellezza (Beauty): la sua estetica è raffinata senza essere frivola o decorativa?
- Profondità (Insightfulness) – Rivela pattern, relazioni o intuizioni non immediatamente evidenti?
- Illuminazione (Enlightenment): aumenta effettivamente la comprensione del lettore su un determinato fenomeno?
Cairo sottolinea con forza che l’assenza di errori tecnici non equivale automaticamente a onestà comunicativa. Un grafico può essere formalmente corretto eppure ingannevole, ad esempio, utilizzando assi troncati per amplificare artificialmente delle differenze, impiegando scale logaritmiche senza dichiararlo per appiattire un trend o rappresentando quantità con aree (che un osservatore umano stima con difficoltà) anziché con lunghezze (più intuitive), distorcendo così le proporzioni reali.
17.3 Errori comuni: una galleria degli orrori
17.3.1 Errore 1: i grafici a dinamite — l’illusione della precisione
I cosiddetti grafici a dinamite (dynamite plots), ossia grafici a barre accompagnati da errori standard, possono essere considerati l’equivalente visivo dei valori-\(p\): sono formalmente corretti e contengono informazione, ma nella pratica comunicano poco e spesso in modo fuorviante.
Qual è il problema principale? Limitandosi a mostrare la media ± errore standard, questi grafici occultano quasi completamente la struttura dei dati sottostanti. In particolare, non permettono di valutare:
- La forma della distribuzione (simmetrica, asimmetrica, multimodale);
- La presenza di outlier o valori anomali;
- Il grado reale di sovrapposizione tra i gruppi;
- La dimensione del campione, poiché gruppi con numerosità molto diverse (ad esempio \(N=5\) contro \(N=500\)) vengono rappresentati in modo visivamente indistinguibile, suggerendo erroneamente la stessa precisione delle stime.
Il risultato è una rappresentazione che enfatizza un singolo numero riassuntivo e trasmette un’illusione di precisione che i dati, spesso, non giustificano.
La soluzione. Sostituire i grafici a barre con visualizzazioni che rendano espliciti i dati osservati. Tecniche come il jitter, la trasparenza (alpha blending) e la sovrapposizione dei punti individuali consentono di mostrare la variabilità reale. In alternativa, o in aggiunta, è preferibile utilizzare sintesi più informative e robuste, come boxplot o grafici a violino, eventualmente combinati con i singoli punti.
17.3.2 Errore 2: i grafici a torta — quando gli angoli ingannano
La ricerca sperimentale di William Cleveland ha mostrato che il confronto tra angoli è un compito percettivamente impegnativo e intrinsecamente impreciso. A differenza di lunghezze o posizioni lungo una scala comune, gli angoli non vengono valutati con facilità dal sistema visivo umano. Di conseguenza, quando il numero di categorie supera le due o tre, i grafici a torta diventano rapidamente difficili da interpretare e, di fatto, poco informativi.
A questo limite percettivo si aggiunge un problema di progettazione frequente: le fette sono spesso ordinate in modo arbitrario — ad esempio alfabeticamente o secondo l’ordine di inserimento dei dati — anziché in base alle proporzioni rappresentate. Questa scelta impedisce di individuare a colpo d’occhio le categorie dominanti e rende più complesso confrontare le dimensioni relative delle parti.
Il risultato è una visualizzazione che richiede uno sforzo cognitivo elevato per trasmettere un’informazione semplice, e che può facilmente portare a interpretazioni imprecise o errate.
Verdetto: per confronti quantitativi, usa sempre lunghezza (barplot), mai angoli (pie).
17.3.3 Errore 3: i grafici a doppio asse — l’illusione della correlazione
Errore. Utilizzare grafici con due assi verticali indipendenti per rappresentare serie di dati diverse sullo stesso pannello.
Perché è un problema. La presenza di due scale distinte consente di manipolare visivamente l’andamento delle serie, creando l’illusione di una relazione che può non esistere affatto. Regolando opportunamente le scale, curve prive di qualsiasi legame statistico possono apparire fortemente sincronizzate. Il lettore tende a interpretare questa sovrapposizione visiva come evidenza di correlazione, ignorando che le scale sono arbitrarie e non confrontabili.
Un esempio celebre è il presunto legame tra consumo di formaggio e morti per impigliamento nelle lenzuola, reso popolare dal progetto Spurious Correlations di Tyler Vigen: due fenomeni indipendenti che, grazie a un uso disinvolto dei doppi assi, sembrano seguire lo stesso andamento.
Soluzione. Evitare, per quanto possibile, i grafici a doppio asse. Quando è necessario confrontare più serie, sono preferibili approcci alternativi più trasparenti:
- Usare un asse comune, quando le variabili condividono unità di misura comparabili.
- Normalizzare i dati, ad esempio tramite z-score o percentuali rispetto a un valore di riferimento, così da rendere le serie confrontabili sulla stessa scala.
- Separare i grafici, disponendoli su pannelli allineati verticalmente, per facilitare il confronto visivo senza confondere le scale.
- Se il doppio asse è inevitabile, dichiarare esplicitamente la natura arbitraria delle scale con un’annotazione chiara (ad esempio: “Assi su scale diverse e non confrontabili”), riducendo il rischio di interpretazioni fuorvianti.
17.3.4 Errore 4: confondere lunghezza, area e volume
Errore. Rappresentare quantità numeriche tramite aree (cerchi, quadrati) o, peggio, tramite volumi tridimensionali, come se l’occhio umano interpretasse queste grandezze in modo lineare.
Perché è un problema. Il sistema visivo non percepisce le differenze in termini di raggio o diametro, ma reagisce all’area o al volume complessivo delle forme. Di conseguenza, quando una variabile è mappata su una dimensione lineare (ad esempio il raggio), l’informazione percepita cresce in modo non lineare: proporzionalmente al quadrato nel caso dell’area e al cubo nel caso del volume. Questo introduce una distorsione sistematica che amplifica visivamente le differenze reali.
Esempio pratico. Il PIL degli Stati Uniti è di circa 20 trilioni di dollari, mentre quello della Francia è di circa 2,7 trilioni. Il rapporto reale è quindi di circa 7,4 a 1.
- Cerchi con raggio proporzionale al PIL: l’area del cerchio degli Stati Uniti risulterebbe circa \((7.4)^2 \approx 55\) volte più grande di quella della Francia, suggerendo una disparità quasi otto volte superiore a quella reale.
- Sfere tridimensionali con raggio proporzionale: il volume apparente crescerebbe come \((7.4)^3 \approx 405\), producendo una distorsione estrema e del tutto fuorviante.
Un esempio noto di questo errore è apparso nel grafico utilizzato durante il Discorso sullo Stato dell’Unione del 2011, dove l’uso di forme tridimensionali ha amplificato in modo artificiale le differenze tra quantità.
Soluzione. Per confronti quantitativi accurati, privilegiare rappresentazioni basate sulla lunghezza, come grafici a barre o dot plot, che consentono confronti percettivamente affidabili. Se si utilizza un bubble chart (ad esempio per rappresentare una terza variabile), è fondamentale mappare la variabile sull’area in modo corretto e dichiararlo esplicitamente, evitando qualsiasi ambiguità sulla relazione tra dimensione visiva e valore numerico.
17.3.5 Errore 5: effetti tridimensionali — distrazione senza informazione
Errore. Aggiungere effetti prospettici tridimensionali a grafici a barre, a torta o a linee, senza che la terza dimensione rappresenti una variabile aggiuntiva.
Perché è un problema. L’uso del 3D in questo contesto costituisce una forma classica di chartjunk: introduce complessità visiva senza apportare informazione. In particolare, gli effetti prospettici:
- generano distorsioni percettive, facendo apparire più grandi gli elementi in primo piano rispetto a quelli sullo sfondo;
- possono occultare parzialmente i dati, con barre o fette che coprono altre parti del grafico;
- non codificano alcuna variabile informativa aggiuntiva, rendendo la terza dimensione puramente decorativa;
- distraggono l’attenzione con ombreggiature, riflessi ed effetti di profondità che competono con il contenuto informativo.
Il risultato è una visualizzazione più difficile da leggere, meno precisa e cognitivamente più costosa, senza alcun beneficio analitico.
Soluzione. Eliminare sistematicamente gli effetti tridimensionali quando non veicolano informazione reale. Come sintetizzato efficacemente da Edward Tufte: se, rimuovendo la prospettiva tridimensionale, il grafico non perde alcun contenuto informativo, allora quella terza dimensione era superflua e dovrebbe essere eliminata.
17.3.6 Errore 6: ordinare alfabeticamente categorie naturalmente ordinate
Errore. Disporre le categorie in ordine alfabetico quando esse possiedono un ordinamento intrinseco, come livelli di gravità, classi di età, stadi di un processo o qualsiasi scala che rappresenti una progressione logica o quantitativa.
Perché è un problema. L’ordine alfabetico distrugge la struttura semantica dei dati, interrompendo la continuità naturale tra le categorie. In questo modo, il lettore non riesce più a cogliere facilmente andamenti, gradienti o transizioni, e il pattern sottostante viene di fatto nascosto o reso ambiguo.
Esempio pratico.
-
Disposizione scorretta (ordine alfabetico):
[Lieve] [Minima] [Moderata] [Severa] -
Disposizione corretta (ordine crescente di gravità clinica):
[Minima] [Lieve] [Moderata] [Severa]
Nel primo caso, la sequenza suggerisce un andamento irregolare e privo di significato; nel secondo, la progressione è immediatamente leggibile.
Soluzione. Ordinare sistematicamente le categorie secondo il loro valore numerico implicito o la loro sequenza naturale, così da preservare la struttura informativa dei dati. Fanno eccezione solo quei casi in cui esiste un ordine convenzionale consolidato e universalmente riconosciuto (ad esempio i giorni della settimana, i mesi dell’anno o le fasi standard di un trattamento).
17.3.7 Errore 7: scale non uniformi nei confronti distributivi
Errore. Utilizzare scale verticali diverse quando si confrontano distribuzioni, ad esempio tramite istogrammi o density plot affiancati.
Perché è un problema. L’osservatore interpreta naturalmente l’altezza delle barre o delle curve come un indicatore diretto della quantità o della densità rappresentata. Se gli assi verticali differiscono tra i pannelli, altezze visivamente simili possono corrispondere a valori numerici molto diversi, rendendo il confronto immediato non solo difficile, ma potenzialmente fuorviante. Il risultato è un’illusione di somiglianza o di differenza che dipende esclusivamente dalla scelta della scala, non dai dati.
Soluzione. Impostare sempre scale fisse e condivise per tutti i pannelli (scales = "fixed"), così da garantire un confronto visivo diretto e onesto tra le distribuzioni. L’uso di scale libere (scales = "free_y") dovrebbe essere limitato a casi specifici e dichiarati esplicitamente, ad esempio quando le distribuzioni hanno ordini di grandezza molto diversi e una scala comune finirebbe per occultare completamente la struttura di uno dei gruppi.
17.4 Trasformazioni: quando ingannano e quando illuminano
Le trasformazioni delle scale non sono né buone né cattive in sé: diventano strumenti di chiarificazione quando sono motivate e dichiarate, oppure fonti di distorsione quando vengono usate in modo opaco o arbitrario. Il loro scopo non è “abbellire” i dati, ma rendere leggibili strutture che altrimenti rimarrebbero nascoste.
17.4.1 Trasformazioni logaritmiche: comprimere intervalli estesi
Quando utilizzarle. Le trasformazioni logaritmiche sono particolarmente indicate in presenza di:
- dati che coprono tre o più ordini di grandezza (ad esempio popolazioni che vanno da migliaia a decine di milioni);
- distribuzioni fortemente asimmetriche a destra, dominate da pochi valori estremi;
- relazioni di tipo moltiplicativo tra variabili, che in scala logaritmica diventano additive e quindi più facilmente interpretabili come relazioni lineari.
Esempio concreto. In un grafico che confronta il numero di omicidi tra Stati con popolazioni molto diverse, una scala logaritmica consente di visualizzare simultaneamente e con chiarezza realtà piccole come il Wyoming (circa 500.000 abitanti) e Stati molto popolosi come la California (circa 39 milioni), evitando che i primi vengano schiacciati sull’asse.
Avvertenza fondamentale. L’uso di una scala trasformata deve essere sempre dichiarato esplicitamente. Inoltre, è preferibile adottare etichette intuitive e leggibili (ad esempio 1M, 10M, 100M) piuttosto che valori logaritmici puri (6, 7, 8 in log₁₀), che richiedono una conversione mentale e possono confondere il lettore.
17.4.2 Altre trasformazioni utili
Oltre alla scala logaritmica, esistono trasformazioni comunemente utilizzate per risolvere problemi specifici:
- Radice quadrata: utile per stabilizzare la varianza nei dati di conteggio, tipicamente modellati da una distribuzione di Poisson.
- Logit: trasforma probabilità o proporzioni in odds su una scala non limitata, rendendo spesso lineare la relazione con i predittori.
- Arcoseno (arcsin √p): storicamente utilizzata per stabilizzare la varianza nelle proporzioni, soprattutto quando i valori sono vicini a 0 o 1.
17.4.3 Principio guida
Una trasformazione è metodologicamente legittima quando:
- rende visibile un pattern reale che nella scala originale sarebbe difficilmente osservabile;
- è chiaramente dichiarata e spiegata al lettore;
- ha una giustificazione teorica o statistica solida, come la linearizzazione di una relazione nota o la stabilizzazione della varianza.
In assenza di queste condizioni, una trasformazione rischia di diventare uno strumento retorico più che analitico.
17.5 Colore: alleato o nemico?
Il colore è uno degli strumenti più potenti nella visualizzazione dei dati: può chiarire immediatamente la struttura dell’informazione oppure, se usato in modo improprio, confondere, distrarre o distorcere l’interpretazione. Usarlo bene significa prima di tutto comprendere quale ruolo informativo gli si sta assegnando.
17.5.1 I tre ruoli del colore
Distinguere categorie (scala qualitativa) Utilizzare tonalità chiaramente distinte, evitando gradienti o variazioni di luminosità che suggerirebbero un ordine inesistente.
Codificare un ordine (scala sequenziale) Utilizzare gradazioni monotone di luminosità o saturazione di una stessa tonalità, così che valori maggiori corrispondano in modo naturale a colori più “intensi”.
Evidenziare divergenze (scala divergente) Utilizzare due tonalità contrastanti che si allontanano da un colore neutro centrale, per rappresentare deviazioni positive e negative rispetto a un valore di riferimento (ad esempio zero o la media).
17.5.2 Palette consigliate
Per categorie (qualitative):
-
viridis::viridis— ideale fino a 5 categorie, percettivamente uniforme e sicura per il daltonismo; -
RColorBrewer::Set2— adatta fino a 8 categorie ben distinguibili.
Per valori ordinati (sequenziali):
-
viridis::magma— ottima uniformità percettiva e leggibilità anche in stampa; -
RColorBrewer::Blues— intuitiva e adatta a grandezze crescenti.
Per valori divergenti rispetto a un centro:
-
RColorBrewer::RdBu— particolarmente efficace per mappe di calore e correlazioni; -
viridis::plasma— alternativa moderna con buona resa percettiva.
17.5.3 Errori cromatici da evitare
❌ Usare combinazioni rosso–verde per distinguere categorie (circa l’8% degli uomini presenta una forma di daltonismo).
❌ Applicare la palette arcobaleno a dati sequenziali: non è percettivamente uniforme e introduce salti artificiali.
❌ Impiegare troppe tonalità: oltre 6–7 categorie, la discriminazione cromatica diventa rapidamente imprecisa.
❌ Ignorare il contesto culturale e semantico dei colori (ad esempio, rosso come segnale di perdita in ambito finanziario, ma di successo in altre culture).
17.5.4 Test di efficacia
Un buon criterio empirico è il seguente: se il grafico rimane comprensibile e informativo anche in scala di grigi, allora la scelta cromatica è probabilmente solida. In questo caso, il colore rafforza il messaggio anziché sostituirlo.
Il messaggio
L’efficacia percettiva
La rappresentazione dei dati
L’economia visiva
L’accessibilità
L’etica della comunicazione
Riflessioni conclusive
La visualizzazione dei dati è un linguaggio: un sistema di segni dotato di una propria grammatica, di una semantica e di una pragmatica. Come ogni linguaggio, può essere impiegato per chiarire o per confondere, per semplificare o per distorcere. A fare la differenza non è la sofisticazione tecnica degli strumenti, ma l’intenzione comunicativa di chi costruisce il grafico e il rispetto per il destinatario del messaggio.
Edward Tufte ci ha insegnato il valore dell’economia visiva: ogni elemento grafico, ogni tratto e ogni pixel devono giustificare la propria presenza contribuendo alla comprensione dei dati. William Cleveland ha fornito una gerarchia percettiva fondata su evidenze empiriche, mostrando che non tutti i canali visivi sono ugualmente efficaci nel trasmettere informazioni quantitative. Alberto Cairo, infine, ha richiamato l’attenzione sulla dimensione etica della visualizzazione, ricordandoci che un grafico può essere tecnicamente impeccabile e, allo stesso tempo, profondamente fuorviante.
In psicologia, la tentazione di una semplificazione eccessiva è particolarmente forte. I dynamite plots occultano la struttura delle distribuzioni; i pie chart trasformano confronti numerici in angoli difficili da valutare; i grafici a doppio asse possono suggerire correlazioni illusorie. Ogni volta che adottiamo queste soluzioni per abitudine, tradizione o comodità, rischiamo di tradire non solo i dati, ma anche la complessità dei fenomeni che intendiamo comprendere.
Eppure, la visualizzazione non è soltanto una difesa contro l’inganno: è soprattutto uno strumento di scoperta. Un grafico ben progettato può rendere evidenti pattern che sfuggono all’analisi numerica, suggerire ipotesi che nessun modello aveva anticipato e portare alla luce anomalie che nessun test formale avrebbe segnalato.
Per questo motivo, la visualizzazione non è un semplice ornamento del processo scientifico, ma una componente epistemologica essenziale. Non accompagna la conoscenza: la rende possibile. E, come ogni strumento epistemologico, richiede rigore metodologico, onestà intellettuale e una dose necessaria di umiltà.
Visualizzare bene significa rispettare tre principi fondamentali: i dati, rappresentandoli con fedeltà; il lettore, comunicando in modo chiaro; e la verità, evitando qualsiasi forma di manipolazione percettiva.
Questa triade — fedeltà, chiarezza e onestà — non garantisce la perfezione di ogni grafico, ma assicura che la visualizzazione assolva alla sua funzione più alta: essere uno strumento rigoroso, trasparente e responsabile al servizio della conoscenza scientifica.
Esercizi
Cerca “worst graphs ever” o collezione Broman.
Scegli 3 grafici pessimi e per ciascuno:
- Identifica TUTTI gli errori (riferisci a Tufte/Cleveland/Cairo)
- Spiega PERCHÉ problematico (non “brutto”, ma “causa questa distorsione”)
- Proponi alternativa specifica (non “usa barplot”, ma “barplot ordinato per valore, assi da zero, palette viridis, N annotato”)
Dataset SWLS/LSNS:
- Crea grafico “naive” (prima versione)
- Applica 5 revisioni:
- Rev 1: Data-ink ratio
- Rev 2: Gerarchia percettiva
- Rev 3: Onestà scale
- Rev 4: Accessibilità
- Rev 5: Messaggio
- Documenta cosa cambi e perché
Quale revisione ha avuto impatto maggiore?
Crea INTENZIONALMENTE grafico ingannevole (SWLS):
- Dual-axis per finta correlazione
- O asse troncato per esagerare differenze
- O bubble chart con distorsione area
Scrivi: 1. “Pitch”: Come convincere non-esperto 2. “Confessione”: Come smascherare la manipolazione
Obiettivo: Riconoscere manipolazioni diventando temporaneamente manipolatore.


