Mentire con le statistiche
Premesse
Le aggiunte alledizione italiana
contengono
approfondimenti e aggiornamenti,
con molti esempi
che confermano,
anche in anni recenti, le analisi di Darrell Huff.
Qui ci sono alcuni estratti da quei testi che
servono
come presentazione del libro e premessa alla sua lettura.
* * *
Come spiega Darrell Huff nella sua introduzione, e poi nel suo capitolo conclusivo, questo libro non è un manuale per gli imbroglioni. Né un trattato tecnico per gli addetti ai lavori. È uno di quei pochi e straordinari testi che spiegano con rigore scientifico, ma con chiarezza e semplicità di linguaggio, ciò che a tutti (comprese le persone che non si occupano abitualmente di statistiche) è utile sapere. Non perché sia sempre necessario difendersi da dati o deduzioni di dubbia credibilità. Ma perché è sempre opportuno diffidare di ogni informazione di cui non conosciamo chiaramente lorigine e il significato.
È un libro divertente, con molti spunti umoristici, ma non è un esercizio satirico. Con un tono scorrevole e colloquiale, con laiuto di illustrazioni in parte didattiche e in parte ironiche, umoristiche quanto illuminanti, spiega fatti molto seri e concreti, ragionamenti basati su un solido approfondimento teorico e su una pragmatica verifica della realtà.
Mi sembra opportuno sottolineare che questo non è un libro contro le statistiche. Al contrario, è uno strumento per capirle meglio e così renderle più utili. Questo non è solo un compito di chi produce e analizza i dati. È un impegno continuo anche per chi li legge. Se deve trarne conclusioni operative o se deve darne correttamente notizia ad altri o anche quando se ne serve solo per formarsi unopinione.
Nel corso degli anni, ho dato copie delledizione inglese di questo libro a tante persone di diversa esperienza e cultura. Da chi lavora quotidianamente nel campo delle ricerche e delle analisi di dati a studiosi di economia e di gestione aziendale. Da scienziati che si occupano di fisica o biologia a persone che si servono dei dati per la gestione delle imprese. Ne ho anche parlato con molti, in giro per il mondo, che già lo conoscevano esperti in materia o abituali utilizzatori di dati e ricerche.
Tutti, senza eccezione, mi hanno detto di apprezzarne i contenuti e di avere esperienza pratica dei problemi descritti da Darrell Huff. Spero che ledizione italiana ottenga altrettanto consenso.
Non è facile capire perché in cinquantanni di grande e incessante successo delledizione originale non sia mai stata pubblicata una traduzione italiana.
Non penso che ci sia stato un intenzionale complotto per nascondere la verità. Ma è probabile che susciti un certo imbarazzo scoprire quanto possano essere ingannevoli, o comunque poco attendibili, i dati che ogni giorno leggiamo sui giornali o ascoltiamo in televisione e anche quelli specifici su cui si basano decisioni aziendali, dibattiti politici e culturali, strategie di settore od orientamenti generali sulla società o sulleconomia.
Un fatto interessante, e molto significativo, è che questo libro è valido oggi come lo era nel 1954. Il mondo cambia, i metodi e le tecnologie si evolvono, lesperienza insegna... ma la sostanza dei problemi rimane la stessa. Non molto è cambiato da quando Benjamin Disraeli (o era Mark Twain?) centocinquanta anni fa si esprimeva con sintetico disprezzo sulla credibilità delle statistiche. O da quando Thomas Carlyle osservava nel 1840: «uno statistico spiritoso dice che si può dimostrare qualsiasi cosa con i numeri».
Può sembrare diffusa la diffidenza verso le statistiche. Anche chi non ha letto Trilussa conosce la storia del mezzo pollo. Molti hanno sentito parlare di un tale che è annegato in un fiume con una profondità media di un metro. Mentre è ovvio che il più meticoloso dei cuochi non riesce a tagliare un pollo in due metà esatte e nessuno può misurare con precisione la profondità media di un fiume (anche perché cambia da un giorno allaltro secondo le condizioni meteorologiche e i regimi di flusso).
Ma il vero problema è un altro: cè una enorme, quanto ingiustificata, credulità quando si tratta di valutazioni numeriche perché non si bada al fatto che sono statistiche. Per quanto possa essere noto che la persona o cosa media non esiste (tutto è sopra o sotto la media) cè una diffusa e dominante tendenza a credere non solo ai numeri, ma anche ad affermazioni basate su numeri che non vengono neppure citati.
Siamo abituati a credere a chi ci dice che è aumentato il prezzo delle patate, o che è diminuito il numero delle giraffe, senza chiederci con quali calcoli si sia arrivati a determinare la veridicità di quelle informazioni. È probabilmente vero che ci sono circa dieci milioni di miliardi di formiche (fra uno e due milioni per ogni essere umano). Ma chi si ferma a pensare che nessuno può essere in grado di contarle e perciò si tratta necessariamente di una stima statistica?
Non si tratta, ovviamente, solo di statistiche. Ogni genere di informazione e di opinione va sempre letto in modo critico. Si nasconde dovunque la possibilità di errore o di inganno. Per consapevole, intenzionale manipolazione. O per superficialità di analisi. O per incompetenza, distrazione, fretta, inconsapevole pregiudizio culturale o sbaglio involontario.
Accade spesso che un dato, una notizia o unopinione, arbitrariamente o incautamente pubblicata da uno, sia ripresa acriticamente da altri e abbia unenorme diffusione senza alcuna verifica sullattendibilità della sua origine. Non si tratta solo delle cosiddette leggende metropolitane, ma anche di pseudo fatti o notizie infondate che, a forza di essere ripetute, finiscono col sembrare credibili.
Talvolta una bufala può sopravvivere per millenni (per esempio non cè mai stata alcuna prova attendibile che Nerone avesse incendiato Roma). Può essere esagerato affermare, parafrasando Proust, che la diffusione di una notizia è inversamente proporzionale alla sua credibilità. Ma è un fatto che molte cose considerate vere non hanno alcun fondamento se non il fatto che sono così diffuse da sembrarlo.
Naturalmente non tutti gli errori nascono dalle statistiche. Si può trattare di una papera un banale lapsus nellesprimersi. Oppure di deformazioni, assai più gravi, derivanti dallerrata (o manipolata) interpretazione di un concetto, di una situazione, di un fatto o di una circostanza.
Ma di dati, più o meno attendibili, siamo continuamente inondati. E, anche quando in unanalisi o in un commento non viene specificamente indicato un numero, spesso si trovano affermazioni basate su qualcosa che ha origine da una statistica, mentre nessuno ha la bontà di dirci quale sia la fonte e come si sia arrivati a stabilire se davvero gli uomini preferiscono le bionde o se sia ragionevole credere che lintera popolazione di New York o di Milano si stia appassionando per un fatto di cronaca che può tuttal più interessare a una ristretta cerchia di parenti e di amici delle persone coinvolte.
(Questo genere di affermazioni viene fatto generalmente senza alcuna base statistica. Ma non sono più attendibili quelle per cui qualche dato esiste, ma non è stato correttamente verificato e interpretato).
Se è giusto e necessario, come ci consiglia Darrell Huff, armarci di una sana dose di diffidenza quando qualcuno cita qualsiasi genere di numero, è vero in generale che la stessa cautela vale per ogni sorta di informazioni e di notizie.
Le statistiche sono spesso utili, talvolta necessarie, ma non bisogna mai dimenticare che non sono infallibili. I numeri sono perversi quando servono per deformare una situazione (che sia manipolazione intenzionale o errore involontario non cambia il fatto che falsifica la conoscenza) o per tentare di dare false certezze.
Cè una frase attribuita a diversi autori, fra cui Mark Twain, che riassume chiaramente il concetto. «Ricerche, sondaggi e statistiche sono come un lampione. Utile quando serve a fare luce. Ma non dobbiamo comportarci come lubriaco che ci si appoggia».
Molte cose sono cambiate in cinquantanni. Ma la sostanza del problema è sempre la stessa. Si ripetono allinfinito gli stessi errori, con qualche complicazione in più dovuta alla struttura del sistema informativo, allintroduzione di nuove tecnologie non sufficientemente verificate, a manipolazioni intenzionali o distrazioni superficiali che forse non sono aumentate, ma dalla quotidiana constatazione dei fatti non risultano diminuite.
Insomma questo non è solo il libro sulle statistiche di maggior successo in tutta la storia delleditoria. Non è solo il testo più chiaro, e facilmente comprensibile, che sia mai stato scritto sullargomento. Soprattutto è oggi, più che mai, di attualità.
Giancarlo Livraghi
* * *
Questo è un libro prezioso. Perché contiene insegnamenti terribilmente utili per capire quali inganni possano celarsi dietro quel mare di dati statistici da cui siamo inondati ogni giorno, negli Stati Uniti ancora oggi come nel 1954 (anno di prima pubblicazione del libro) e nello stesso modo, se non peggio, oggi in Italia.
Il libro è scritto con uno stile fresco, a volte tagliente, sempre spiritoso. Ciò non toglie che le nozioni in esso presenti sui vari temi importanti della statistica siano sempre maneggiate dallautore con grande precisione e rigore. Divertimento e rigore: lobiettivo è quello sacrosanto della divulgazione, cioè quello di fornire informazioni su una data materia scientifica a chi non sia un addetto ai lavori ma sia comunque molto interessato alle conclusioni che se ne possono trarre.
Chi legge vuole ricevere informazioni precise ma non vuole annoiarsi mortalmente dopo venticinque righe. E linteresse del lettore viene immediatamente solleticato dal titolo stesso del libro di Huff: sembra trattarsi di un manuale per insegnare ai furbi come si imbroglia la gente con le medie e i grafici e le correlazioni, e invece si scopre che il manuale è scritto a vantaggio del cittadino che vuole per lappunto difendersi dai furbetti della statistica.
Linganno nelluso dei dati statistici sta nel far credere che questi dati supportino una certa verità o interpretazione della verità, quando invece la verità è unaltra o ci sono altre dieci interpretazioni legittime alla luce di quegli stessi dati. Alla base di questo uso improprio della statistica vi è spesso e (mal)volentieri un intento doloso, ovvero la volontà ben formata di ingannare il destinatario del messaggio.
Altre volte non vi è dolo, ma colpa grave, cioè chi crea o utilizza il dato statistico ignora colpevolmente le proprietà e i limiti delle conclusioni che si possono trarre da quel dato.
A volte il confine tra dolo e colpa grave è assai incerto, poiché linconscio di chi usa dati statistici induce a sbagliare sempre nella direzione a lui più favorevole. Un po come nel caso del cassiere al supermercato (amabilmente citato da Huff) che chissà perché quando si sbaglia dà spesso meno resto del dovuto.
In altri casi poi chi presenta i dati statistici ha in mente una finalità diversa da quella di informare (non pochi giornalisti vogliono per esempio fare sensazione con i loro articoli), e leffetto collaterale consiste nel fornire interpretazioni scorrette dei dati, perché esagerate in un senso o nellaltro, e che spesso si rivelano assurde. Soltanto però se si ha il tempo di dare una seconda occhiata.
Non bisogna dimenticare infine il rischio di una collaborazione al dolo o alla colpa da parte della stessa persona che legge un certo dato statistico e preferisce farsi ingannare, perché nel breve periodo è più felice così, sentendosi raccontare una storia che è più piacevole della verità.
In tutti questi casi il libro di Huff è prezioso perché fornisce unarma di difesa contro gli usi dolosi o colposi della statistica. Le conoscenze tecniche che nel testo di Huff sono presentate nella forma divertente di esempi possono essere facilmente impiegate per dare una seconda occhiata al latinorum dei dati statistici, tradurlo in lingua corrente e capire in quale misura stiamo ricevendo informazioni utili o siamo vittima di un qualche inganno. Persino con la nostra stessa complicità.
Nel 2005 la rivista Statistical Science, pubblicata dal prestigioso Institute of Mathematical Statistics, ha dedicato unintera sezione speciale al libro di Huff, in occasione del cinquantesimo anniversario della sua prima edizione. Il libro mantiene ancora oggi tutta la sua attualità. La diffusione sempre più ampia di vecchi e nuovi mezzi di comunicazione di massa ha parallelamente allargato lo spazio disponibile per messaggi basati sui dati statistici, e si può facilmente verificare come i trucchi smascherati da Huff nel suo libro non siano per niente scomparsi dalla circolazione.
Dopo avere vissuto per cinque anni in Inghilterra e per un anno negli Stati Uniti, posso affermare che la situazione in quei paesi per quanto concerne la correttezza nelluso della statistica non sia particolarmente migliore di quella italiana, anche se i trucchi utilizzati lì sono in media vagamente più sofisticati.
Da un punto di vista empirico, è pressoché impossibile stabilire quanto di questo presunto maggior livello di sofisticazione a patto di saperlo misurare dipenda dalla disponibilità del testo di Huff in lingua inglese, ma sarebbe interessante scoprirlo.
Forse le varie traduzioni del testo originale che sono state fatte negli anni (prima di questa in italiano, lultima è quella cinese pubblicata dallUniversità di Shanghai nel 2003) possono essere utilizzate come una sorta di esperimento naturale per rispondere a una semplice domanda: è vero che il libro di Huff, spiegando ai suoi lettori come si dà una seconda occhiata, rende un po più difficile la vita ai furbetti della statistica?
Anche se è difficile scoprire quale sia leffetto totale del libro di Huff sulla consapevolezza statistica della popolazione di un dato paese, il singolo lettore può fare una semplice verifica su quanto questo libro gli potrà essere utile nella vita di tutti i giorni. Provi a contare tutte le volte che, di fronte a un qualche dato statistico a cui ha dato una seconda occhiata (alla maniera di Darrell Huff), gli venga da battersi la fronte con la mano (alla maniera di Homer Simpson) esclamando: «Doh! E io che ci stavo pure credendo!».
Riccardo Puglisi