Les dades també menteixen

Quantes vegades hem escoltat “ho diuen les dades”, “les dades mostren que…” o “segons les dades d’un estudi…”? Les dades s’han convertit en sinònim de veracitat. Avui és més fàcil que mai accedir a qualsevol font de dades, des de la informació de la NASA fins als informes del nostre ajuntament. Ara bé, com qualsevol altra font d’informació, pateixen biaixos en la recollida, l’anàlisi i la visualització. Les dades no són neutrals ni objectives, encara que ens hagin dit el contrari

Publicat per Laura Navarro | 25.08.2022

Les visualitzacions de dades (gràfics, mapes, taules) són cada vegada més comuns als mitjans de comunicació, on els gràfics acompanyen temes com l’atur, els pressupostos o l’IPC. També és normal que apareguin en els debats polítics, on els líders suporten els arguments mostrant gràfiques que, molt sovint, menteixen per tal de reafirmar el que estan dient. Avui, s’inclouen gràfics i estadístiques en qualsevol argument per tal d’afegir “veracitat”.

Les visualitzacions de dades no són neutrals, sinó construccions culturals: s’han de distorsionar les dades per simplificar-les i representar la informació mitjançant formes, posicions i colors (Mazón, 2019). D’altra manera serien inintel·ligibles. Això sí, la manera com es representen influeix directament en com s’interpreten.

Durant un debat polític el 2019, Pablo Casado va mostrar un gràfic sobre la contractació indefinida (esquerra) que no té res d’objectiu. Les dades són correctes, però no ho és la manera en què s’han visualitzat. El gràfic de Pablo Casado mostra l’evolució de la diferència interanual, i no dels contractes en valors absoluts. Segons Maldita.es, “utilitzar taxes interanuals en aquest tipus de gràfics no sol ser representatiu. A més, en aquest gràfic no apareixen els valors de l’eix vertical i, per tant, és normal pensar que es tracta de valors absoluts”. Maldita.es va refer el gràfic (dreta) on es mostren les dades absolutes i, per tant, la contractació indefinida total. Aquesta és tan sols una de les tècniques que, com veurem a continuació, es fan servir per mentir amb dades.

Pablo Casado enseña un gráfico de variación internual. (Fuente: Atresmedia)

Gráfico de Pablo Casado rehecho en valores absolutos. Fuente: Maldita.es

Quan menteixen les dades

1. Els eixos estan tallats o no es mostren

Una de les pràctiques més habituals a l’hora de manipular un gràfic és tallar els eixos verticals perquè no comencin en 0. D’aquesta manera s’aconsegueix que les barres o línies mostrin diferències més o menys exagerades utilitzant exactament les mateixes dades. És una tècnica per incrementar distàncies i polaritzar l’opinió.

Gráfico con eje vertical cortado

Gráfico con eje vertical cortado

Gráfico con el eje completo

Gráfico con el eje completo

Aquesta pràctica és molt habitual en els mitjans de comunicació de masses. El 2015, el programa Espejo Público va mostrar un gràfic sobre els resultats d’una enquesta on, a més de tallar els eixos, la longitud de les barres no coincideix amb els percentatges. El gràfic de la dreta que es mostra a continuació és l’original de l’enquesta, on es pot veure que la diferència entre Pedro Sánchez i Albert Rivera és menor.

Fuente: Cadena SER, “Un error en los gráficos que beneficia a Ciudadanos” (2015)

En aquest altre exemple d’un tuit de TVE, el gràfic també és erroni. Si ens fixem en els valors destacats, la xifra de 4,1 milions el 2019 està per damunt del valor de 2014, que és de 4,4 milions. A simple vista és difícil detectar aquests errors, ja que, de manera deliberada, l’eix vertical s’ha omès per no tenir cap referència que no siguin les xifres puntuals.

Fuente: Verne, “Cómo reconocer un gráfico que está mal hecho”

Fuente: Verne, “Cómo reconocer un gráfico que está mal hecho”, imagen 2

2. No mostren dades suficients

Sempre que es representen dades es decideix què s’inclou i què no. De fet, és un procés natural de qualsevol visualització, ja que es tracta d’un acte de síntesi de la informació per fer-la comprensible. Tot i això, hi ha molts casos en què es decideix excloure informació per tal de manipular la nostra percepció.

D’aquesta manera, si volem convèncer que una empresa funciona bé i que les vendes augmenten anualment, podríem incloure tan sols els anys en què les vendes creixen.

Gráfico en el que solo se incluyen los datos que interesan.

Gráfico en el que se incluyen todos los datos.

A la pràctica, es poden trobar diàriament gràfics que no inclouen informació suficient, sobretot en mitjans de comunicació que projecten el gràfic durant pocs segons. TVE va mostrar un gràfic sobre l’evolució de l’atur (esquerra) que només mostra les dades de l’any 2000, 2008 i 2013, de manera que no es pot veure l’evolució gradual, sinó únicament valors que exageren la diferència entre les barres. A la dreta, el gràfic que conté tota la informació any rere any.

Gráfico que solo incluye los datos que interesan (Fuente: Pablo Rey Mazón)

Gráfico que incluye todos los datos. (Fuente: Pablo Rey Mazón)

3. Mostren percentatges enganyosos

Segurament alguna vegada heu escoltat afirmacions de l’estil “el 80% dels dentistes recomanen aquesta pasta dentífrica”, o “9 de cada 10 persones ho recomanen”. Una de les coses que s’han de tenir en compte a l’hora de llegir un percentatge és la mida de la mostra. A quants dentistes se’ls hi ha preguntat? Quantes persones han donat la seva opinió? No és el mateix preguntar a deu dentistes que a un miler.

També cal tenir en compte les condicions de la mostra. Un dels temes que ha donat més voltes arran de la vacunació de la Covid-19 és el percentatge de persones hospitalitzades pel virus i que s’havien vacunat prèviament: “Hi ha més persones vacunades hospitalitzades per Covid-19 que no pas sense vacunar, qui ha dit que la vacuna és efectiva?” Compte amb aquest tipus d’afirmacions, ja que el percentatge d’hospitalitzacions per Covid-19 entre persones vacunades serà més alt perquè la taxa de vacunació és molt elevada.

Infografia de El País que explica por qué hay más personas vacunadas hospitalizadas (24 noviembre 2021).

Infografia de El País que explica por qué hay más personas vacunadas hospitalizadas (24 noviembre 2021).

Com explica Javier Álvarez Liébana, un matemàtic doctorat en estadística que fa divulgació per les xarxes, “hi haurà un moment en què la gran majoria dels hospitalitzats per Covid-19 seran persones vacunades, igual que la majoria dels hospitalitzats per accidents de cotxe portaven el cinturó. Afirmar que ni el cinturó ni les vacunes no funcionen és una fal·làcia estadística que s’anomena biaix del supervivent”, assegura. Hem de recordar que, en cas de no existir les vacunes ni el cinturó de seguretat, el nombre d’hospitalitzats i morts seria molt més elevat.

4. Suggereixen alguna cosa incorrecta

El cas del gràfic de Pablo Casado durant el debat polític és un bon exemple del fet de no mostrar dades suficients. Se suprimeix l’eix vertical per tal de no saber de què estem parlant, ni de quins paràmetres, el que dona lloc a conclusions errònies per part del receptor.

Tanmateix, relacionar dues coses com a causa-efecte porta, molt sovint, a missatges erronis. Per exemple, habitualment ens trobem amb afirmacions com “a Barcelona, on hi ha més vacunats és on hi ha una renda més alta”. La causa que hi hagi més vacunats pot ser perquè el poder adquisitiu és major, però també perquè l’esperança de vida és més alta i, per tant, la gent gran s’ha vacunat abans. Aquest error, anomenat “correlació espúria” o falsa, passa quan establim causa-efecte sense tenir en compte un tercer factor que pot ser el causant.

La web Spurious correlations, creada per Tyler Vigen, ens ensenya les increïbles coincidències entre dues variables que, evidentment, no són causa-efecte. En l’exemple que es mostra a continuació, Vigen descobreix una correlació entre el consum de margarina i els divorcis a l’estat de Maine, als Estats Units.

Gráfico. Fuente: Spurious Correlations

 

O aquest altre, on estableix una correlació entre el nombre de defuncions per saltar a una piscina i el nombre de pel·lícules on apareix Nicolas Cage. La coincidència és elevada, però no existeix cap relació de causa-efecte entre les aparicions de l’actor i aquest tipus de morts. Recordem-ho com un mantra: correlació no implica causalitat.

Gráfico 2. Fuente: Spurious Correlations

5. Recullen informació errònia

De forma voluntària o involuntària, sovint hi ha errors en la recollida o processament de les dades. En alguns casos, les dades de diferents fonts oficials no coincideixen. En d’altres, el dia de la recollida de dades afecta la seva interpretació, com en el cas dels nous positius per Covid-19. Els casos sempre augmenten els dilluns, ja que durant els dissabtes i diumenges no s’actualitzen les dades i s’afegeixen els nous casos només els dies laborables.

També es pot donar el cas que es compten dues vegades les dades. Això va ser, precisament, el que va ocórrer en aquest article, que va ser esmenat, perquè es van comptar dues vegades les dades de les vacunes de la Covid-19 que es van haver de llençar a Europa: una vegada en el global de la Unió Europea i una altra per cada país europeu. Aquests errors, en alguns casos, poden ser totalment inconscients, però en d’altres, poden ser premeditats amb l’objectiu de confondre al receptor.

Com combatre la desinformació amb dades?

Així doncs, abans d’extreure qualsevol conclusió d’un gràfic, mapa o dada estadística, hem d’observar bé tota la informació que hi apareix i preguntar-nos:

  • Qui l’ha fet?
  • Quin és el context?
  • Quina és la font?
  • Què es mostra i, sobretot, què queda fora?

Referències

Mazón, Pablo Rey (2019): Mentir con datos: manipulaciones y mentiras blancas

National Geographic (2018): Why your mental map of the world is (probably) wrong (https://www.nationalgeographic.com/culture/article/all-over-the-map-mental-mapping-misconceptions)

Cairo, Alberto (2019): How Charts Lie: Getting Smarter About Visual Information (https://www.youtube.com/watch?v=Low28hx4wyk)

Prieto, Gonzalo. ¿Mienten los mapas electorales?, ¿votan las personas o los territorios?, Geografía Infinita (https://www.geografiainfinita.com/2020/11/mienten-los-mapas-electorales-votan-las-personas-o-la-tierra/)

 

No hi ha comentaris

Your email address will not be published.

Acepto la política de privacidad y el aviso legal