Cada dia, administracions, institucions públiques i empreses d’arreu del món, produeixen una gran quantitat d’informació. L’Internet de les Coses (de l’anglès Internet of Things o IoT) fa que la recopilació de les dades hagi augmentat de forma exponencial i cada cop trobem més casos d’empreses privades i administracions públiques que les posen a disposició de tothom. Aquesta és l’essència de l’Open Data, o dades obertes, que consisteix a posar la informació acumulada a disposició de qui ho vulgui.
Tenim exemples d’ús de dades obertes molt quotidians i dels que potser no en som conscients. Serveis de geolocalització com OpenStreet Maps o de previsió del temps funcionen gràcies a repositoris de dades obertes. Molts ajuntaments i la pròpia Generalitat de Catalunya disposen de portals de dades obertes d’on nombroses apps i serveis que utilitzem xuclen informació per creuar-la i crear productes útils.
També hi ha casos exclusivament empresarials, com el d’alguns bancs, que a partir de les seves pròpies dades recopilades, i les d’altres datasets públics, han creat apps per, per exemple, poder valorar el cost d’un habitatge. La Fundació COTEC va publicar a finals d’aquest 2019 un guia per les empreses, amb exemples molt interessants on s’hi poden trobar els diferents models empresarials que hi ha en l’actualitat basats en l’ús d’Open Data. Queda clar doncs que el potencial de les dades obertes és enorme, que l’encreuament i ús de diferents datasets públics i privats pot generar fonts d’informació i nous serveis de gran impacte.
Que són les dades obertes?
Les dades obertes compleixen unes característiques concretes: estan en format digital, i estandarditzades i són reutilitzables i redistribuïbles de manera lliure (disposen d’una llicència d’ús que en permet la seva utilització i sense cap restricció).
Parlem que són reutilitzables, perquè considerem aquesta dada com un format estructurat, o sigui, les dades es poden crear i manipular per a qualsevol programari, lliures de restriccions legals. En el mateix procés que es preparen les dades perquè siguin estructurades, també passen un procés d’anonimització per garantir que no es podrà ni identificar ni exposar cap persona, o sigui, es garanteix la privacitat de totes les persones.
Les dades es poden utilitzar quan es publiquen en format comú i comprensible, això vol dir que no simplement s’han de publicar de manera que es puguin utilitzar, sinó que s’ha de procurar que aquestes dades tinguin la major qualitat possible.
La seva qualitat la podem mesurar en el compliment de quatre recomanacions: fàcil de trobar, accessible, interoperable i reutilitzable (en anglès s’utilitza l’acrònim FAIR, Findable, Accessible, Interoperable and Reusable). L’inventor de la web, Tim Berners-Lee proposa un esquema de cinc estrelles per classificar ràpidament la qualitat de les dades.
Per tant, si mirem amb detall l’escala que ens proposa aquest esquema, veure’m que com més oberta sigui la llicència del fitxer, més estructurada i interoperable sigui la dada, o el format sigui llegible pel màxim de sistemes, més qualitat tindrà. Per exemple, un PDF encara que sigui un format comú és un format més restrictiu que un fitxer csv, que pot llegir qualsevol programa.
El món creix amb les dades
És evident que no som conscients de la quantitat de dades obertes que existeixen a la nostra disposició i que són reutilitzables. Per a fer-vos una idea, us proposem que visiteu uns quants dasets, com el portal de dades obertes de la Generalitat o el Servei de dades obertes de l’Ajuntament de Barcelona o el de Tarragona, sense oblidar les iniciatives pioneres com el de l’ajuntament de Gavà com a exemples paradigmàtics. També hi ha iniciatives interessants de caràcter més petit, com les generades per associacions, que ofereixen una gran diversitat de dades. Com a exemple citarem el Banc de dades de biodiversitat de Catalunya.
Tots els portals d’open data ens ofereixen navegar a través de categories de catàlegs de dades i ordenar els resultats per als més visitats i descarregats. Ens ha cridat l’atenció que visitant-los, per exemple al portal de dades de Barcelona, el conjunt de dades amb més descarregues és sobre l’arbrat de Barcelona i el de la Generalitat, el de les dades de contaminació atmosfèrica. Les dades són ara mateix la matèria primera de la innovació, ja que gràcies a la interoperació de diferents col·leccions de dades es poden treure conclusions a preguntes que fins ara era difícil d’arribar-hi.
El passat 18 de novembre, al m4social day vam parlar amb diferents persones de l’àmbit de l’administració pública, com des de l’expertesa de l’ús de les dades, perquè ens donessin respostes sobre com les dades socials podien interoperar. Podeu veure’n el resultat a través d’aquestes entrevistes.
Tercer Sector i Open Data
Existeixen datasets oberts propis del Tercer Sector? Quins són els més utilitzats per les entitats? Són dues de les grans preguntes que us convidem que ens ajudeu a resoldre. Actualment hi ha molt poca informació relativa a l’atenció social per part de les entitats disponible de forma oberta.
L’ús de dades obertes i la seva producció és una peça més del treball basat en dades. Durant el 2019 m4Social ha treballat aquest aspecte des de diferents perspectives: protecció de dades, interoperabilitat, presa de decisions basades en dades, etc. Les dades obertes aporten una nova manera de treballar amb aquestes, un plantejament on la cultura de compartir es posa en valor i on se cerca maximitzar l’impacte que es pot generar a partir de dades que obtenim.
“Normalment ens trobem que el problema més gran és la falta de cultura de dades”, ens explicava Eric Hannell de DataForGood en una entrevista recent feta per m4social. Aquesta entitat barcelonina ofereix suport a les entitats del Tercer Sector que volen treballar amb dades i no saben per on començar. Tot i les dificultats que un principi us podeu trobar el mateix Eric també ens anima: “nosaltres sempre diem a la gent: intenta-ho, perquè potser et sorprendràs del que és possible“.