L’emmagatzematge i els canals per compartir dades, reptes del Big Data

Els experts assenyalen que cal crear mecanismes que permetin l’intercanvi de dades de forma segura
Temas relacionados:
Herramientas

Mar Barberà

Barcelona

|
17 feb 2017 - 08:00 h
|

L’analítica de dades massives aplicada a la investigació pretén explotar conjunts de dades, incloent dades personals, per establir correlacions i tendències que millorin la presa de decisions. Examinar pràctiques de recerca i innovació sobre Big Data relacionades amb la salut són els aspectes que han centrat la Jornada “Analítica de dades massives i salut”, celebrada el 16 de febrer a la Facultat de Dret de la Universitat de Barcelona (UB). La Jornada, organitzada per l’Observatori de bioètica i Dret de la UB, s’ha centrat en els aspectes ètics, legals, socials i tècnics que suposa l’emmagatzematge i compartiment de dades en salut.

Privacitat i anonimització

Referent al camp legislatiu de la privacitat de les dades, Marc Via, professor del Departament de Psicologia i Psicobiologia Clínica de la UB, va destacar que “ja no podem garantir l’anonimització cen per cent de les dades i, per tant, ho hem d’explicar”. En aquesta línia, Via va assenyalar que “aquest fet crea conflicte ètic, perquè sabem que encara que actualment hi hagi garants de privacitat i confidencialitat, també s’ha demostrat que al cap d’uns anys hi ha avenços tecnològics que han permès aconseguir dades de participants en estudis”. Pel que fa a la gestió de dades, Via va apostar per dissenyar un emmagatzematge que sigui utilitzable i compartible. “Generar dades i guardar-les en un servidor estancat no serveix. Hem de fer i crear mecanismes que permetin l’intercanvi de dades, amb tot els riscos associats a una connexió de xarxa”.

Per la seva banda, Carlos Castillo, responsable de la Unitat de Data Science del Centre Tecnològic de Catalunya, Eurecat, va posar de manifet els diferents models actuals d’anonimització de dades. “La protecció de dades no és un tema de blanc o negre, de donar totes les dades d’un mateix o no donar-ne cap. És tracta d’anonimitzar les dades abans de compartir-les, fins i tot, dins la mateixa organització”. Castillo va posar com a exemple un hospital. “En aquest context, es té una base de dades gran on hi ha tota la informació i una base de dades secundària, que és útil per fer investigació clínica però també per fer-ne us i millorar el servei assistencial”. En aquest cas, la manera idònia d’anonimitzar correctament, segons Castillo, és “reidentificant, és a dir, fent modificacions petites en un conjunt de dades.Tenim una taula amb columnes on cada columna és una característica de la persona; edat, sexe, alçada, i cada fila és una persona. Per reidentificar s’han d’eliminar les columnes amb informació personal òbvia. En comptes de posar l’edat exacte, es pot fer servir un inverval d’edats”.

Twitter
Suplementos y Especiales