Big Data o Bad Data: la desmitificación del dato

Eticas lanza la campaña BadData para denunciar que los datos también se equivocan, y los malos datos generan malas decisiones

Guardar

Big Data and Bad Data
Big Data and Bad Data

La frase "los datos son el oro del siglo XXI" es una verdad a medias. Los datos tienen valor si son verídicos. Eticas, una fundación cuyos esfuerzos se centran en el  diseño e implementación de soluciones prácticas para la protección de datos, la ética, la explicabilidad y los desafíos de sesgo en Inteligencia Artificial (IA) que afectan a la sociedad, ha puesto en marcha la campaña #BadData. Pretende recopilar historias de personas que han sufrido las consecuencias derivadas de una mala recogida, gestión, almacenamiento y procesamiento de sus datos personales, para darle visibilidad a una problemática que afecta a muchas personas y además cuestiona ideas establecidas sobre la superioridad de los sistemas de datos frente a la decisiones tomadas por seres humanos.

Generamos 1,7 millones de datos por segundo

“Con esta campaña buscamos desmitificar la sociedad de los datos. Se ha instalado la idea de que las decisiones basadas en datos o que utilizan IA son mejores que las decisiones humanas, cuando en realidad la calidad de los datos que alimentan estas decisiones dejan mucho que desear“, ha dicho Gemma Galdón Clavell, directora de la Fundación Eticas. “Con el proyecto BadData concienciamos sobre este problema y a la vez introducimos una sana desconfianza hacia la pretendida neutralidad e infalibilidad de los datos

big data

Para continuar dando visibilidad a esta iniciativa, el 1 de abril, conocido en algunos países como el April fool’s Day, equivalente al día de los Santos Inocentes, Eticas comienza la campaña BadData is not a joke con el fin de recopilar y mostrar experiencias de personas que han tenido problemas derivados del mal uso de sus datos. De esta manera, Eticas pone a disposición de toda la población su página web y sus redes sociales para recibir todos los testimonios relacionados con la recolección de datos inexactos, incompletos o no actualizados por parte de alguna empresa, entidad u organismo.

Se estima que cada persona genera 1,7 MB de datos por segundo. Esto es más de lo que cabría almacenar en un smartphone de 128 GB de capacidad. Solo en un día. Y se estima que para 2040 se producirán un 80% más de datos. Pero, para que estos datos tengan valor, hay que prestar atención a  su calidad, mantenerlos actualizados, custodiarlos en condiciones de seguridad… Lo caro no es conseguir los datos, sino todo lo demás. El gran error ha sido dedicar todo el esfuerzo a la recolección de los datos. Empresas y administraciones públicas acumulan enormes cantidades de datos sin organizar, limpiar o validar. Estos son los datos que después alimentan los algoritmos que toman decisiones tan importantes como si alguien recibe un crédito, un trabajo o una prestación social. Al fin y al cabo, el BadData nutre a los algoritmos y estos pueden arrojar resultados o predicciones erróneas si la calidad de los datos no es óptima. Por tanto, una mala recolección, almacenamiento o procesamiento de estos puede ocasionar daños irreparables en la vida de una persona y afectar a su huella digital.

En Eticas comenzaron hace cuatro años a recoger  historias y vivencias relacionadas con el BadData, lo que dio como resultado historias muy relevantes. Esta campaña reveló que gran parte de la ciudadanía se ha enfrentado al menos una vez en la vida al BadData, dando lugar a situaciones como el pago de un seguro médico de otra persona o procesos de identificación erróneos por equivocaciones en la fecha de nacimiento o DNI ante cualquier organismo, institución o situación donde la identificación era obligatoria.