JURÍDICO ARGENTINA
Doctrina
Título:La protección de los datos personales en la era del Big Data
Autor:Montes, Gisela
País:
Argentina
Publicación:Diario DPI - Suplementos - Derecho y Tecnología
Fecha:14-07-2020 Cita:IJ-CMXXII-824
Índice Citados Relacionados Ultimos Artículos
1. Introducción
2. La protección de datos personales y la Big Data
3. Conclusión
Notas

La protección de los datos personales en la era del Big Data

Gisela Montes[1]

1. Introducción [arriba] 

Desde hace varias décadas nos encontramos inmersos en la era digital. Una era que introdujo en el mundo un sinfín de nuevas tecnologías, mejorando, ineludiblemente, nuestra calidad de vida. En ese marco, los avances tecnológicos facilitaron el intercambio masivo e instantáneo de datos, generando un volumen de información humanidad que ha adquirido un rol fundamental y se ha transformado en un recurso esencial para múltiples sectores de la sociedad.

Somos productores indiscriminados e inconscientes de información. Tal es así que “construimos nuestro mundo a partir del vínculo que establecemos con la información”[2]. La información es tan importante que dejamos que abarque gran parte de nuestras vidas: reenviamos un archivo que nos llega por Whatsapp, buscamos un texto en Google, comentamos un artículo de un diario, o nos pasamos horas interpretando un texto legal.

Así, como se sostiene que el hombre es el principal responsable por la realización de actividades que devienen en problemas ambientales, industriales, poblacionales, o sociales, en mi opinión, el ser humano es, sobre todo, un generador incansable de información, que resulta ser más, o igual, peligroso y delicado, porque la reproducción de información y su difusión a lo largo del globo parece, a simple vista, imperceptible. Nada más lejos de la realidad.

Frente a ello, en una época donde, literal, “las noticias, vuelan”, es responsabilidad directa de los Estados desarrollar e implementar figuras jurídicas que garanticen la protección de los datos, en especial, de los datos personales. Tanto a nivel nacional, como a nivel internacional, es esencial que se tome consciencia de la importancia que tienen nuestros datos, y que nosotros, somos titulares, comprendamos que una vez que se genera un tuit, una foto de Instagram o un post de Facebook, automáticamente perdemos el control de su distribución, circulación e impacto[3].

Esto debemos preguntarnos, ¿Qué tan protegidos están nuestros datos? ¿Y quién es ese monstruo llamado “Big Data”?

2. La protección de datos personales y la Big Data [arriba] 

Nuestro país cuenta con un amplio marco jurídico relativo a la materia, sólo por destacar, en el año 2000 se dictó la Ley de Protección de Datos Personales N° 25.326 (en adelante, “LPDP”) y, al año siguiente, su Decreto Reglamentario N° 1558.

No obstante, sin pretender ahondar en una extensa descripción de la normativa sancionada en relación al tema durante los últimos años, resulta un tanto evidente que, más allá que la sanción de la LPDP y su decreto reglamentario resultaron ser grandes aportes legislativos, el paso del tiempo y, con ello, la continua transformación digital, han hecho que la protección contemplada en aquellos instrumentos resulte “insuficiente” a las exigencias actuales.

En el mismo escenario, aparecieron nuevos conceptos como el “Machine Learning”, “Blockchain”, “AI”, “Cloud”, “Data Science”, “Big Data”, “Data Transparency”, “Data Mining”, o “Deep Learning”, que tiene impacto directo y cuyo concepto, alcance y significado debemos descifrar.

Estos términos que solemos asociar al mundo tecnológico, digital, informático e inteligente, y que parecieran ser lejanos, se encuentran ampliamente vinculados y relacionados con nuestro mundo cotidiano.

Concretamente, y en tanto objeto de este trabajo, para hablar de Big Data, debemos aceptar que la misma fue el resultado de numerosos eventos de la humanidad: la “Virtual Memory” de Fritz Rudolf Güntsch (1956), el “IBM Shoebox” de William C. Dersch (1962), la creación del primer ‘data center’ en Estados Unidos (1965), la elaboración del ‘modelo relacional de base de datos’[4] de Edgar Frank Codd (1970), la creación de la Internet (1931), la primer mención de la ‘business intelligence (BI)’[5] de Erik Larson (1989), la invención de la World Wide Web (WWW) por Tim Berners-Lee y Robert Cailliau (1991), el lanzamiento del buscador Google (1997), la publicación del estudio titulado “¿Cuánta información hay en el mundo?”[6] de Michael Lesk (1997), la realización del primer estudio académico del término “Big Data” (1999), la publicación del estudio que explicaba el sistema de ficheros distribuidos “Google File System (GFS)” de Sanjay Ghemawat, Howard Gobioff, and Shun-TakLeung de Google (2003), la presentación de un nuevo paradigma en procesamiento distribuido llamado “Map & Reduce” de Google (2004), el origen de la Web 2.0. (2005), la culminación de la primera plataforma Big Data Open Source llamada Hadoop de Apache Doug Cutting y Mike Cafarella (2006), la aparición de empresas como “Cloudera” y “Hortonworks” (2009 a 2011), la primer utilización del término de Big Data para fines políticos (2012), el almacenamiento de ciento setenta (170) billones de mensajes en el archivo de mensajes públicos de la red social “Twitter” (2013), la superación de los teléfonos móviles respecto a los ordenadores (2014), el comienzo del ‘internet de las cosas’ (IT) (2016), y la publicación de la revista británica ‘The Economist’ en donde se dijo que “El recurso más valioso del mundo ya no es el petróleo, sino los datos” (2017).

Por lo tanto, después de casi setenta (70) años desde que se comenzó a hablar de Big Data, la mayoría de los especialistas del tema coinciden en describirla conforme a cinco “V”: Según McKinsey & Company, una prestigiosa consultora estratégica global, “Big Data refiere a un conjunto de datos cuyo tamaño está más allá de la capacidad que tienen los softwares de base de datos para capturar, almacenar, administrar y analizar”. Esta definición se enfoca en el volumen. Asimismo, la Big Data se caracteriza por su variedad y velocidad. En este sentido, “con variedad se suele hacer referencia a la heterogeneidad de la representación e interpretación semántica de los datos, es decir que no están directamente listos para ser integrados a una aplicación; mientras que con velocidad se hace referencia tanto a la frecuencia de disponibilidad de los datos como al tiempo en el que hay que dar respuesta”. Luego, nos encontramos con su veracidad. La veracidad fue necesaria en cuanto a que el volumen fue inevitable. El incremento constante de información tornó necesario comenzar a priorizar la calidad de la información recopilada. Almacenar información de cualquier tipo, de forma masiva, es relativamente fácil. Sin embargo, el verdadero análisis deviene importante cuando se rescata de aquella masa de información, sólo la relevante, la que es útil, y para que sea útil, debe ser veraz. Más aún, “la propia velocidad y accesibilidad a las redes hace que la veracidad de una información deba ser puesta en cuestionamiento apenas empieza a moverse por la web antes de ser utilizada efectivamente para cruzar ese dato con otro”.[7] Finalmente, podemos hablar del valor. Esta variable se encuentra orientada a que los datos sirvan para mucho más que para describirse a sí mismos.

Sin ir más lejos, en el 2017, Diario Judicial publicó una nota[8] en la que considera que “se denomina Big Data al conjunto de datos de gran volumen, alta velocidad y/o alta variedad de información, generados a través de la red y mediante el uso de dispositivos inteligentes, que demandan nuevas formas de procesamiento y que incidirán en la toma de decisiones y en la optimización de procesos”.

Habiendo realizado una breve conceptualización de la Big Data, corresponde abordar las problemáticas que se presentan entre este concepto y la protección de datos personales.

Como he mencionado, en nuestro ordenamiento jurídico rige la Ley N° 25.326/00 y el Decreto Reglamentario N° 1.558/01, con sus modificatorias, en materia de protección de datos personales.

¿Cuál es el alcance de la LPDP? ¿Cuál es el objeto que protege? El Artículo 1 establece que tiene por objeto “la protección integral de los datos personales asentados en archivos, registros, bancos de datos, u otros medios técnicos de tratamiento de datos[9], sean éstos públicos, o privados destinados a dar informes, para garantizar el derecho al honor y a la intimidad de las personas, así como también el acceso a la información que sobre las mismas se registre, de conformidad a lo establecido en el Artículo 43, párrafo tercero de la Constitución Nacional”, aclarando que también se aplicará a los datos relativos a personas de existencia ideal y que en ningún caso se podrá afectar la base de datos ni las fuentes de información periodísticas.

¿Qué se entiende por “dato”? El Artículo 2 realiza un enunciado respecto a las definiciones de conceptos claves en la materia. Para ello, define a los datos personales como aquella “información de cualquier tipo referida a personas físicas o de existencia ideal determinadas o determinables”, mientras que los datos sensibles son aquellos “datos personales que revelan origen racial y étnico, opiniones políticas, convicciones religiosas, filosóficas o morales, afiliación sindical e información referente a la salud o a la vida sexual”. Por otro lado, define al titular de los datos como “toda persona física o persona de existencia ideal con domicilio legal o delegaciones o sucursales en el país, cuyos datos sean objeto del tratamiento al que se refiere la ley”, mientras que el usuario de datos es “toda persona, pública o privada que realice a su arbitrio el tratamiento de datos, ya sea en archivos, registros o bancos de datos propios o a través de conexión con los mismos”.

¿Cuáles son los principios que rigen en esta protección? Es aquí donde me voy a detener un instante para analizar la influencia directa de la Big Data por sobre algunos de los principios de protección de datos personales.

En primer lugar, nos encontramos con el principio de consentimiento, que establece que “el tratamiento de datos personales es ilícito cuando el titular no hubiere prestado su consentimiento libre, expreso e informado, el que deberá constar por escrito, o por otro medio que permita se le equipare, de acuerdo a las circunstancias”[10].

Seguidamente, enuncia que “el referido consentimiento prestado con otras declaraciones, deberá figurar en forma expresa y destacada, previa notificación al requerido de datos, de la información descrita en el artículo 6° de la presente ley”.

Por lo que, de la lectura e interpretación de dicho Artículo surge que, con anterioridad a realizar el tratamiento de datos, se debe informar al titular, de forma expresa y clara, ciertas particularidades concerniente a sus datos y a su tratamiento.

De allí surge el principio de información regulado en el Artículo 6, que refiere al deber de comunicar cuestiones tales como la finalidad que se le darán a aquellos datos, las consecuencias por proporcionar datos o por negarse a hacerlo. Si ocurriera que aquella información no fuera debidamente comunicada, el presunto consentimiento dado resultaría viciado y devendría inválido.

Actualmente, aquellos que trabajan con la Big Data se encuentran en serias complicaciones para cumplir tanto con el principio de consentimiento, como con el de información. Principalmente, porque la masividad de datos que manejan suele ser el resultado de una larga recopilación de datos que, incluso, pudieron haber surgido como resultado de un tratamiento de datos liderado por otro grupo de trabajo. Más aún, ambos principios se encuentran ampliamente comprometidos con el surgimiento de las redes sociales. Constantemente nos encontramos conectados a un sinfín de aplicaciones. Sin embargo, la vorágine del día a día y nuestra fascinación por vivir en un mundo cada día más “moderno” y conectado, no nos deja ver la cantidad de datos personales que entregamos a empresas que están a la expectativa de aquellos, sin tomar dimensión de su valor.[11]

Para las empresas que trabajan con la Big Data, los datos son el principal recurso de los que se nutren. En palabras de Luciano Galup, “los datos permiten reconstruir la personalidad de cada usuario conectado a Internet, de forma mucho más íntima y compleja de lo que esas personas imaginan y con muchísimo más nivel de detalle del que podía proyectarse apenas unos años atrás. Esta reconstrucción no sólo se nutre de lo que ese usuario está dispuesto a mostrar, abiertamente, públicamente, a sus followers o contactos, sino de todo aquello que cree estar reservado a su ámbito privado”[12].

Seguramente varios podrían decir que, antes de obtener nuestros datos, varias empresas solicitan nuestro consentimiento mediante los famosos pop-up que aparecen como una especie de “bienvenida” al ingresar a algún sitio. Lo cierto es que pocos son los que se detienen a leer lo que implica “aceptar” o “rechazar”, y la mayoría decide “aceptar” para poder visualizar el contenido de la página web. Es más, el Director del Centro de Protección de Datos Personales de la Ciudad de Buenos Aires, Eduardo Peduto, sostuvo en una nota a Infobae que “la letra chica de los contratos de adhesión a Google o a Facebook establece que, ante cualquier litigio, los tribunales competentes son los de California”[13] Por lo que debiéramos preguntar, ¿Qué estamos “aceptando” a costa de leer una noticia, de ver una imagen, de buscar un video, o leer un e-book? ¿Qué consentimiento estamos dando? ¿Y a quién?

Otro de los principios es el principio de calidad de datos. Conforme lo establecido en el Artículo 4, se exige que los datos personales que se recojan a los efectos de su tratamiento deben ser ciertos, adecuados, pertinentes, no excesivos (en relación al ámbito y finalidad para los que se hubieran obtenido), no utilizados para finalidades distintas o incompatibles con aquellas que motivaron su obtención, exactos, y actualizados. Asimismo, en caso de encontrarse incompletos, deben ser suprimidos, sustituidos o completados.

Una vez más, aquellos que utilizan la Big Data encuentran grandes dificultades para respetar dicho principio, en tanto la misma esencia de la Big Data, por cuanto su nombre indica, torna imposible garantizar la calidad de datos, conforme a las exigencias propiamiente dichas. Ello así por cuanto la Big Data maneja un alto grado de información, en relación a su volumen y variedad, en particular. Tal voluminosidad dificulta, ampliamente, la posibilidad de verificar que los datos sean cien por ciento (100%) ciertos, o no excesivos con el fin para el que fueron obtenidos. De igual modo, la actualización, supresión o sustitución de los datos que pudieran encontrarse incompletos requiere de un excesivo trabajo diario de certificación de los datos obtenidos, tarea que parece difícilmente viable para cualquier empresa.

La tarea de verificación de la calidad de los datos se dificultó aún más con el surgimiento de las redes sociales. Para la Big Data las redes sociales son su principal móvil, es decir, de donde mayormente se alimenta, y la razón de ello es fácilmente deducible. Las redes sociales supieron responder a la mayoría de las demandas del siglo XXI: conexión de las personas a lo largo del mundo, fácil intercambio de todo tipo de información, instantaneidad en las comunicaciones, y conocimiento extremo de las vidas de los otros[14].

No obstante, así como las redes sociales son atractivas y sumamente llamativas para aquellos que trabajan con la Big Data, también son uno de los campos donde se genera mayor cantidad de información errónea[15], dificultando, una vez más, cumplir con el principio de calidad de datos. Para poder definir cuál es el margen de error de cada dato que se recopila, las empresas deben filtrar la información hasta el punto de estar totalmente seguros de su veracidad y exactitud.

En virtud de lo expuesto, conforme al escenario planteado, en donde quienes manejan Big Data difícilmente se encuentren en condiciones de cumplir con los lineamientos que plantea la LPDP, es evidente la necesidad de modificar las condiciones existentes a los fines de que ambos institutos convivan de modo tal que la existencia de uno no dificulte la del otro, sino que la complemente.

En mi opinión, el motivo por el cual se presenta este choque entre Big Data y la protección de datos personales se funda en el origen mismo de la producción y difusión de datos. Es decir, la Big Data se nutre de información que, a su vez, es atemporánea, pudiendo tratarse de información reciente, como de información añeja. Pero la legislación que refiere a la protección de datos personales es relativamente contemporánea, que sin duda surgió como una suerte de intentar contener tanto derrame de información.

Por lo que la LPDP buscó otorgar un margen jurídico y establecer ciertos límites para la obtención y tratamiento de datos a partir de su sanción, pero ¿Qué ocurre con la información que se encuentra desde antes de la sanción de la LPDP? ¿Es posible controlarla? ¿O es tanta su masividad que nos excede?

3. Conclusión [arriba] 

Conforme a los argumentos vertidos, es evidente que existen términos que provienen del campo informático -como lo es el de Big Data- y que parecieran resultarnos ajenos, pero que, analizándolos, advertimos que nos encontramos inevitable y necesariamente relacionados.

En primer lugar, corresponde mencionar que la producción, la recopilación, el almacenamiento y el tratamiento de datos se llevan a cabo desde tiempos sumamente remotos a nuestro presente. Sin embargo, la evolución de los conceptos, el creciente interés sobre sus alcances y el surgimiento de las nuevas tecnologías, ha llevado a que los especialistas le otorgaran un único nombre relativamente moderno: Big Data.

Por lo que, creer que la producción, la recopilación, el almacenamiento y el tratamiento de datos son tareas que surgieron como tales durante las últimas décadas, que fueron agrupadas en lo que hoy conocemos como Big Data, es no ser consciente del veradero origen de nuestros datos y, mucho menos, de su alcance y propagación a través del tiempo.

La producción, la recopilación, el almacenamiento y el tratamiento de datos se efectúan desde nuestros orígenes, pues la simple y acotada memoria del hombre nunca resultó compatible con la idea de ‘resguardar y propagar’ los conocimientos de la humanidad, de generación en generación, por lo que la necesidad de producir, recopilar, almacenar y tratar la información habrá sido una de las primeras en la historia del ser humano. Tal es así que, sin el debido almacenamiento de la información, hubiera sido prácticamente imposible la evolución humana.

La producción, la recopilación y el almacenamiento de datos fueron mutuamente necesarios, a tal punto que no hubieran funcionado de forma separada: de nada hubiera servido tener información si la misma no hubiera podido ser reproducida en el tiempo, y la única forma de que ello fuera posible era a través de su almacenamiento.

Entonces, podriamos preguntarnos, ¿en qué momento la producción, la recopilación, el almacenamiento y el tratamiento de datos dejaron de ser acciones estrictamente necesarias e irrestrictas, incluso para permitir la evolución misma de la humanidad, para ser ampliamente limitadas?

¿En qué momento los datos dejaron de ser amplia y necesariamente compartidos, para ser restrictivamente protegidos? Esta limitación de acceso a los datos de las personas, ¿podría afectar a la evolución humana?

Cierto es que “cuando los datos de la humanidad dejaron de ser recogidos por personas y empezaron a ser resgistrados en forma automática, a través de máquinas, los volúmenes de información empezaron a masificarse” pero, ¿puede ser que la súbita creciente masa de información haya despertado la desesperación del hombre por querer contenerla? O ¿la desesperación, más que por contenerla, es por conocerla? ¿Por qué aquel interés? ¿Qué es lo que tanto se quiere saber de las personas?

Por tanto, frente a la presente situación, es justamente el ordenamiento jurídico el que debe brindar herramientas a todas las partes involucradas: a quienes trabajan, quienes generan y quienes protegen los datos de las personas. En este sentido, adquiere vital importancia la existencia de un marco jurídico que establezca los lineamientos para la protección de datos personales, en concordancia con las características particulares de la Big Data. Con ello me refiero a la posibilidad de que ambos institutos coexistan de modo tal que se garantice la protección de datos pero que, a su vez, aquella protección no resulte extremadamente limitativa para aquellos que trabajan y manejan la Big Data.

En una época donde los avances informáticos y tecnológicos siguen liderando nuestra existencia, la regulación de los alcances de la Big Data y su ineludible relación con el régimen jurídico de protección de datos personales, se convierten en una de las principales cuestiones a las que debemos estar atentos, por cuanto toda evolución que se realice en la materia servirá para asentar las bases para los próximos desarrollos en el campo digital.

 

 

Notas [arriba] 

[1] Abogada con orientación en Derecho Público Administrativo de la Facultad de Derecho de la Universidad de Buenos Aires.
[2] GALUP, Luciano. Big Data & Política: de los relatos a los datos. Persuadir en la era de las redes sociales. Penguin Random House Grupo Editorial S.A. Tercera edición. 2019.
[3] GALUP, Luciano. Big Data & Política: de los relatos a los datos. Persuadir en la era de las redes sociales. Penguin Random House Grupo Editorial S.A. Tercera edición. 2019.
[4] Modelo de datos basado en la lógica de predicados y en la teoría de conjuntos. La lógica de predicados es un sistema formal diseñado para estudiar la inferencia en los lenguajes de primer orden, mientras que la teoría de conjuntos es una rama de la lógica matemática que estudia propiedades y relaciones de los conjuntos.
[5] Conjunto de estrategias, aplicaciones, datos, productos, tecnologías y arquitectura técnicas, enfocados a la administración y creación de conocimiento sobre el medio, a través del análisis de los datos existentes en una organización o empresa.
[6] Luciano Galupha dicho que “el mundo digital es una usina inagotable de información. Generamos aproximadamente 2,5 cuatrillones de bytes diarios. 500 terabytes de información se suben por día a Facebook, el equivalente a 20.000 discos blu-ray. Instagram absorbe 80 millones de fotos y en YouTube se reproducen 1.000 millones de horas de video cada 24 horas. Se envían 204 millones de emails, se visualizan 10 millones de anuncios y se ejecutan 4 millones de búsquedas en Google por minuto. Por Internet circulan 50.000 gigabytes de datos por segundo. El 90% de los datos registrados a lo largo de toda la historia de la humanidad fueron generados en apenas los últimos dos años. Para 2025, se habrán multiplicado 14 veces los datos que se produjeron hasta 2015.”
[7] GALUP, Luciano. Big Data & Política: de los relatos a los datos. Persuadir en la era de las redes sociales. Penguin Random House Grupo Editorial S.A. Tercera edición. 2019.
[8] “El Big Data está entre nosotros” Diario Judicial. 8/6/17.
[9] Es importante señalar que no necesariamente los datos deben estar contemplados en una ‘base de datos’ sino que alcanza con que exista un ‘tratamiento de datos’.
[10] Inciso 1) del Artículo 5 de la LPDP.
[11] Tal es así que, en “Platform Capitalism”, Nick Srnicek, escritor y académico canadiense, define a los datos como el insumo del siglo XXI: “In thetwenty-first century advanced capitalism came to be centreduponextracting and using a particular kind of raw material: data”.
[12] GALUP, Luciano. Big Data & Política: de los relatos a los datos. Persuadir en la era de las redes sociales. Penguin Random House Grupo Editorial S.A. Tercera edición. 2019.
[13] Big Data y privacidad: las limitaciones de la ley argentina. Nota por Mariano Roca. Infobae. Septiembre 2018.
[14] Según estudios realizados durante el 2018, existen 7 de cada 10 habitantes del Área Metropolitana de Buenos Aires (AMBA) utilizan las redes sociales todos los días. Este porcentaje trepa al 80% en menores de 35 años.
[15] José Antonio Castillo Romero ha dicho que “cada minuto, los más de 2.700 millones de personas que cuentan con acceso a Internet, envían más de 200 millones de correos electrónicos; realizan 2 millones de búsquedas en Google; publican 48 horas de video en YouTube; escriben más de 100.000 mensajes en Twitter; publican 30.000 nuevos artículos en sitios como WordPress y suben más de 6.000 imágenes a Instagram”. Ingresando a www.worldmeters.info/es/ se pueden visualizar la gran cantidad de datos que se generan constantemente, en tiempo real.



© Copyright: DPI Cuántico