La finalidad del proceso de anonimización es evitar la
identificación de las personas y reducir su probabilidad de
reidentificación sin afectar la veracidad de los resultados y
utilidad de los datos que han sido tratados
Este procedimiento es especialmente relavante en los
entornos que surgen con la evolución tecnológica y
fenómeno como Big Data u Open Data, los cuales
aumentan la probabilidad de reidentificación de las
personas
La guía busca garantizar la protección de
cualquier información producida,
gestionada o recolectada que contenga
datos personales bajo las siguientes
premisas:
1. Protección de
derechos
2. Transparencia y datos
abiertos
3. Acceso e
interoperabilidad
4. Eficiencia
Administrativa
5. Reportes de
información
Objetivo de la
guía
1. Precisar conceptos y proporcionar
una orientación metodológica a las
entidades públicas y privadas con
funciones públicas
2. Contribuir a que las entidades públicas
o privadas den cumplimiento a la
normatividad existente en materia de
protección de datos personales
3. Proporcionar orientación sobre las técnicas
de anonimización y su uso adecuado según los
conjuntos de datos que requieran ser
anonimizados
Alcance de la
guía
La orientación
metodológica y técnicas de
anonimización de datos
personales que se
presentan, estan
orientados para datos
estructurados. No para
archivos multimedia
Público
Objetivo
Dirigida a entidades que
gestionen, almacenen,
administren, obtengan,
produzcan, procesen,
custodien y publiquen
información dando
cumplimiento a la
normatividad
Anonimización de Datos
Personales
¿Qué son los datos
personales?
Se define como cualquier
información que pueda
asociarse a una o varias
personas naturales
determinadas o determinables
¿Qué es anonimizar
datos?
Es el proceso mediante el cual se condiciona
un conjunto de datos de modo que no se
pueda identificar a una persona, pero pueda
ser utilizad para realizar análisis técnico y
científico válido sobre ese conjunto de datos.
El proceso requiere una adecuada
comprensión del próposito final de la
utilización de la información, así como de su
nivel de utilidad; una vez realizado el
proceso de anonimización se reduce la
información original del conjunto de datos
¿Cúando se considera que los datos son
anonimizados?
Los datos se encuentran anonimizados
cuando los sujetos dueño de los datos ya
no pueden ser identificables; estos se
pueden usar, reutilizar y divulgar sin
violar el derecho a la protección de datos
de los titulares de la información
¿Por qué se debe
anonimizar?
Para impedir que, a partir de un dato o de una combinación de
datos de una misma fuente, se logre identificar sujetos
individuales
Para proteger los derechos de los titulares de los datos e información y
reducir o eliminar el riesgo de reidentificación
Para evitar la identificación directa e indirecta
Para facilitar la divulgación, publicación e intercambio de datos, sin
vulnerar los derechos a la protección de datos
Para publicar de manera segura datos abiertos protegiendo
la privacidad de las personas
Para cuando se intercambia información con otra entidades y este
intercambio requiere la inclusión de datos personales
La protección de datos personales en el entorno de la transformación digital
El conjunto de tecnologías que permite tratar grandes volúmenes de datos, generados a grandes
velocidades y por múltiples fuentes de información que permiten transformar los datos en
información y de esta forma aportar soluciones y oportunidades a asuntos de carácter privado y/o
política pública
¿Cúales son los principios de la
anonimización?
De acuerdo con el decreto 1074/15, los responsables
de la recolección de datos personales deberán
proveer una descripción de los procedimientos
usados para la recolección, almacenamiento, uso,
circulación y supresión de la información, y describir
la finalidad para la cual se recolectó la información.
Principio de privacidad por diseño
Las medidas de seguridad para la implementación
de este principio debe considerar los siguientes
factores:
1. Los niveles del riesgo del tratamiento para los derechos de
los titulares de los datos
2. La naturaleza de los datos
3. Las consecuencias que se originen de una vulneración para los titulares de los
datos, evaluando los daños y perjuicios causados
4. El número de titulares de los datos
5. El tamaño de la
organización
6. La fiabilidad de la técnica aplicada al tratamiento de datos (SIC.
2019)
Principio de privacidad por
defecto
Por defecto, las entidades deben garantizar que los datos personales se
traten con la mayor protección a la intimidad, y deben procesar
únicamente los datos personales necesarios para el propósito específico
del tratamiento
Este principio
abarca:
1. La cantidad de datos
recogidos
2. La extensión de su
tratamiento
3. El plazo de su conservación, y
4. La
accesibilidad
Marco
Júridico
La anonimización de datos es un proceso que
permite mitigar los riesgos asociados al tratamiento
de datos personales, lo cual reduce la probabilidad
de vulnerar los derechos a la protección de datos de
las personas
Regulación Internacional en Materia de
Protección de Datos e Información
La protección de datos en la Unión Europea está conformado por
amplias garantías respaldadas por la constitución como derechos
fundamentales integrales, y sus principios se aplican
independientemente del contexto.
Marco Regulatorio en
Colombia
En la C.P. de 1991/ Art. 15. Establece el derecho que
tienen todas las personas a conservar su intimidad,
mantener su buen nombre y a la protección y garantía
del Habeas Data
En relación con la protección de datos personales, el régimen
normativo colombiano dispone de la Ley 1266/2008 y la Ley
1581/2012
La Ley 1266/2008 definio la tipología de los datos de carácter
personal (SIC.2014)
Dato Íntimo o
Privado
Es el dato que por su
naturaleza íntima o reservada
solo es relevante para el
titular
Dato Semiprivado
Es semiprivado el dato que, no tiene naturaleza
ínitma, reservada, ni pública y cuyo conocimiento o
divulgación puede interesar no s´lo a su titular. Ej.
Historial créditicio
Dato Público
Son públicos los datos que están relacionados con
un interés general, en documentos públicos,
sentencias judiciales que no están sometidos a
reserva
Adicional, la Ley 1581/2012 establece los principios rectores que
rigen el tratamiento de datos personales bajo custodia
Se establecen las siguientes categorías de datos personales
Datos sensibles
Aquellos que afectan la
intimidad del titular o cuyo uso
indebido puede generar su
discriminación
Datos personales de los niños, niñas y
adolescentes
Se prohibe el tratamiento de los datos personales de
los niños, niñas y adolescentes, salvo aquellos que
por su naturaleza son públicos, se asegure sin
excepción alguna, el respeto a sus derechos
prevalentes
Principios relativos al tratamiento de datos
A partir de la Ley 1266/2008 y la Ley 1581/2012 se
estipularon los siguientes principios aplicados a la
administración y tratamiento de datos:
► Principio de legalidad
► Principio de veracidad o calidad de los registros o datos
► Principio de transparencia
► Principio de finalidad
► Principio de libertad
► Principio de acceso y circulación restringida
► Principio de temporalidad de la información
► Principio de interpretación de derechos constitucionales
Principio de seguridad
► Principio de confidencialidad
Procedimientos y Requisitos para Autorizar el
Tratamiento de Datos Personales
De acuerdo al Decreto 1377/2013 señala que los responsables del
tratamiento de datos personales deben establecer mecanismos para obtener
la autorización de los titulares o de quien se encuentre legitimado,
garantizado su consulta por parte del titular
Los legitimados para obtener datos personales son:
1. EL titular, quien deberá
acreditar su identidad en
forma suficiente por los
distintos medios que le
ponga a disposición el
responsable
2. Causahabientes del
titular, quienes deberán
acreditar tal calidad
3. Representante y/o apoderado
del titular previa acreditación de la
representación o apoderamiento
Marco Normativo en Colombia para la
protección de Datos Personales
▬ Constitución Política de
Colombia 1991, Artículo 15
▬ Ley
1266/2008
▬ Ley 1273/2009
▬ Decreto
1727/2009
▬ Decreto
2952/2010
▬ Ley 1581/2012
▬ Decreto
1377/2013
▬ Decreto
1074/2015
3. Metodología: ¿Qué pasos se deben seguir para anonimizar datos?
Se recomienda que le entidad conforme un equipo de trabajo, el cual podría depender del área de seguridad
informática, del grupo de la dirección o coordinación de tecnologías de la información. También es importante que
se vincule el área de gestión documental
Lo ideal es que exista un equipo conformado por:
▲ Responsable del tratamiento de datos
▲ Persona encargada de la protección
de datos personales
▲ Líder o coordinador del proceso
de anonimización
▲ Profesional o equipo de evaluación de
riesgos
▲ Profesional o experto temático
▲ Profesional de seguridad informática y
evaluación de riesgo
▲ Profesional o equipo de informática
▲ Equipo de pre-anonimización y anonimización
▲ Profesional de pruebas
Objetivos que se Quieren Alcanzar con los Datos Anonimizados
El diseño del proceso de anonimización de datos debe estar dado por la
finalidad que quiere alcanzar la entidad con el uso de la información
anonimizada
Identifique qué tipo de datos se requiere anonimizar
Se recomienda identificar si los datos son
estructurados o por el contrario, se trata de datos no
estructurados
Se define la clasificación de los datos:
Características de los datos estructurados:
Están organizados conforme a un modelo o
esquema
Tipicamente están representados en bases de
datos que hacen parte del funcionamiento de
sistemas de información o están organizados
en hojas de cálculo
Características de los datos no
estructurados: Su organización y
presentación no está guiada por ningún
modelo o esquema
Se incluye: Imágenes, texto, audios,
contenido de redes sociales, videos,
documentos en word o pdf
Características de los datos semiestructurados:
Su organización y presentación tiene una
estructura básica (etiquetas o marcadores), pero
no tiene establecido una definición de
relaciones en su contenido. Ej: E-mails, tweets,
archivos XML
Identifique y Clasifique los Atributos
En este paso se clasifican los atributos del conjunto de datos como
identificadores directos, indirectos o no identificadores
Existen tres condiciones para que una variable se considere un identificador
I REPLICABILIDAD: Los
valores del campo
deben tener cierta
consistencia a lo largo
del tiempo para que se
pueda hacer una
análisis en relación con
el sujeto.
II. DISTINGUIBILIDAD:
Los valores del campo
deben tener suficiente
variación para distinguir
al sujeto de otros
valores, dentro de un
conjunto de datos
III. CONOCIBLE: Para
poder reidentificar a
un sujeto, es
necesario que se
conozca
previamente
algunos de los
identificadores y
variables asociadas a
este.
Si los atributos son identificadores, estos
pueden ser directos o indirectos
Identificadores Directos: Son
todas aquellas características o
atributos distintivos que por sí
mismos permiten la
identificación de una persona
natural o jurídica
Identificadores indirectos o
cuasi-identificadores: Son
aquellos características o
atributos que por sí solos no
permitan la identificación de una
persona natural o jurídica, pero
que relacionados con otros
identificadores indirectos
podrían permitir la identificación
dentro de un conjunto de datos
Evalúe el riesgo de reidentificación
El riesgo de reidentificación esta implícito y
aumenta a medida que transcurre el tiempo desde
la anonimización de los datos, como consecuencia
de los identificadores indirectos a los largo del
tiempo
A continuación, se enumeran los principales
aspectos que los responsables de la
anonimización y del tratamiento del riesgo
deben tener en cuenta a la hora de considerar
aplicar alguna técnica
Inferencia: Consiste en deducir un vínculo entre dos elementos de información en un
conjunto de datos, aunque la información no este explícitamente vinculada.
Vinculabilidad: Este riesgo ocurre cuando se pueden vincular como mínimo dos datos de una
única persona o de un grupo de interesados, ya sea en la misma BdD o en dos BdD distintas
Singularización: Ocurre cuando es posible distinguir, extraer o particularizar los datos
relacionados que identifican a una persona dentro de una conjunto de datos
Determina las técnicas de anonimización
Se recomienda que la determinación de las técnicas de anonimización sea realizada por el
equipo de trabajo, así como la realización de pruebas que permitan verificar su efectividad
Existen tres enfoque diferentes de técnicas de anonimización:
Aleatorización: Consiste en una agupación de técnicas que alteran o
modifican la autenticidad y la veracidad de los datos para eliminar el
vínculo entre ellos
Modalidades de aleatorización
Adición al ruido: No permite que se
pueda identificar a un individuo,
tampoco reparar los datos o detectar
cómo se han modificado
Permutación: Se caracteriza por el
intercambio de los valores incluidos en un
conjunto de datos a partir del traslado de
datos de un registro a otro
Generalización: Tiene como propósito modificar datos a través
de escalas u órdenes para generar esquemas de datos de
acuerdo con características comunes.
Los métodos utilizados para la generalización son:
Agregación y anonimato: Consiste en generar
rangos que puedan agrupar caraterísticas en
macro características o intervalos
Diversidad y Proximidad: Es similar a la metodología de
Agregación, sin embargo, en esta caso los rangos se deben
establecer de tal forma que los datos de los individuos puedan
ser agrupados y ninguno pertenezca a una categoría individual.
Seudonimización: Es el proceso mediante el cual se
sustituye un dato o atributo por otro, normalmente la
información que se intercambia son atributos únicos,
que, por sus características, permiten reidentificar a
los individuos
Evalúe la utilidad de los Datos
Para evaluar la relación entre la utilidad de los datos y el
nivel de protección de datos personales se identifican dos
procedimientos:
1. Aproximación denominada "Utility First", que consiste en
anonimizar los datos manteniendo la utilidad de los datos y
posteriormente analizar el riesgo de reidentificación
2. Denominado "Privacity First", que consiste en identificar el
nivel de privacidad que se desea alcanzar, sin atribuir mayor
relevancia al nivel de utilidad de los datos
Documente el proceso de anonimización
La descripción, características y detalles del
proceso de anonimización se deben
plasmar en un documento que permita
facilitar su revisión, mantenimiento,
auditabilidad y replicabilidad
Publique o Comparta la información
Una vez estructurado y aprobado el documento,
divulgar y socializar el documento final con los
interesados, tanto los participantes el proceso
de elaboración como quienes deben ser
responsables de su implementación y
seguimiento
4. Gobernanza de Datos
El proceso de anonimización debe estar incluido en un marco de
gobernanza de datos propio de la entidad que permita hacer un
seguimiento continuo al conjunto de datos publicados y
anonimizados
Este marco de gobernanza debe incluir los protocolos y
documentación de la metodología de acceso al conjunto de los datos
La identificación de responsables del conjunto de datos
La gestión de claves para garantizar que los datos se mantengan
seguros
La revisión periódica de los riesgos de
anonimización
La documentación y realización de auditorias a los
destinatarios de los datos
La gestión y protocolo en caso de violación de datos
personales
Realización de seguimiento a los requisitos de cumplimiento
de protección de datos personales