Data Deanonymizer
El Data Deanonymizer es una herramienta sencilla que permite a los usuarios quitar información personal de los datos que manejan en Nappai. Solo necesitas conectar los datos que quieres limpiar y el mapa de sustitución, y el componente devuelve los mismos datos sin la información sensible.
¿Cómo funciona?
El componente toma los datos que le envías (pueden ser un solo registro o una lista de registros) y los procesa localmente usando la función doc_deanonymize
.
- Identifica la clave que contiene el texto a limpiar (
data_input_key
, por defecto"text"
). - Busca en el mapa (
deanonymize_mapping_key
, por defecto"anonymizer_mapping"
) los valores que deben reemplazarse. - Reemplaza cada ocurrencia de la información personal por su equivalente anonimizado.
- Devuelve la lista de registros modificados.
No se llama a ninguna API externa; todo el trabajo se hace dentro del entorno de Nappai, lo que garantiza rapidez y confidencialidad.
Entradas
- Deanonymize Mapping: Mapa que indica qué valores deben ser reemplazados por otros.
- Data: Los datos que quieres procesar.
- Source data input key to deanonymize: Nombre de la clave dentro de cada registro que contiene el texto a limpiar (por defecto
"text"
). - Deanonymize Mapping Key: Nombre de la clave dentro del mapa que contiene la información de sustitución (por defecto
"anonymizer_mapping"
).
Salidas
- Data: La lista de registros con la información personal eliminada o reemplazada según el mapa. Puedes usar esta salida para continuar con otros procesos, guardarla en una base de datos o visualizarla en tu dashboard.
Ejemplo de Uso
- Conecta el componente a la salida de un componente que extrae datos de tu base de datos.
- Configura el mapa de sustitución (puedes crear un objeto JSON con pares clave‑valor, por ejemplo,
"nombre": "Cliente X"
). - Establece la clave de entrada si tus registros usan un nombre distinto al predeterminado (
"text"
). - Ejecuta el flujo y observa cómo la salida muestra los mismos registros pero sin la información sensible. text Entrada: [ {“id”: 1, “text”: “Juan Pérez, 12345678”}, {“id”: 2, “text”: “María López, 87654321”} ] Mapa: {“Juan Pérez”: “Cliente X”, “María López”: “Cliente Y”} Salida: [ {“id”: 1, “text”: “Cliente X, 12345678”}, {“id”: 2, “text”: “Cliente Y, 87654321”} ]
Componentes Relacionados
- Data Anonymizer – Si necesitas ocultar datos en lugar de reemplazarlos.
- Data Processor – Para aplicar transformaciones adicionales después de la deanonymización.
- Data Exporter – Para guardar los resultados en archivos CSV, Excel o bases de datos.
Consejos y Mejores Prácticas
- Verifica el mapa antes de ejecutar el flujo; un error en las claves puede dejar datos sin procesar.
- Prueba con un subconjunto de datos primero para asegurarte de que la salida es la esperada.
- Combina con filtros para procesar solo los registros que realmente contienen información sensible.
- Mantén el mapa actualizado cuando cambien los nombres o formatos de los datos en tu fuente.
Consideraciones de Seguridad
- El componente trabaja localmente, por lo que no envía datos a servicios externos.
- Asegúrate de que el mapa de sustitución no contenga información sensible que pueda ser revelada accidentalmente.
- Si los datos incluyen identificadores únicos, considera usar un algoritmo de hashing en lugar de un simple reemplazo para mayor anonimato.