Saltearse al contenido

Data Text Formatter

El Data Text Formatter (Formateador de Texto de Datos) es un componente esencial en el sistema Nappai para asegurar que la información textual que manejas esté limpia y en el formato correcto antes de ser utilizada. Piensa en él como un “asistente de edición” que se encarga de tareas repetitivas y tediosas, como quitar acentos, convertir todo a mayúsculas o eliminar espacios innecesarios.

Es especialmente útil cuando preparas datos para que un Modelo de Lenguaje (IA) los entienda mejor o para normalizar registros antes de guardarlos en una base de datos.

¿Cómo funciona?

Este componente actúa como un filtro inteligente. Cuando le proporcionas un texto o un conjunto de datos, el componente recorre toda la información y aplica las reglas que tú hayas configurado.

No solo se limita a modificar el texto principal, sino que es “inteligente” con la estructura: si tienes información organizada en listas o categorías (como un perfil de usuario con nombre, dirección y ciudad), el componente puede buscar específicamente en esos campos y aplicar las correcciones solo donde tú le indiques, o en todos por igual.

El proceso interno sigue estos pasos lógicos:

  1. Lectura: Recibe tus datos de entrada.
  2. Limpieza: Aplica reglas para quitar acentos o espacios sobrantes.
  3. Estilo: Cambia el texto a mayúsculas, minúsculas o formato título.
  4. Reemplazo: Sustituye caracteres específicos (por ejemplo, cambiar espacios por guiones).
  5. Entrega: Devuelve los datos ya transformados listos para el siguiente paso.

Conexión y Credenciales

Este componente no requiere la conexión de credenciales externas ni claves de API. Funciona completamente con los datos que tú le proporcionas directamente dentro del flujo de trabajo de Nappai.

Operaciones

Este componente no requiere seleccionar una “operación” específica (como enviar un email o consultar una base de datos). En su lugar, su funcionamiento se define configurando las distintas opciones de transformación que verás en las Entradas. No obstante, las siguientes opciones actúan como funciones principales del componente:

  • Case Conversion: Define si el texto debe convertirse a minúsculas, mayúsculas o la primera letra de cada palabra en mayúscula.
  • Remove Accents: Activa la eliminación automática de signos diacríticos (como acentos o eñes) para facilitar la búsqueda.
  • Trim Whitespace: Se encarga de limpiar los espacios vacíos al inicio y al final del texto.
  • Replace Characters: Permite definir reglas personalizadas para buscar y cambiar ciertos caracteres por otros.

Para usar el componente, simplemente configura estas opciones según lo que necesites lograr con tu texto.

Entradas

Campos de Entrada

Los siguientes campos están disponibles para configurar este componente.

  • Data: Aquí debes conectar el objeto o mensaje que deseas transformar. Puede ser texto simple, listas de textos o estructuras de datos más complejas.
  • Target Keys: Permite especificar a qué campos del texto deseas aplicar los cambios. Si dejas este campo vacío, se aplicarán las reglas a todo el texto disponible. Si escribes nombres específicos separados por comas, solo se modificarán esos campos.
  • Case Conversion: Menú desplegable para elegir cómo quieres que se vea el texto:
    • None: Sin cambios de estilo.
    • lowercase: Todo en minúsculas (ej: hola).
    • UPPERCASE: Todo en mayúsculas (ej: HOLA).
    • Capitalize: Primera letra en mayúscula (ej: Hola).
  • Remove Accents: Al activar esta casilla, el componente convertirá caracteres como é, ñ o ü en sus versiones básicas (e, n, u). Útil para evitar errores de coincidencia en búsquedas.
  • Trim Whitespace: Al activar esta opción, el componente eliminará los espacios vacíos innecesarios al principio y al final del texto, dejándolo “limpio”.
  • Replace Spaces: Al activar esta casilla, permitirás cambiar los espacios normales por otro carácter (como un guion - o un guion bajo _). Esto es muy útil para crear URLs o nombres de archivo válidos.
  • Replace Spaces With: El carácter que se usará para reemplazar los espacios (solo aparece si activaste la opción anterior).
  • Replace Characters: Al activar esta casilla, podrás definir reglas personalizadas de búsqueda y reemplazo.
  • Number of Replacements: Indica cuántas reglas de reemplazo personalizado deseas usar (de 1 a 5).
  • Find: El texto o carácter que deseas buscar. Puedes definir varios campos de “Find” si usas más de una regla de reemplazo.
  • Replace with: El texto nuevo que reemplazará al encontrado. Si dejas este campo vacío, el componente eliminará el texto encontrado.

Salidas

  • Formatted Data: El resultado final es una lista de los objetos de datos transformados. Estos datos salen del componente listos para ser enviados a otros nodos, como modelos de IA, bases de datos o visualizaciones.

Ejemplo de Respuesta JSON

Si tienes un objeto de datos que representa a un usuario y aplicas la transformación, así se vería la salida: json [ { “id”: “123”, “name”: “juan_perez”, “email”: “JUAN@EJEMPLO.COM”, “description”: “Usuario_de_prueba” } ] En este ejemplo, el nombre se limpió de acentos y espacios, y el email se convirtió a mayúsculas.

Conectividad

Este componente es versátil y suele conectarse de la siguiente manera:

  • Entrada (Data): Se conecta comúnmente a la salida de componentes que obtienen texto, como Extractors (que extraen texto de PDFs o emails), Readers de bases de datos, o directamente a nodos de LLM (Modelos de Lenguaje) que necesitan datos pre-limpios.
  • Salida (Formatted Data): Se conecta típicamente a componentes de Storage (para guardar datos limpios), a otros procesadores de texto (para una limpieza más profunda), o directamente al asistente de IA de Nappai para asegurar que el contexto que le envías sea correcto.

Ejemplo de Uso

Imagina que estás automatizando la carga de contactos desde un formulario web desordenado.

  1. Obtienes un texto como: " María García " (con espacios extra y mayúsculas mezcladas).
  2. Conectas este texto a la entrada Data del componente.
  3. Activas Trim Whitespace para quitar los espacios laterales.
  4. Activas Remove Accents si necesitas que los nombres se puedan buscar sin importar si llevan tilde o no.
  5. El componente devuelve "maría garcía" (o "maria garcia" si no usas el modo capitalizado).
  6. Puedes luego enviar este dato limpio a tu base de datos para evitar duplicados o errores de escritura.

Consejos y Mejores Prácticas

  • Usa “Target Keys” para precisión: Si solo quieres cambiar el nombre de un usuario pero no su ID, usa el campo Target Keys para especificar "name". Si lo dejas vacío, todo el texto se convertirá a minúsculas o se le quitarán los acentos.
  • El orden importa: El componente aplica las reglas en secuencia lógica (primero quita espacios, luego acentos, luego cambia el caso). Ten esto en cuenta si necesitas un resultado muy específico.
  • No te preocupes por la recursividad: Si tus datos están anidados (por ejemplo, un perfil que contiene una dirección), el componente buscará automáticamente las cadenas de texto dentro de esas estructuras para aplicar las correcciones.

Consideraciones de Seguridad

  • Datos Sensibles: Al aplicar transformaciones como “Remove Accents” o “Replace Characters”, asegúrate de que el resultado sigue siendo válido para tu propósito. Por ejemplo, quitar acentos en un nombre propio puede hacer que sea difícil de identificar visualmente para un humano, aunque sea correcto para una base de datos.
  • Límites de Datos: Si procesas listas muy grandes de datos a la vez, el componente podría tardar ligeramente más en responder. Para flujos críticos en tiempo real, considera procesar datos en lotes menores si es posible.