Text Extractor

El Text Extractor es un nodo inteligente diseñado para leer y convertir información cruda en texto limpio y estructurado. Su principal función es actuar como un puente seguro que prepara los datos para que puedan ser leídos, analizados o transformados por las siguientes etapas de tu flujo de trabajo.

¿Cómo funciona?

Este componente funciona como un organizador automático. En lugar de procesar la información manualmente, se conecta directamente al motor principal de Nappai que se encarga de leer documentos, archivos o registros. Cuando lo colocas en tu grafo, el sistema utiliza sus reglas predefinidas para identificar el tipo de dato y extraer el texto correcto. No requiere que escribas código ni configures parámetros complejos; simplemente recibe los datos, los prepara y los entrega listos para el siguiente paso.

Entradas

Los siguientes campos están disponibles para configurar este componente. Cada campo puede estar visible en diferentes operaciones:

Name: Identificador único del nodo dentro del flujo.
Display Name: Nombre amigable que verás en el panel gráfico.
Data Type: Formato esperado del dato de entrada (texto, archivo, registro o diccionario).
Description: Breve resumen que ayuda a identificar la intención del nodo.
Default Value/Config: Configuración por defecto que se aplica si no se especifica lo contrario.

Salidas

Una vez completado el proceso, el componente entrega el texto extraído junto con metadatos opcionales que describen el origen del dato. Esta salida puede conectarse directamente a analizadores de IA, traductores, exportadores o cualquier nodo que requiera texto plano como punto de partida.

Ejemplo de Respuesta JSONjson

{ “extracted_text”: “Aviso importante sobre la renovación de servicios. La fecha límite de pago es el 30 de noviembre.”, “metadata”: { “source”: “uploaded_document”, “status”: “success”, “language”: “es”, “char_count”: 85 } }

Conectividad

Este nodo suele conectarse de manera natural a componentes que requieren texto plano como entrada. Las conexiones más comunes incluyen:

Análisis de IA o Clasificadores: Para que los modelos de lenguaje interpreten el contenido extraído.
Transformadores de Texto: Para realizar correcciones, resumen o cambio de formato.
Exportadores o Bases de Datos: Para guardar el texto procesado en registros externos. Esta secuencia es lógica porque primero se extrae y limpia el dato (con este nodo) y luego se consume o transforma (con los nodos siguientes).

Ejemplo de Uso

Imagina que estás automatizando la lectura de facturas o correos electrónicos. Al arrastrar el Text Extractor después del nodo de “Carga de Archivos”, el sistema leerá automáticamente el documento adjunto y convertirá las imágenes o datos binarios en texto legible. A continuación, puedes conectar ese resultado a un nodo de “Asistente de IA” para que redacte un resumen o extraiga la fecha de vencimiento, completando así un flujo de trabajo sin intervención manual.

Consejos y Mejores Prácticas

Mantén los flujos lineales para este nodo: colócalo temprano en la cadena para asegurar que los siguientes nodos reciban datos limpios.
Utiliza nombres descriptivos en el “Display Name” para identificar fácilmente qué tipo de documento o fuente está siendo procesado en cada rama de tu grafo.
Confía en la configuración heredada del sistema: no es necesario modificar parámetros internos para obtener resultados estables.

Consideraciones de Seguridad

Asegúrate de que los archivos o fuentes de datos de entrada cumplan con las políticas de tu organización antes de la extracción.
El componente gestiona los datos de forma segura y temporaria dentro del flujo de Nappai; no almacena información sensible en el panel gráfico.
Para flujos que manejen información confidencial, verifica que las credenciales de los siguientes nodos tengan los permisos adecuados de acceso y encriptación.