Chunking Component
El Chunking Component es una herramienta que divide textos largos en partes más pequeñas, llamadas chunks. Esto facilita que los modelos de IA trabajen con información más manejable y mejore la eficiencia de los procesos de automatización en Nappai.
¿Cómo funciona?
Internamente, el componente utiliza la lógica de Langgraph para dividir el texto de entrada en fragmentos de longitud configurable. No necesita conectarse a servicios externos; todo el procesamiento se realiza localmente dentro del entorno de Nappai. El usuario simplemente indica el tamaño deseado de cada fragmento y, opcionalmente, la cantidad de superposición entre fragmentos para mantener contexto entre ellos.
Entradas
Campos de Entrada
- No hay entradas configurables: Este componente no requiere parámetros adicionales. Se activa automáticamente cuando se añade al flujo de trabajo y procesa el texto que recibe de componentes anteriores.
Salidas
El componente devuelve una lista de chunks (fragmentos de texto). Cada fragmento puede ser utilizado por otros componentes, por ejemplo, para alimentar un modelo de lenguaje, almacenar en una base de datos o generar resúmenes.
Ejemplo de Uso
- Añade el componente “Chunking Component” a tu flujo de trabajo en el dashboard de Nappai.
- Conecta la salida de un componente que suministre el texto completo (por ejemplo, un lector de documentos).
- Configura el tamaño de fragmento (por ejemplo, 500 palabras) y la superposición (por ejemplo, 50 palabras) en la configuración del componente.
- Ejecuta el flujo. El componente generará una lista de fragmentos que podrás usar en pasos posteriores, como enviar cada fragmento a un modelo de IA para análisis o resumen.
Componentes Relacionados
- ChunkingComponent – Base sobre la que se construye el LanggraphChunkingAgent. Proporciona la funcionalidad básica de división de texto.
- LanggraphBaseAgent – Agente que gestiona la lógica de Langgraph, de la cual hereda el LanggraphChunkingAgent.
Consejos y Mejores Prácticas
- Elige un tamaño de fragmento adecuado: Fragmentos demasiado pequeños pueden perder contexto, mientras que fragmentos muy grandes pueden sobrecargar al modelo de IA.
- Usa superposición cuando necesites contexto entre fragmentos: Una superposición de 10–20% suele ser suficiente para mantener la coherencia.
- Revisa el texto antes de dividirlo: Elimina caracteres especiales o espacios innecesarios para evitar fragmentos vacíos o mal formados.
Consideraciones de Seguridad
- Datos sensibles: El componente procesa el texto localmente; no envía datos a servicios externos. Asegúrate de que el texto que introduces no contenga información confidencial que no deba ser compartida.
- Control de acceso: Limita el acceso al flujo de trabajo que contiene este componente a usuarios autorizados para evitar exponer datos sensibles.