Saltearse al contenido

Summarizer

El Summarizer es un componente de Nappai que convierte textos extensos en resúmenes claros y concisos. Puedes usarlo para reducir informes, correos electrónicos, artículos o cualquier otro contenido textual antes de mostrarlos en tu dashboard o enviarlos a otros procesos.

¿Cómo funciona?

El componente toma el texto que le entregues y lo divide en fragmentos de un tamaño configurable (Chunk Size). Cada fragmento se envía a un modelo de lenguaje (LLM) que genera un resumen parcial. Los resúmenes parciales se combinan usando otro prompt para producir un resumen final.

  • Chunk Size: determina cuántos caracteres se procesan a la vez.
  • Chunk Overlap: añade un pequeño solapamiento entre fragmentos para que el modelo mantenga contexto.
  • Summarization Strategy: elige el estilo del resumen (concise, detailed, bullet_points, executive o custom).
  • Custom Prompts: si seleccionas “custom”, puedes definir tus propios prompts para los fragmentos y el resumen final.

El componente utiliza la clase DocAnalyzer de Nappai, que se encarga de la lógica de división, llamada al LLM y combinación de resultados. El LLM puede ser cualquier modelo compatible con LangChain que hayas configurado en tu flujo.

Entradas

CampoTipoDescripción
Input DataHandleInputEl texto, objeto Data o Message que quieres resumir.
ModelHandleInputEl modelo de lenguaje que se usará para generar los resúmenes.
Chunk OverlapIntInputCantidad de caracteres que se solapan entre fragmentos.
Chunk SizeIntInputTamaño máximo de cada fragmento de texto.
Custom Chunk PromptMultilineInputPrompt personalizado para resumir cada fragmento (solo cuando la estrategia es “custom”).
Custom Final PromptMultilineInputPrompt personalizado para combinar los resúmenes parciales en el resumen final (solo cuando la estrategia es “custom”).
Summarization StrategyDropdownInputEstrategia de resumen:
📄 Concise – breve resumen.
📝 Detailed – resumen detallado.
🔹 Bullet Points – puntos clave.
📊 Executive – resumen ejecutivo.
⚙️ Custom – usar prompts personalizados.

Nota: No se muestra la sección “Visible in:” porque el componente no tiene operaciones.

Salidas

CampoTipoDescripción
SummaryDataContiene el resumen final generado.
DataDataLista de objetos Data, cada uno con el resumen de un fragmento individual.
ToolToolUn objeto Tool de LangChain que permite usar el summarizer dentro de flujos de LangChain.

Ejemplo de Uso

  1. Añade el componente “Summarizer” a tu flujo de trabajo.
  2. Conecta el campo Input Data con el texto que quieres resumir (puede ser un bloque de texto, un Data o un Message).
  3. Selecciona el modelo de lenguaje en el campo Model.
  4. Elige la estrategia de resumen que mejor se adapte a tu caso (por ejemplo, “Concise” para un resumen rápido).
  5. Ejecuta el flujo.
  6. Lee la salida Summary para ver el resumen final o la salida Data si necesitas los resúmenes parciales. text Input Data: “El informe anual de 2023 muestra un crecimiento del 15% en ingresos, con una expansión significativa en el mercado europeo y nuevas inversiones en tecnología de IA.” Model: OpenAI GPT-4 Summarization Strategy: Concise

Salida Summary:

El informe anual de 2023 indica un crecimiento del 15% en ingresos, expansión en Europa y nuevas inversiones en IA.

Componentes Relacionados

  • Text Splitter – Divide textos en fragmentos antes de pasarlos al summarizer.
  • LLM Connector – Configura y gestiona el modelo de lenguaje que usarás.
  • Data Formatter – Convierte salidas de Data en formatos visuales (gráficos, tablas).

Consejos y Mejores Prácticas

  • Ajusta el Chunk Size: Para textos muy largos, un tamaño menor evita que el LLM se quede sin contexto.
  • Usa Chunk Overlap: Un solapamiento de 200 caracteres suele ser suficiente para mantener continuidad entre fragmentos.
  • Elige la estrategia adecuada: “Concise” para dashboards rápidos, “Bullet Points” para listas de tareas, “Executive” para presentaciones ejecutivas.
  • Prueba con prompts personalizados: Si necesitas un estilo muy específico, crea tus propios prompts en los campos “Custom Chunk Prompt” y “Custom Final Prompt”.
  • Revisa la salida: Asegúrate de que el resumen no contenga información sensible antes de publicarlo.

Consideraciones de Seguridad

  • Protege tu LLM: Asegúrate de que el modelo de lenguaje esté configurado con las credenciales correctas y que no exponga datos confidenciales.
  • Valida la entrada: El componente ya valida que el texto no esté vacío, pero revisa que los datos que envías no contengan información sensible no deseada.
  • Control de acceso: Limita quién puede usar el summarizer en flujos críticos para evitar exfiltración de datos.

Con estos pasos podrás aprovechar al máximo el Summarizer en tus dashboards de Nappai, obteniendo resúmenes claros y útiles sin complicaciones técnicas.