Saltearse al contenido

DuckDuckGo Search

El componente DuckDuckGo Search te permite realizar búsquedas en la web directamente desde tu dashboard de Nappai. Con él puedes obtener los títulos, resúmenes y enlaces de los resultados más relevantes, y opcionalmente descargar el contenido completo de cada página.

¿Cómo funciona?

Cuando introduces una consulta de búsqueda, el componente ejecuta el comando ddgr (DuckDuckGo Search) en segundo plano.

  1. Genera la consulta: Se construye un comando con la búsqueda y el número máximo de resultados que quieres recibir.
  2. Ejecuta el comando: Se lanza el proceso de forma asíncrona y se captura la salida en formato JSON.
  3. Analiza la respuesta: Se convierte el JSON en una lista de objetos con title, body (resumen) y url.
  4. Opcional – Descarga de contenido: Si activas “Fetch Content”, el componente abre conexiones HTTP a cada URL y descarga el texto de la página, añadiéndolo al resultado como content.
  5. Entrega: Los resultados se devuelven como una lista de objetos que pueden usarse en flujos de trabajo o mostrarse en tu dashboard.

El componente no necesita claves API ni credenciales; todo se hace a través de la herramienta de línea de comandos ddgr y la librería aiohttp para las descargas.

Entradas

Campos de Entrada

  • Fetch Content: Si lo activas, el componente descargará el contenido completo de cada página encontrada.
  • Search Query: Escribe aquí la frase o palabras clave que quieres buscar.
  • Max Results: Número máximo de resultados que quieres recibir (por defecto 5).
  • Tool Description: Texto que describe la herramienta; se usa internamente cuando se crea el “tool” para agentes.
  • Tool Name: Nombre que se asigna al “tool” que se crea; útil si quieres referenciarlo en flujos de agentes.

Salidas

  • Data: Cada resultado se envía como un objeto Data que contiene el texto del resumen (body) y la información completa del resultado.
  • Tool: Se crea un “tool” estructurado que puede ser usado por agentes de IA para ejecutar búsquedas de forma automática.

Ejemplo de Uso

  1. Búsqueda simple

    • Configura Search Query con “Python async programming”.
    • Deja Max Results en 5 y Fetch Content desactivado.
    • Ejecuta el componente.
    • El dashboard mostrará una lista con los títulos y resúmenes de los 5 primeros resultados.
  2. Descargar contenido

    • Activa Fetch Content.
    • Ejecuta el componente.
    • Cada resultado incluirá ahora el texto completo de la página, lo que permite usarlo en análisis de contenido o generación de resúmenes.

Componentes Relacionados

  • DuckDuckGoSearchRun – La librería que se encarga de la llamada a ddgr.
  • LangChain Agent – Si quieres que un agente de IA utilice este componente como una herramienta de búsqueda.
  • DuckDuckGo Search (API) – Versión basada en la API oficial de DuckDuckGo (si prefieres evitar la línea de comandos).

Consejos y Mejores Prácticas

  • Limita los resultados: Un número alto de resultados puede ralentizar la búsqueda y consumir más ancho de banda.
  • Usa “Fetch Content” con precaución: Descargar páginas completas puede generar tráfico elevado y consumir memoria.
  • Revisa los resultados: Los resúmenes pueden no ser 100 % precisos; siempre verifica la fuente antes de usar la información.
  • Combina con filtros: Puedes usar la salida de este componente como entrada para filtros de texto o análisis de sentimiento.

Consideraciones de Seguridad

  • Privacidad de datos: La búsqueda se realiza en la web pública; no se envían datos sensibles a DuckDuckGo.
  • Control de contenido: Si habilitas “Fetch Content”, el contenido descargado se almacena en memoria; evita usarlo con datos confidenciales.
  • Uso responsable: No abuses de la herramienta para hacer scraping masivo; respeta los límites de uso de los sitios web consultados.