DuckDuckGo Search
El componente DuckDuckGo Search te permite realizar búsquedas en la web directamente desde tu dashboard de Nappai. Con él puedes obtener los títulos, resúmenes y enlaces de los resultados más relevantes, y opcionalmente descargar el contenido completo de cada página.
¿Cómo funciona?
Cuando introduces una consulta de búsqueda, el componente ejecuta el comando ddgr
(DuckDuckGo Search) en segundo plano.
- Genera la consulta: Se construye un comando con la búsqueda y el número máximo de resultados que quieres recibir.
- Ejecuta el comando: Se lanza el proceso de forma asíncrona y se captura la salida en formato JSON.
- Analiza la respuesta: Se convierte el JSON en una lista de objetos con
title
,body
(resumen) yurl
. - Opcional – Descarga de contenido: Si activas “Fetch Content”, el componente abre conexiones HTTP a cada URL y descarga el texto de la página, añadiéndolo al resultado como
content
. - Entrega: Los resultados se devuelven como una lista de objetos que pueden usarse en flujos de trabajo o mostrarse en tu dashboard.
El componente no necesita claves API ni credenciales; todo se hace a través de la herramienta de línea de comandos ddgr
y la librería aiohttp
para las descargas.
Entradas
Campos de Entrada
- Fetch Content: Si lo activas, el componente descargará el contenido completo de cada página encontrada.
- Search Query: Escribe aquí la frase o palabras clave que quieres buscar.
- Max Results: Número máximo de resultados que quieres recibir (por defecto 5).
- Tool Description: Texto que describe la herramienta; se usa internamente cuando se crea el “tool” para agentes.
- Tool Name: Nombre que se asigna al “tool” que se crea; útil si quieres referenciarlo en flujos de agentes.
Salidas
- Data: Cada resultado se envía como un objeto
Data
que contiene el texto del resumen (body
) y la información completa del resultado. - Tool: Se crea un “tool” estructurado que puede ser usado por agentes de IA para ejecutar búsquedas de forma automática.
Ejemplo de Uso
-
Búsqueda simple
- Configura Search Query con “Python async programming”.
- Deja Max Results en 5 y Fetch Content desactivado.
- Ejecuta el componente.
- El dashboard mostrará una lista con los títulos y resúmenes de los 5 primeros resultados.
-
Descargar contenido
- Activa Fetch Content.
- Ejecuta el componente.
- Cada resultado incluirá ahora el texto completo de la página, lo que permite usarlo en análisis de contenido o generación de resúmenes.
Componentes Relacionados
- DuckDuckGoSearchRun – La librería que se encarga de la llamada a
ddgr
. - LangChain Agent – Si quieres que un agente de IA utilice este componente como una herramienta de búsqueda.
- DuckDuckGo Search (API) – Versión basada en la API oficial de DuckDuckGo (si prefieres evitar la línea de comandos).
Consejos y Mejores Prácticas
- Limita los resultados: Un número alto de resultados puede ralentizar la búsqueda y consumir más ancho de banda.
- Usa “Fetch Content” con precaución: Descargar páginas completas puede generar tráfico elevado y consumir memoria.
- Revisa los resultados: Los resúmenes pueden no ser 100 % precisos; siempre verifica la fuente antes de usar la información.
- Combina con filtros: Puedes usar la salida de este componente como entrada para filtros de texto o análisis de sentimiento.
Consideraciones de Seguridad
- Privacidad de datos: La búsqueda se realiza en la web pública; no se envían datos sensibles a DuckDuckGo.
- Control de contenido: Si habilitas “Fetch Content”, el contenido descargado se almacena en memoria; evita usarlo con datos confidenciales.
- Uso responsable: No abuses de la herramienta para hacer scraping masivo; respeta los límites de uso de los sitios web consultados.