Saltearse al contenido

Wikipedia

El componente Wikipedia te permite consultar la enciclopedia en línea Wikipedia directamente desde tu panel de control de Nappai. Solo necesitas indicar el término de búsqueda, el idioma y cuántos resultados quieres ver, y el componente se encargará de obtener los artículos y devolverlos como datos estructurados que puedes usar en tu flujo de trabajo.

¿Cómo funciona?

Cuando activas el componente, se crea una instancia de WikipediaAPIWrapper, que es la capa que se comunica con la API pública de Wikipedia. El wrapper recibe los parámetros que configuras (término de búsqueda, idioma, número de resultados, etc.) y hace una llamada HTTP a Wikipedia. Los artículos que devuelve la API se convierten en objetos Document, y luego se transforman en el formato Data que Nappai entiende. Si necesitas usar el mismo wrapper en otro lugar de tu flujo, el componente también puede generar un objeto Tool que encapsula la lógica de búsqueda para que lo reutilices.

Entradas

Campos de Entrada

  • Input: Escribe el término o la frase que quieres buscar en Wikipedia.
  • Language: Especifica el idioma de la búsqueda (por ejemplo, en para inglés, es para español).
  • Number of results: Indica cuántos artículos quieres que se devuelvan (el valor por defecto es 4).
  • Load all available meta: Si lo activas, el componente también recuperará toda la información de metadatos disponible para cada artículo.
  • Document content characters max: Define el número máximo de caracteres que se incluirán del contenido del artículo (valor por defecto 4000).

Salidas

  • Data: Una lista de objetos Data que contienen el título, el extracto y, opcionalmente, metadatos de cada artículo recuperado.
  • Tool: Un objeto Tool que puedes conectar a otros componentes para reutilizar la lógica de búsqueda en diferentes partes de tu flujo.

Ejemplo de Uso

  1. Objetivo: Obtener los 4 primeros artículos sobre “Inteligencia Artificial” en español.
  2. Configuración:
    • Input: Inteligencia Artificial
    • Language: es
    • Number of results: 4
    • Load all available meta: False
    • Document content characters max: 4000
  3. Resultado: El componente devuelve una lista de 4 objetos Data, cada uno con el título del artículo, un extracto breve y la URL. Puedes usar estos datos para mostrarlos en un panel, guardarlos en una base de datos o pasarlos a otro componente que realice análisis de texto.

Componentes Relacionados

  • WikipediaBaseTool: Herramienta base que se utiliza internamente para construir el wrapper de Wikipedia.
  • WikipediaAPIWrapper: Clase que gestiona la comunicación con la API de Wikipedia.

Consejos y Mejores Prácticas

  • Limita el número de resultados: Si solo necesitas un resumen rápido, 3 o 4 resultados suelen ser suficientes y reducen la carga de datos.
  • Usa el idioma correcto: Wikipedia tiene versiones en muchos idiomas; asegúrate de usar el código correcto (en, es, fr, etc.) para obtener la información más relevante.
  • Controla el tamaño del contenido: Ajusta Document content characters max según la capacidad de tu flujo; valores muy altos pueden ralentizar el procesamiento.
  • Reutiliza el Tool: Si vas a hacer varias búsquedas en tu flujo, crea un Tool una sola vez y conéctalo a los componentes que lo necesiten.

Consideraciones de Seguridad

  • La API de Wikipedia es pública y no requiere autenticación, pero respeta los límites de uso. Evita hacer demasiadas peticiones en un corto período para no ser bloqueado temporalmente.
  • Si tu flujo incluye datos sensibles, recuerda que el contenido de Wikipedia es público; no mezcles información privada con los resultados de búsqueda.