Saltearse al contenido

RSS Feeds

El componente RSS Feeds permite a los usuarios traer contenido de noticias directamente desde fuentes RSS. Puedes introducir una lista de URLs de feeds o subir un archivo OPML que contenga varias suscripciones. El resultado es una colección de documentos con el texto de cada artículo y metadatos útiles como título, autor y fecha.

¿Cómo funciona?

El componente utiliza la librería langchain_community para cargar los feeds.

  • Si se proporciona un bloque de datos OPML, se crea un RSSFeedLoader con ese OPML.
  • Si no, se crea el mismo cargador con la lista de URLs que ingreses.
    El cargador descarga cada feed, extrae el contenido HTML de los artículos y devuelve una lista de objetos Data. Cada objeto contiene el texto del artículo (page_content) y los metadatos extraídos (metadata).

Entradas

Campos de Entrada

  • RSS Feed URLs: Introduce una o varias URLs de feeds RSS. Puedes escribirlas una por línea o separarlas con comas.
  • OPML data (XML Format): Copia y pega el contenido XML de un archivo OPML que contenga varias suscripciones a feeds. Si lo dejas vacío, el componente usará las URLs proporcionadas en el campo anterior.

Salidas

  • Data: Devuelve una lista de objetos Data. Cada objeto incluye el texto completo del artículo y metadatos como título, autor, fecha de publicación y la URL original. Esta salida puede conectarse a otros componentes que procesen texto, como analizadores de sentimiento, clasificadores o motores de búsqueda.

Ejemplo de Uso

  1. Añade el componente “RSS Feeds” al flujo de trabajo.
  2. En el campo RSS Feed URLs, escribe por ejemplo:
    https://news.un.org/feed/subscribe/en/news/all/rss.xml
    https://rss.cnn.com/rss/edition.rss
  3. Deja el campo OPML data (XML Format) vacío (o pega un OPML si lo prefieres).
  4. Conecta la salida Data a un componente de “Text Splitter” para dividir los artículos en fragmentos más pequeños.
  5. Luego, pasa esos fragmentos a un modelo de IA para generar resúmenes o extraer temas.

Componentes Relacionados

  • Text Splitter – Divide textos largos en fragmentos manejables.
  • Document Search – Busca información dentro de los documentos cargados.
  • OpenAI LLM – Genera resúmenes, respuestas o análisis a partir de los artículos.

Consejos y Mejores Prácticas

  • Limita la cantidad de URLs: Demasiados feeds pueden ralentizar la carga.
  • Revisa la política de uso de cada feed para evitar violaciones de derechos de autor.
  • Usa OPML cuando tengas muchas suscripciones: facilita la gestión y actualización de feeds.
  • Filtra por fecha: Si el componente lo permite, limita los artículos a los últimos días para mantener la información relevante.

Consideraciones de Seguridad

  • Confianza en las fuentes: Solo ingresa URLs de feeds que provengan de sitios confiables para evitar contenido malicioso.
  • Control de acceso: Si el flujo de trabajo se comparte, asegúrate de que los usuarios tengan permiso para acceder a los feeds externos.