RSS Feeds
El componente RSS Feeds permite a los usuarios traer contenido de noticias directamente desde fuentes RSS. Puedes introducir una lista de URLs de feeds o subir un archivo OPML que contenga varias suscripciones. El resultado es una colección de documentos con el texto de cada artículo y metadatos útiles como título, autor y fecha.
¿Cómo funciona?
El componente utiliza la librería langchain_community
para cargar los feeds.
- Si se proporciona un bloque de datos OPML, se crea un
RSSFeedLoader
con ese OPML. - Si no, se crea el mismo cargador con la lista de URLs que ingreses.
El cargador descarga cada feed, extrae el contenido HTML de los artículos y devuelve una lista de objetosData
. Cada objeto contiene el texto del artículo (page_content
) y los metadatos extraídos (metadata
).
Entradas
Campos de Entrada
- RSS Feed URLs: Introduce una o varias URLs de feeds RSS. Puedes escribirlas una por línea o separarlas con comas.
- OPML data (XML Format): Copia y pega el contenido XML de un archivo OPML que contenga varias suscripciones a feeds. Si lo dejas vacío, el componente usará las URLs proporcionadas en el campo anterior.
Salidas
- Data: Devuelve una lista de objetos
Data
. Cada objeto incluye el texto completo del artículo y metadatos como título, autor, fecha de publicación y la URL original. Esta salida puede conectarse a otros componentes que procesen texto, como analizadores de sentimiento, clasificadores o motores de búsqueda.
Ejemplo de Uso
- Añade el componente “RSS Feeds” al flujo de trabajo.
- En el campo RSS Feed URLs, escribe por ejemplo:
https://news.un.org/feed/subscribe/en/news/all/rss.xmlhttps://rss.cnn.com/rss/edition.rss
- Deja el campo OPML data (XML Format) vacío (o pega un OPML si lo prefieres).
- Conecta la salida Data a un componente de “Text Splitter” para dividir los artículos en fragmentos más pequeños.
- Luego, pasa esos fragmentos a un modelo de IA para generar resúmenes o extraer temas.
Componentes Relacionados
- Text Splitter – Divide textos largos en fragmentos manejables.
- Document Search – Busca información dentro de los documentos cargados.
- OpenAI LLM – Genera resúmenes, respuestas o análisis a partir de los artículos.
Consejos y Mejores Prácticas
- Limita la cantidad de URLs: Demasiados feeds pueden ralentizar la carga.
- Revisa la política de uso de cada feed para evitar violaciones de derechos de autor.
- Usa OPML cuando tengas muchas suscripciones: facilita la gestión y actualización de feeds.
- Filtra por fecha: Si el componente lo permite, limita los artículos a los últimos días para mantener la información relevante.
Consideraciones de Seguridad
- Confianza en las fuentes: Solo ingresa URLs de feeds que provengan de sitios confiables para evitar contenido malicioso.
- Control de acceso: Si el flujo de trabajo se comparte, asegúrate de que los usuarios tengan permiso para acceder a los feeds externos.