Saltearse al contenido

BoeDataLoader

Este componente actúa como un puente inteligente entre tu flujo de trabajo y el Boletín Oficial del Estado (BOE). Su propósito principal es ayudarte a acceder, buscar y descargar de manera automática datos oficiales, como leyes, reales decretos, resúmenes diarios y textos legales completos. Está diseñado para integrarse fácilmente con herramientas de análisis de datos o procesamiento de lenguaje natural, permitiendo que tu sistema maneje la carga de información legal sin intervención manual.

¿Cómo funciona?

El componente se conecta directamente a la API de Datos Abiertos del BOE, que es la fuente oficial de toda la normativa vigente y publicada en España. Cuando configuras los datos (como una palabra clave, una fecha o un identificador de ley), el componente construye automáticamente la solicitud correspondiente y la envía al BOE.

Internamente, se encarga de tareas complejas como:

  • Gestionar la paginación: Si hay muchos resultados, el componente sabe cómo recorrer las distintas páginas para obtener toda la información.
  • Validar los datos: Asegura que las fechas y los tipos de normativa sean correctos antes de hacer la consulta.
  • Transformar la información: Convierte los datos crudos del BOE en formatos útiles (como tablas o listas) que puedes usar en el resto de tu flujo.

Además, cuenta con una función especial llamada “Modo de Mapeo” que te permite conectar las entradas con la salida de otros componentes de tu dashboard, facilitando la creación de flujos dinámicos y personalizados.

Entradas

Modo de Mapeo (Mapping Mode)

Este componente cuenta con un modo especial llamado “Mapping Mode” (Modo de Mapeo). Cuando activas este modo mediante el interruptor, se habilita una entrada adicional llamada “Mapping Data” y cada campo de entrada te ofrece tres formas diferentes de proporcionar datos:

  • Fixed (Fijo): Escribes el valor directamente en el campo.
  • Mapped (Mapeado): Conectas la salida de otro componente para usar su resultado como valor.
  • Javascript: Escribes código Javascript para calcular el valor dinámicamente.

Esta flexibilidad te permite crear flujos de trabajo más dinámicos y conectados, ajustando las búsquedas en tiempo real según los datos que proceses en otros pasos.

Campos de Entrada

Los siguientes campos están disponibles para configurar este componente. Cada campo puede estar visible en diferentes operaciones:

  • Search Term: Palabras clave o fragmentos para buscar legislación, metadatos o resúmenes. Útil para filtrar por temas específicos.
  • Norm Identifier: Código único de la ley, real decreto o disposición que deseas consultar. Necesario si buscas una norma específica por su ID.
  • Publication Date: Fecha de publicación de la normativa. Puedes especificar un día concreto o un rango; si no indicas nada, usará el día actual.
  • Norm Type: Clasificación de la norma (como ley, real decreto, acuerdo, etc.). Ayuda a reducir los resultados al tipo de normativa que te interesa.
  • Page Number: Número de página para la búsqueda. Útil cuando hay muchos resultados y necesitas desplazarte a la siguiente página.
  • Results Per Page: Cantidad máxima de registros que se devolverán en cada solicitud. Puedes ajustar este número según la velocidad y el tamaño de datos que necesites.
  • Query Language: Idioma utilizado para las búsquedas o traducciones. El valor predeterminado es castellano (es), pero puedes cambiarlo si es necesario.
  • Include Full Text: Indica si se debe recuperar el texto íntegro de la norma. Si lo activas, obtendrás el contenido completo, lo cual puede tardar más pero es esencial para análisis de texto detallados.
  • Auxiliary Ref Type: Tipo de dato auxiliar que deseas obtener, como organismos emisores, glosarios o clasificaciones legales.

Salidas

Una vez que el componente procesa la solicitud, genera varias salidas que puedes utilizar en pasos posteriores de tu flujo:

  • Legislation Data: Metadatos, citas y enlaces de las normas encontradas. Ideal para listas o análisis iniciales.
  • Legal Text: El contenido textual completo de la(s) norma(s) solicitada(s), listo para análisis de lenguaje natural (NLP).
  • Daily Summaries: Listado de boletines diarios (BOE y BORME) con titulares y breves descripciones, útil para mantenerse actualizado.
  • Reference Data: Información de ayuda como organismos emisores, glosarios o clasificaciones, para enriquecer tu base de datos.
  • Metadata: Información técnica sobre la respuesta (tiempos, códigos HTTP, páginas totales), útil para auditorías o registro de logs.
  • Raw Response: La respuesta original en formato crudo (JSON o binario), que puedes usar para depuración avanzada o procesamiento personalizado.

Ejemplo de Respuesta JSON

A continuación se muestra un ejemplo simplificado de lo que podrías recibir en la salida Daily Summaries al consultar resúmenes del BOE: json { “success”: true, “data”: { “daily_summaries”: [ { “id”: “BOE-A-2023-12345”, “title”: “Real Decreto de Protección de Datos”, “category”: “Real Decreto”, “publication_date”: “2023-10-15”, “summary”: “Establece nuevas directrices para el tratamiento de datos personales en la administración pública.” }, { “id”: “BOE-A-2023-12346”, “title”: “Orden Ministerial de Innovación Tecnológica”, “category”: “Orden Ministerial”, “publication_date”: “2023-10-15”, “summary”: “Modifica los plazos de presentación de informes para el sector tecnológico.” } ] }, “metadata”: { “total_pages”: 2, “current_page”: 1, “timestamp”: “2023-10-20T10:00:00Z” } }

Conectividad

Este componente es ideal para conectar con nodos de Procesamiento de Datos, Análisis de Texto o Almacenamiento en Base de Datos. Por ejemplo, puedes conectar la salida Legal Text a un componente de IA para extraer resúmenes automáticos o sentiment analysis, y luego guardar los resultados en un almacén de datos. También es útil para alimentar un dashboard con las Daily Summaries y mantener un registro visual de las últimas normativas publicadas.

Ejemplo de Uso

Imagina que necesitas extraer todos los reales decretos publicados en la última semana para analizarlos con una IA.

  1. Configura Norm Type como “Real Decreto”.
  2. Usa Publication Date para filtrar por la fecha de la semana anterior (puedes usar variables dinámicas si activas el Modo de Mapeo).
  3. Activa Include Full Text si necesitas el contenido completo para el análisis de la IA.
  4. Conecta la salida Legal Text a tu componente de IA. El sistema automáticamente buscará, filtrará y extraerá los textos necesarios, ahorrándote tiempo manual.

Consejos y Mejores Prácticas

  • Filtra por fechas: Al trabajar con la API del BOE, es recomendable usar siempre Publication Date para evitar devolver miles de registros innecesarios.
  • Usa el Modo de Mapeo: Si tu flujo depende de datos variables (como fechas cambiantes o IDs dinámicos), activa el Modo de Mapeo para conectar estas entradas a salidas de otros componentes.
  • Controla la paginación: Si esperas muchos resultados, ajusta Results Per Page y Page Number para controlar la velocidad de carga y evitar sobrecargas en tu flujo.
  • Texto completo bajo demanda: Include Full Text consume más recursos. Úsalo solo cuando realmente necesites el contenido íntegro para procesamiento avanzado.

Consideraciones de Seguridad

El componente se conecta a una API de datos públicos (BOE), por lo que no maneja información sensible ni credenciales de acceso por defecto. Sin embargo, asegúrate de que los datos que extraes sean los correctos y cumplan con la normativa de privacidad si los vas a almacenar o procesar en sistemas internos.