Saltearse al contenido

Google Drive

⚠️ ADVERTENCIA DE DEPRECACIÓN

Este componente está deprecado y será eliminado en una versión futura de Nappai. Por favor, migra a los componentes alternativos recomendados.

El componente Google Drive permite a los usuarios de Nappai extraer información de archivos y carpetas almacenados en Google Drive. Puedes elegir un archivo individual o una carpeta completa, y el componente descargará el contenido y los metadatos (nombre, URL, tipo MIME, etc.) para que los utilices en tus flujos de trabajo.

¿Cómo funciona?

Cuando seleccionas un archivo o una carpeta, el componente se conecta a la API de Google Drive usando la credencial que hayas configurado previamente. Internamente, utiliza un loader asíncrono (AsyncGoogleCustomDriveLoader) que:

  1. Autentica la solicitud con el token de acceso obtenido de la credencial.
  2. Recupera los metadatos y el contenido de los archivos seleccionados.
  3. Convierte cada documento en un objeto Data con el texto extraído y los metadatos asociados.
  4. Si eliges la opción Download File content, también devuelve los archivos binarios (por ejemplo, imágenes o PDFs) en la salida Files.

El componente es completamente asíncrono, lo que significa que no bloquea el flujo de trabajo mientras espera la respuesta de Google Drive.

Entradas

  • Data with file (HandleInput): Conecta la salida de otro componente que ya contiene identificadores de archivos o carpetas. El componente extraerá los datos de esos identificadores.
  • Select file (FileInput): Selecciona un archivo individual desde Google Drive. Soporta los tipos de archivo listados en TEXT_FILE_TYPES y IMG_FILE_TYPES.
  • or Select folder (FileInput): Selecciona una carpeta completa. El componente recorrerá la carpeta (y subcarpetas si recursive=True) para extraer todos los archivos compatibles.
  • File Id Key (StrInput): Clave que indica dónde encontrar el identificador del archivo dentro de los datos de entrada. Valor por defecto: file_id.
  • Folder Id Key (StrInput): Clave que indica dónde encontrar el identificador de la carpeta dentro de los datos de entrada. Valor por defecto: folder_id.
  • Download File content (BoolInput): Si se activa, el componente descargará el contenido binario de los archivos y los incluirá en la salida Files.
  • File Type (DropdownInput): Especifica el tipo de archivos que deseas cargar. Opciones: all, document, sheet, pdf. El valor por defecto es all.

Credencial

Este componente requiere una credencial de tipo Google Drive.
Para usarla:

  1. Ve a la sección Credenciales de Nappai y crea una nueva credencial llamada Google Drive.
  2. Proporciona los datos requeridos:
    • Client Id (password) – Ejemplo: Google Cloud Project Client Id
    • Client Secret (password) – Ejemplo: Google Cloud Project Client Secret
    • Google drive access – Selecciona el nivel de acceso que necesitas (por ejemplo, lectura de archivos y carpetas).
  3. En el componente, selecciona la credencial recién creada en el campo Credential.

Puedes encontrar tu API key en la Google Cloud Console.

Salidas

  • Data: Lista de objetos Data que contienen el texto extraído de cada archivo y sus metadatos (nombre, URL, tipo MIME, etc.). Se obtiene mediante el método fetch_content.
  • Files: Lista de objetos Data que representan los archivos descargados (si Download File content está activado). Cada objeto incluye id, name, url, mimetype, content y una etiqueta properties: "google".

Ejemplo de Uso

  1. Cargar un documento de Google Docs

    • Selecciona el archivo en el campo Select file.
    • Deja File Type en document.
    • Ejecuta el componente.
    • La salida Data contendrá el texto completo del documento.
  2. Descargar todas las imágenes de una carpeta

    • Selecciona la carpeta en or Select folder.
    • Cambia File Type a all.
    • Activa Download File content.
    • La salida Files incluirá cada imagen con su contenido binario, lista para ser procesada por otro componente (por ejemplo, un modelo de visión por computadora).

Componentes Relacionados

  • Google Sheets Reader – Extrae datos de hojas de cálculo de Google Sheets.
  • Google Docs Reader – Lee documentos de Google Docs de forma específica.
  • File System Reader – Accede a archivos locales en el servidor de Nappai.

Consejos y Mejores Prácticas

  • Limita el número de archivos: Si trabajas con carpetas grandes, considera usar filtros de tipo de archivo o paginación para evitar tiempos de espera largos.
  • Revisa los permisos: Asegúrate de que la credencial tenga acceso a las carpetas y archivos que necesitas.
  • Usa la opción de descarga solo cuando sea necesario: Descargar contenido binario aumenta el uso de ancho de banda y tiempo de procesamiento.
  • Combina con filtros: Si solo necesitas ciertos metadatos (por ejemplo, fechas de creación), filtra los resultados en un componente posterior para ahorrar recursos.

Consideraciones de Seguridad

  • Protege la credencial: La credencial de Google Drive contiene tokens de acceso. No la compartas públicamente y revoca los permisos cuando ya no los necesites.
  • Control de acceso: Asegúrate de que solo los usuarios autorizados puedan ejecutar este componente, especialmente si accede a datos sensibles.
  • Auditoría: Registra las operaciones de lectura para poder rastrear quién accedió a qué archivos y cuándo.