Google Drive
⚠️ ADVERTENCIA DE DEPRECACIÓN
Este componente está deprecado y será eliminado en una versión futura de Nappai. Por favor, migra a los componentes alternativos recomendados.
El componente Google Drive permite a los usuarios de Nappai extraer información de archivos y carpetas almacenados en Google Drive. Puedes elegir un archivo individual o una carpeta completa, y el componente descargará el contenido y los metadatos (nombre, URL, tipo MIME, etc.) para que los utilices en tus flujos de trabajo.
¿Cómo funciona?
Cuando seleccionas un archivo o una carpeta, el componente se conecta a la API de Google Drive usando la credencial que hayas configurado previamente. Internamente, utiliza un loader asíncrono (AsyncGoogleCustomDriveLoader
) que:
- Autentica la solicitud con el token de acceso obtenido de la credencial.
- Recupera los metadatos y el contenido de los archivos seleccionados.
- Convierte cada documento en un objeto
Data
con el texto extraído y los metadatos asociados. - Si eliges la opción Download File content, también devuelve los archivos binarios (por ejemplo, imágenes o PDFs) en la salida Files.
El componente es completamente asíncrono, lo que significa que no bloquea el flujo de trabajo mientras espera la respuesta de Google Drive.
Entradas
- Data with file (HandleInput): Conecta la salida de otro componente que ya contiene identificadores de archivos o carpetas. El componente extraerá los datos de esos identificadores.
- Select file (FileInput): Selecciona un archivo individual desde Google Drive. Soporta los tipos de archivo listados en
TEXT_FILE_TYPES
yIMG_FILE_TYPES
. - or Select folder (FileInput): Selecciona una carpeta completa. El componente recorrerá la carpeta (y subcarpetas si
recursive=True
) para extraer todos los archivos compatibles. - File Id Key (StrInput): Clave que indica dónde encontrar el identificador del archivo dentro de los datos de entrada. Valor por defecto:
file_id
. - Folder Id Key (StrInput): Clave que indica dónde encontrar el identificador de la carpeta dentro de los datos de entrada. Valor por defecto:
folder_id
. - Download File content (BoolInput): Si se activa, el componente descargará el contenido binario de los archivos y los incluirá en la salida Files.
- File Type (DropdownInput): Especifica el tipo de archivos que deseas cargar. Opciones:
all
,document
,sheet
,pdf
. El valor por defecto esall
.
Credencial
Este componente requiere una credencial de tipo Google Drive.
Para usarla:
- Ve a la sección Credenciales de Nappai y crea una nueva credencial llamada Google Drive.
- Proporciona los datos requeridos:
- Client Id (password) – Ejemplo: Google Cloud Project Client Id
- Client Secret (password) – Ejemplo: Google Cloud Project Client Secret
- Google drive access – Selecciona el nivel de acceso que necesitas (por ejemplo, lectura de archivos y carpetas).
- En el componente, selecciona la credencial recién creada en el campo Credential.
Puedes encontrar tu API key en la Google Cloud Console.
Salidas
- Data: Lista de objetos
Data
que contienen el texto extraído de cada archivo y sus metadatos (nombre, URL, tipo MIME, etc.). Se obtiene mediante el métodofetch_content
. - Files: Lista de objetos
Data
que representan los archivos descargados (siDownload File content
está activado). Cada objeto incluyeid
,name
,url
,mimetype
,content
y una etiquetaproperties: "google"
.
Ejemplo de Uso
-
Cargar un documento de Google Docs
- Selecciona el archivo en el campo Select file.
- Deja File Type en
document
. - Ejecuta el componente.
- La salida Data contendrá el texto completo del documento.
-
Descargar todas las imágenes de una carpeta
- Selecciona la carpeta en or Select folder.
- Cambia File Type a
all
. - Activa Download File content.
- La salida Files incluirá cada imagen con su contenido binario, lista para ser procesada por otro componente (por ejemplo, un modelo de visión por computadora).
Componentes Relacionados
- Google Sheets Reader – Extrae datos de hojas de cálculo de Google Sheets.
- Google Docs Reader – Lee documentos de Google Docs de forma específica.
- File System Reader – Accede a archivos locales en el servidor de Nappai.
Consejos y Mejores Prácticas
- Limita el número de archivos: Si trabajas con carpetas grandes, considera usar filtros de tipo de archivo o paginación para evitar tiempos de espera largos.
- Revisa los permisos: Asegúrate de que la credencial tenga acceso a las carpetas y archivos que necesitas.
- Usa la opción de descarga solo cuando sea necesario: Descargar contenido binario aumenta el uso de ancho de banda y tiempo de procesamiento.
- Combina con filtros: Si solo necesitas ciertos metadatos (por ejemplo, fechas de creación), filtra los resultados en un componente posterior para ahorrar recursos.
Consideraciones de Seguridad
- Protege la credencial: La credencial de Google Drive contiene tokens de acceso. No la compartas públicamente y revoca los permisos cuando ya no los necesites.
- Control de acceso: Asegúrate de que solo los usuarios autorizados puedan ejecutar este componente, especialmente si accede a datos sensibles.
- Auditoría: Registra las operaciones de lectura para poder rastrear quién accedió a qué archivos y cuándo.