WitAI
El componente WitAI convierte archivos de audio en texto.
Solo necesitas subir el audio (en base64) y el componente se encargará de enviar la solicitud a WitAI y devolver el resultado como texto. Además, puedes usarlo como una herramienta para agentes de IA, definiendo un nombre y una descripción que el agente mostrará cuando lo seleccione.
¿Cómo funciona?
- Subida de audio – El usuario carga un archivo de audio a través del componente Binary y se convierte a base64.
- Solicitud a WitAI – El componente envía el audio en base64 a la API de WitAI usando el token de acceso que se guarda en la credencial WitAi.
- Respuesta – WitAI devuelve el texto transcrito.
- Salida – El texto se entrega en la salida Data y, si se configura como herramienta, también se crea un objeto Tool que el agente puede invocar.
Entradas
Modo de Mapeo (Mapping Mode)
Este componente cuenta con un modo especial llamado “Mapping Mode” (Modo de Mapeo). Cuando activas este modo mediante el interruptor, se habilita una entrada adicional llamada “Mapping Data” y cada campo de entrada te ofrece tres formas diferentes de proporcionar datos:
- Fixed (Fijo): Escribes el valor directamente en el campo.
- Mapped (Mapeado): Conectas la salida de otro componente para usar su resultado como valor.
- Javascript: Escribes código Javascript para calcular el valor dinámicamente.
Esta flexibilidad te permite crear flujos de trabajo más dinámicos y conectados.
Campos de Entrada
- Speech to Text: El audio en formato base64 que quieres convertir a texto.
- Mapping Mode: Interruptor que habilita el modo de mapeo para procesar varios registros a la vez.
- Tool Name: Nombre que aparecerá en la lista de herramientas del agente.
- Tool Description: Descripción detallada de lo que hace la herramienta.
- Tools arguments metadata: Metadatos que definen los argumentos que la herramienta aceptará.
Nota: Este componente necesita una credencial de tipo WitAi.
- Configura la credencial en la sección de credenciales de Nappai.
- Selecciona la credencial en el campo Credential del componente.
La credencial incluye el Access Token y la WitAi Server Connection URL.
Salidas
- Data: El texto transcrito (tipo Data, método
GetData
). - Tool: Un objeto de herramienta (tipo Tool, método
to_toolkit
) que puede ser usado por agentes de IA.
Ejemplo de Uso
-
Subir audio
- Arrastra el componente Binary y selecciona un archivo de audio.
- Conecta la salida
Data
del Binary al campo Speech to Text del componente WitAI.
-
Configurar credencial
- En el panel de configuración del componente, elige la credencial WitAi que ya has creado.
-
Definir herramienta
- Establece Tool Name como
TranscribeAudio
. - Añade una breve Tool Description: “Convierte un archivo de audio en texto.”
- Establece Tool Name como
-
Ejecutar flujo
- Al ejecutar el flujo, el componente enviará el audio a WitAI y devolverá el texto en la salida Data.
- Si el flujo se conecta a un agente, el agente podrá llamar a la herramienta
TranscribeAudio
y recibir el texto transcrito.
Componentes Relacionados
- Binary – Para cargar y convertir archivos a base64.
- Text – Para manipular el texto transcrito.
- Agent – Para usar la salida Tool como una acción que el agente puede ejecutar.
Consejos y Mejores Prácticas
- Usa archivos de audio de buena calidad: El reconocimiento funciona mejor con grabaciones claras y sin ruido de fondo.
- Aprovecha el Modo de Mapeo: Si necesitas transcribir varios archivos a la vez, activa el modo de mapeo y conecta una lista de audios.
- Define nombres claros para las herramientas: Facilita que el agente elija la herramienta correcta.
- Revisa los límites de la API: WitAI tiene límites de uso por minuto; evita enviar demasiadas solicitudes simultáneas.
Consideraciones de Seguridad
- Protege tu token: La credencial WitAi contiene el token de acceso; no lo compartas públicamente.
- Control de acceso: Limita quién puede crear o editar credenciales en Nappai.
- Auditoría: Registra las transacciones de audio para cumplir con políticas de privacidad si es necesario.