YouTube Transcripts

Este componente te permite obtener el texto hablado de cualquier video de YouTube. Es ideal si necesitas analizar, resumir o traducir el contenido de videos para integrarlo en flujos de trabajo de automatización. El componente es inteligente: intenta extraer la transcripción de varias maneras para asegurar que consigas el texto, incluso si el video no tiene subtítulos oficiales (en algunos casos).

¿Cómo funciona?

El componente conecta directamente con servicios externos de YouTube para “escuchar” el video y convertir el audio en texto.

Obtención del Texto: Utiliza librerías especializadas para interactuar con YouTube. Primero intenta obtener la transcripción oficial disponible en el video. Si eso falla, prueba otras estrategias (como buscar pistas de subtítulos o transcripciones generadas automáticamente).
Formato de Salida: Puedes decidir cómo quieres recibir el texto.
- Texto simple: Todo el contenido en un solo bloque continuo.
- Fragmentos (Chunks): El texto dividido en pedazos más pequeños con marcas de tiempo (útil para videos largos).
Traducción: Opcionalmente, puedes pedirle al componente que traduzca la transcripción a un idioma específico automáticamente.

Conexión y Credenciales

Este componente no requiere configuración previa de credenciales. Solo necesitas una URL válida de YouTube para empezar. Asegúrate de tener conexión a Internet, ya que el componente se conecta a los servidores de YouTube en tiempo real.

Entradas

Campos de Entrada

Los siguientes campos están disponibles para configurar este componente. Estos campos no están vinculados a operaciones específicas, sino que definen el comportamiento general de la extracción.

Video URL: [La dirección web del video de YouTube del que quieres obtener la transcripción. Debe ser una URL completa (ej. youtube.com/watch?v=… o youtu.be/…)].
Transcript Format: [Elige cómo quieres recibir el texto. Selecciona “text” para obtener todo el contenido seguido, o “chunks” para obtener el texto dividido en trozos con marcas de tiempo].
Chunk Size (seconds) [Solo aparece si seleccionas “chunks” arriba]. [Tamaño en segundos de cada trozo de texto. El valor predeterminado es 60 segundos, lo cual suele ser suficiente para la mayoría de videos].
Language: [Idioma o idiomas que quieres usar para buscar la transcripción. Puedes poner uno (ej. “es”) o varios separados por comas (ej. “es,en”) para darle prioridad. Déjalo vacío para usar el idioma predeterminado del video].
Translation Language: [Si quieres que el texto extraído sea traducido automáticamente a otro idioma. Selecciona el idioma de destino (ej. “es” para español) o déjalo vacío para no traducir].

Salidas

Al finalizar el proceso, el componente produce una salida llamada Data.

Data: Contiene el resultado de la extracción.
- Si todo sale bien, verás el texto completo o los fragmentos con sus tiempos.
- Si ocurre un error (por ejemplo, el video no tiene transcripción y la URL es válida), el componente devolverá un mensaje de error explicando qué pasó.

Ejemplo de Respuesta JSON

Aquí tienes un ejemplo de cómo se ve la salida si eliges el formato “text”: json { “data”: { “transcripts”: “Hola a todos, bienvenidos a este video de demostración. Hoy vamos a explicar cómo funciona el sistema Nappai…” } }

Y un ejemplo si eliges el formato “chunks” (Fragmentos): json [ { “content”: “Hola a todos, bienvenidos a este video de demostración.”, “metadata”: { “start”: 0, “end”: 15 } }, { “content”: “Hoy vamos a explicar cómo funciona el sistema Nappai.”, “metadata”: { “start”: 15, “end”: 30 } } ]

Conectividad

Este componente es una herramienta de extracción de datos. Lógicamente, se conecta a componentes que necesiten leer texto para procesarlo.

LanggraphReactAgent: Ideal si quieres que un agente de IA lea la transcripción y responda preguntas basadas en el video.
ParseData: Útil si quieres limpiar o estructurar la transcripción antes de enviarla a otro lugar.
TextInput: Perfecto si necesitas pegar el texto extraído en otro campo o componente para su visualización o edición.

Ejemplo de Uso

Escenario: Resumir un tutorial de YouTube

Copias el enlace de un video tutorial en YouTube.
Usas el componente YouTube Transcripts con el campo Video URL lleno y Transcript Format en “text”.
Conectas la salida Data a un componente de Texto o a un Agente de IA.
El agente lee la transcripción y crea un resumen de los puntos clave del video automáticamente.

Notas Importantes

🔒 Data Exposure with Translation 🔴 If you select a translation language, the component sends the transcript to an external translation service. A stable internet connection is required, and privacy may be affected.

🔒 Use Caution with Sensitive Content 🔴 If the video contains private or confidential information, do not use this component as the transcript may be exposed to external services during translation.

⚠️ No Captions on Video 🟡 If the YouTube video does not have captions or subtitles, the component cannot generate a transcript. It will return an error indicating that no transcript was found.

⚠️ Language Availability 🟡 If the specified language code is not available for the video, the component will fall back to English captions, which may not match your requested language.

📋 Dependency Installation 🟢 The component relies on the youtube_transcript_api library. Install it via pip (pip install youtube-transcript-api) before using the component.

💡 Choose Format Wisely 🟢 Use ‘text’ for a quick, single transcript and ‘chunks’ when you need timestamps or want to analyze specific parts. Selecting the appropriate format improves readability and downstream processing.

💡 Use Standard YouTube URLs 🟢 Enter the full watch URL (e.g., https://www.youtube.com/watch?v=xxxx) or the shortened youtu.be link. Avoid using embedded player URLs, which may not be parsed correctly.

ℹ️ Error Output Format 🟢 When the component encounters an error, it returns a Data object with an ‘error’ field. Check the ‘error’ key in the output to understand what went wrong.

Consejos y Mejores Prácticas

Asegúrate de usar URLs completas de YouTube. Los enlaces incrustados o cortos pueden no funcionar correctamente.
Para videos muy largos, considerar el uso del formato “chunks” puede hacer que el procesamiento sea más eficiente y organizado.
Si el video no tiene subtítulos oficiales, el componente intentará usar alternativas, pero no siempre es posible obtener la transcripción.
Si necesitas traducir el contenido, ten en cuenta que esto requiere enviar tus datos a un servicio externo.

Consideraciones de Seguridad

Privacidad: El uso de la función de traducción envía el texto extraído a un servicio externo. Si el contenido del video es confidencial o privado, evita usar la traducción automática.
Acceso a Datos: Solo extrae transcripciones de videos de los cuales tienes permiso o que son de dominio público.