🎙 Cómo doblar tu podcast a otro idioma con AI
Tenés un podcast en español y querés llegar a Brasil, Estados Unidos o Europa. Hace 2 años eso era contratar dobladores humanos a USD 50/hora. Hoy con AI Dubbing lo hacés vos mismo en minutos por USD 2/min. Esta guía te muestra el flujo completo, los costos reales y los errores típicos que te van a ahorrar tiempo.
Por qué doblar (no solo subtitular)
Datos del 2025 de Spotify Voice Translation Pilot: episodios doblados a inglés/portugués/francés generan 4× downloads vs versiones solo subtituladas. Lex Fridman + Dax Shepard son casos públicos.
3 enfoques posibles (y cuál ganar)
2) ElevenLabs Studio Dubbing: USD 0.18/min input + voice cloning real. Calidad ~98%. Pero pagás todo en USD via Stripe (problemático desde Argentina/LATAM).
3) NLLB-200 + Edge TTS (lo que ofrecemos): USD 2/min de output, voces neurales preset, calidad 85-90%. Sin voice cloning V1 pero ideal para 80% de casos donde sumar idiomas pesa más que mantener exacta tu voz.
Pipeline técnico paso a paso
- Limpieza audio: FFmpeg afftdn + dynaudnorm quita ruido y normaliza volumen. Mejor input → mejor transcribe.
- Transcribe + timestamps: Whisper large-v3 saca el texto con marcas de tiempo por palabra.
- Translate: NLLB-200 distilled-600M de Meta (200 idiomas) traduce cada segmento.
- TTS: Microsoft Edge Neural Voices (300+ voces) sintetiza el audio target.
- Mux: FFmpeg concat respetando timestamps originales para mantener pacing.
Procesando un episodio de 60 min en cluster GPU 5×RTX 3090 toma ~10 minutos.
Errores típicos que arruinan el resultado
Error 2: Elegir voz neural genérica pop. Si tu podcast es serio (filosofía, política), no uses voces tipo TikTok. Edge tiene voces "Newscast" y "Documentary" más adecuadas.
Error 3: Translate idiomático literal. NLLB-200 a veces traduce muy directo. Si tu podcast tiene jerga argentina ("laburo", "pibe"), conviene editar el script antes de dobar para que el target language reciba algo natural.
Cuánto sale realmente: numbers reales
| Servicio | Precio/episodio | Lengua |
| TranscribeNode AI Dubbing | USD 120 (60min × $2) | 30+ idiomas |
| ElevenLabs Studio Dubbing | USD 11 (60min × $0.18) | 29 idiomas |
| Doblaje humano | USD 1800-4800 | cualquiera |
ElevenLabs sale más barato por minuto de input. Nosotros cobramos por minuto de output dubeado. La gran diferencia: pagás en pesos argentinos via MercadoPago, sin Stripe, sin compliance KYC pesado, y los audios nunca van fuera de nuestro cluster.
Probalo gratis ahora
Preguntas frecuentes
¿Mantiene mi voz original?
V1 no — usa voces neurales preset (300+ opciones de Microsoft Edge). V2 con voice cloning ElevenLabs viene Q3 2026.
¿Funciona con jerga argentina?
Sí, NLLB-200 entiende Spanish-Latin variants. Para términos muy locales (lunfardo, slang), recomendamos editar el script antes de dobar.
¿Cuántos idiomas en simultáneo?
Sin límite. Podés generar el mismo episodio en 5 idiomas con 5 calls al endpoint. Total: ~50 minutos cluster GPU para 5 idiomas × 60min de podcast.
¿Cómo lo subo a Spotify/Apple?
Igual que cualquier MP3. Te recomendamos subirlo como episode separado en cada idioma, con título traducido. Apple Podcasts soporta multi-language ahora.
Empezá tu primer dubbing ahora
Demo free sin login + 50 créditos al registrarte sin tarjeta.
🎬 Ir a AI Dubbing →