Music v2 no es solo una mejora técnica de ElevenLabs: es una señal de que la música generada por IA entra en la fase industrial, con canciones completas, control por secciones, soporte multilingüe, uso comercial y herramientas pensadas para creadores, desarrolladores y marcas.
ElevenLabs ha presentado Music v2, su nuevo modelo de generación musical por inteligencia artificial, con una promesa directa: mejores voces, mejor instrumentación, mejores arreglos en cualquier género, soporte multilingüe más sólido y capacidades que hasta ahora no eran posibles. El anuncio, publicado por la compañía y difundido también en X, sitúa a ElevenLabs en una de las batallas más sensibles de la IA generativa: la creación de música completa, comercialmente utilizable y adaptable a las necesidades de músicos, desarrolladores, marcas, agencias y creadores de contenido.
La novedad no llega de forma aislada. ElevenLabs, conocida inicialmente por sus herramientas de voz sintética, doblaje, clonación vocal y generación de audio, lleva meses construyendo una plataforma musical más ambiciosa. A finales de abril presentó ElevenMusic, una aplicación para descubrir, remezclar, crear y monetizar música generada o transformada con IA, construida sobre un modelo musical licenciado. La compañía explicó entonces que ElevenMusic conecta escucha, remix y creación original en un mismo sistema, con una capa pensada para que los artistas puedan relacionarse con sus audiencias y generar ingresos.
Music v2 es el motor que refuerza esa estrategia. Según ElevenLabs, el nuevo modelo alimenta tres plataformas distintas: ElevenMusic, orientada a escuchar, remezclar y crear canciones; ElevenAPI, pensada para que desarrolladores integren generación musical directamente en sus productos; y ElevenCreative, dirigida a marcas y equipos de contenido que necesitan música descargable para anuncios, piezas audiovisuales y contenido corporativo. La compañía también ha reducido precios: hasta un 50% en Music v1 y Music v2 para ElevenAPI y hasta un 40% para clientes self-serve de ElevenCreative.
El salto técnico más importante está en la estructura musical. Hasta ahora, muchas herramientas de música por IA impresionaban en clips breves, bases instrumentales o canciones de apariencia inmediata, pero sufrían cuando había que sostener una pieza completa con coherencia. Music v2 promete avanzar precisamente en ese terreno: permite construir canciones sección por sección —introducción, verso, estribillo y otras partes— manteniendo continuidad y estructura. Esto importa porque la música no es una sucesión de sonidos agradables; es arquitectura emocional, repetición, tensión, resolución, contraste y memoria.
La nueva versión introduce también mejoras en inpainting musical. Esto significa que el usuario puede seleccionar una parte concreta de una canción y regenerar solo ese fragmento sin alterar el resto. En términos prácticos, permite cambiar un puente, ajustar una entrada vocal, modificar una transición o corregir una sección débil sin destruir el estribillo ni rehacer toda la pieza. Para creadores y productores, esta función acerca la IA a un flujo de trabajo más profesional: no se trata solo de pedir una canción y aceptar el resultado, sino de dirigir, corregir y refinar.
La compañía destaca además capacidades de complejidad vocal y compositiva. Music v2 puede, según ElevenLabs, mover una canción de la ópera al heavy metal y volver atrás, sostener rap rápido y letras densas, e incorporar efectos sonoros no musicales dentro de la pista sin romper la coherencia musical. Esa frase revela el objetivo de fondo: no producir solo música de fondo genérica, sino generar piezas con cambios, dramatismo, sorpresa, densidad lírica y control narrativo.
La mejora multilingüe es otro punto clave. ElevenLabs afirma que letras, voces y arreglos funcionan ahora de forma más fiable en el idioma en que se escriben. La página del producto Music v2 menciona soporte para varios idiomas, incluidos inglés, español, francés, alemán, japonés y muchos más. Esto es especialmente importante para mercados como el hispano, donde la música no puede limitarse a traducir palabras: debe respetar acento, métrica, fraseo, prosodia, cadencia y naturalidad vocal.
Aquí ElevenLabs parte con ventaja reputacional. La compañía ya había desarrollado modelos de voz multilingüe, como Eleven Multilingual v2, que en 2023 fue presentado con soporte para 29 idiomas. Esa experiencia en habla, entonación y expresividad vocal explica por qué su entrada en la música resulta especialmente relevante: cantar no es simplemente hablar con melodía, pero la síntesis vocal expresiva es una de las bases para que una canción generada por IA resulte creíble.
El gran cambio, sin embargo, no es solo técnico. Es comercial. ElevenLabs insiste en que Music v2 está entrenado únicamente con datos licenciados y que las canciones generadas están autorizadas para uso comercial, sin costes de sincronización ni retrasos por autorizaciones. En publicidad, vídeo corporativo, contenidos para redes, videojuegos, pódcast, branded content o campañas digitales, esa promesa ataca un problema histórico: licenciar música puede ser caro, lento y jurídicamente complejo.
Para una marca, la posibilidad de describir el estado de ánimo sonoro, el género, el tempo y la voz de marca, y recibir música utilizable sin negociar derechos de sincronización, puede cambiar los tiempos de producción. ElevenLabs presenta ElevenCreative Music precisamente con ese enfoque: música licenciada a escala para equipos de contenido, con instrucciones más próximas a un briefing creativo que a un simple prompt técnico.
La palabra “licenciado” es decisiva. La industria musical ha reaccionado con enorme desconfianza ante muchos modelos de IA generativa por el posible uso de catálogos protegidos sin permiso. Suno y Udio, dos de los nombres más conocidos en música generada por IA, han estado en el centro de debates y litigios sobre derechos de autor. ElevenLabs intenta diferenciarse mediante una estrategia de colaboración con titulares de derechos y modelos entrenados con datos autorizados. TechCrunch ya recogió en 2025 que ElevenLabs lanzaba su generador musical afirmando que estaba despejado para uso comercial.
Esa promesa, aun así, no elimina todas las preguntas. Los propios términos de Music establecen restricciones importantes: los usuarios no pueden introducir nombres reales o artísticos de intérpretes, compositores, títulos de canciones, álbumes, editoriales musicales o sellos, ni fragmentos sustanciales de letras que busquen referenciar una obra concreta. También se prohíbe generar salidas que infrinjan derechos de terceros o imiten la voz, imagen o características identificables de un artista de forma engañosa o que sugiera falsa asociación.
Estas restricciones muestran la tensión central de la música por IA. El usuario quiere decir “hazme algo como tal artista” porque así funciona buena parte del lenguaje cotidiano de la creatividad. Pero la industria necesita impedir que los modelos se conviertan en máquinas de imitación de artistas vivos, muertos o reconocibles. La frontera entre inspiración, estilo, referencia y copia será una de las grandes disputas legales y culturales de los próximos años.
Music v2 también apunta a un cambio de rol para los músicos. La IA no sustituye automáticamente la creación musical, pero sí modifica la distribución del trabajo. Un compositor puede usarla para prototipar ideas, probar arreglos, convertir una letra en una maqueta, explorar géneros, generar bases, ensayar versiones o acelerar fases tempranas. Un productor puede usarla para buscar texturas. Un creador de contenido puede obtener música original sin recurrir a librerías genéricas. Un desarrollador puede integrar generación dinámica en una aplicación. Una marca puede producir versiones adaptadas a mercados, formatos y campañas.
Pero este nuevo escenario también puede precarizar parte del ecosistema. La música de librería, la composición para publicidad de bajo presupuesto, los jingles, las bases para vídeo, las cortinillas, las piezas corporativas y los encargos funcionales son áreas vulnerables a la automatización. Si una agencia puede generar en minutos varias opciones aceptables, algunos encargos desaparecerán o se pagarán menos. El mercado no eliminará a los mejores compositores, pero sí puede comprimir el valor de trabajos intermedios.
La respuesta no será negar la tecnología, sino redefinir el valor humano. En un mundo donde cualquiera puede generar una canción funcional, el diferencial estará en criterio, dirección, identidad, emoción, letra, producción final, voz propia, interpretación, comunidad y relato artístico. La IA puede fabricar música; construir una carrera, una estética reconocible y una relación con el público seguirá siendo otra cosa. ElevenMusic intenta precisamente situarse en ese espacio participativo, donde artistas y fans no solo consumen, sino que remezclan, transforman y monetizan.
La plataforma ElevenMusic ya nació con esa lógica. ElevenLabs afirmó que más de 4.000 artistas independientes y emergentes estaban creando en la plataforma en el momento de su lanzamiento, y que los usuarios podían descubrir música, remezclarla cambiando género o tempo, empezar desde una letra, melodía o estado de ánimo y desarrollar una pista completa. La compañía también plantea un modelo de ingresos para artistas en función de interacción y elegibilidad.
Esa idea convierte la música en un material más líquido. Una canción ya no sería solo un objeto cerrado que se escucha, sino un punto de partida para remezclas, adaptaciones y participación de fans. Esto puede ampliar la vida de una obra, pero también desafía nociones tradicionales de autoría. ¿Quién es el autor de una versión creada por un fan con IA sobre una base autorizada? ¿Qué porcentaje corresponde al artista original, a la plataforma, al usuario y al modelo? ¿Cuándo una remezcla es una obra nueva y cuándo es explotación derivada? La tecnología avanza más rápido que las respuestas jurídicas.
La disponibilidad por API añade otra capa. Cuando Music v2 llegue plenamente a ElevenAPI, podrá integrarse en videojuegos, aplicaciones de edición, plataformas de contenido, herramientas de marketing, apps de bienestar, mundos virtuales o experiencias interactivas. La música dejará de ser un archivo estático para convertirse en una función generativa: una banda sonora que se adapta al usuario, al estado de ánimo, al ritmo de un juego, a una escena o a una campaña en tiempo real.
Ese futuro puede ser potente para videojuegos y experiencias inmersivas. Una escena de tensión puede generar música dinámica sin repetir bucles. Una app de fitness puede crear pistas adaptadas al ritmo del usuario. Un editor de vídeo puede producir música a medida para cada clip. Una marca puede generar versiones locales de una misma identidad sonora. Un creador puede experimentar con estilos sin contratar músicos para cada maqueta. Pero la facilidad también puede inundar el mercado de música indiferenciada.
La saturación será inevitable. Si generar música se vuelve barato y rápido, habrá más canciones, más pistas, más fondos sonoros, más jingles y más ruido. Plataformas de streaming, redes sociales y bibliotecas musicales deberán gestionar una abundancia extrema. El problema no será crear música, sino descubrir música relevante. En esa economía, la curaduría, la reputación y la autenticidad serán más importantes que nunca.
También habrá una batalla estética. Muchos modelos de música por IA tienden a producir resultados pulidos, correctos y previsibles. Suenan bien, pero pueden carecer de riesgo, imperfección, tensión humana o rareza. La música popular no avanza solo por perfección técnica; avanza por errores, accidentes, personalidad, escena, contexto social y ruptura. Music v2 promete más control y complejidad, pero el desafío será evitar que la generación masiva produzca una homogeneización sonora global.
La dimensión multilingüe puede ser una ventaja frente a esa homogeneización. Si la IA musical aprende a respetar idiomas, acentos, métricas y estilos locales, podría ampliar la creación en lenguas menos dominantes y facilitar que artistas o creadores produzcan en mercados distintos al anglófono. Para el español, el catalán, el francés, el portugués, el japonés o el alemán, la cuestión no será solo que el modelo pronuncie bien, sino que entienda cómo encaja la lengua en una melodía.
La regulación tendrá que mirar de cerca este campo. El etiquetado de contenidos generados por IA, la protección de derechos de imagen y voz, la trazabilidad de obras, el reparto de ingresos, la protección de menores y la transparencia en plataformas musicales serán temas recurrentes. Los términos de ElevenLabs ya anticipan parte de esas tensiones al prohibir usos en sectores sensibles, impedir referencias directas a artistas y limitar imitaciones engañosas.
Para el mercado publicitario, Music v2 puede ser especialmente atractivo. La música de campaña suele requerir velocidad, derechos claros, adaptación a formatos y coherencia con una marca. Una herramienta que genere piezas con briefing de mood, género, tempo y voz de marca puede reducir fricción. Pero también obligará a agencias y anunciantes a preguntarse cuándo una pieza generada por IA debe declararse, cómo se documenta su origen y qué garantías ofrece frente a reclamaciones futuras.
Para la industria musical tradicional, el dilema será más difícil. Rechazar por completo la IA puede dejar espacio a nuevos actores. Abrazarla sin reglas puede erosionar el valor de compositores, intérpretes y productores. La vía más probable será una negociación: modelos entrenados con licencias, reparto de ingresos, herramientas para artistas, límites a la imitación, sistemas de detección y nuevas formas de participación de fans.
La propia ElevenLabs parece entender que la legitimidad será tan importante como la calidad técnica. Music v2 no se presenta solo como “mejor sonido”, sino como parte de un ecosistema con datos licenciados, uso comercial, restricciones de imitación, plataformas diferenciadas y modelos de monetización. Esa arquitectura busca responder a una pregunta que perseguirá a toda la IA creativa: no basta con que la máquina pueda crear; importa con qué datos aprendió, quién cobra, quién conserva derechos y quién responde si hay conflicto.
La conclusión es clara: Music v2 marca una nueva etapa en la música generativa porque intenta unir calidad, control, idiomas, licencias y distribución. ElevenLabs no quiere limitarse a ofrecer un generador de canciones; quiere ocupar una parte de la infraestructura creativa de la música digital. Quiere servir al músico que prototipa, al fan que remezcla, al desarrollador que integra audio dinámico y a la marca que necesita piezas sonoras sin esperas legales.
La pregunta de fondo ya no es si la IA puede producir música convincente. Esa fase está quedando atrás. La pregunta es qué tipo de ecosistema musical queremos construir cuando crear una canción completa sea tan fácil como escribir una instrucción. Si la respuesta respeta derechos, remunera talento, amplía posibilidades creativas y mantiene espacio para la voz humana, la IA puede convertirse en una herramienta poderosa. Si se limita a abaratar producción y llenar internet de música funcional sin alma ni autoría clara, el coste cultural será alto.
Music v2 llega como demostración técnica, pero también como advertencia industrial: la música entra en la misma transición que ya han vivido el texto, la imagen y el vídeo. La abundancia artificial ha llegado al sonido. Ahora empieza la verdadera prueba: convertir esa abundancia en valor, no en ruido.