Info
Hailuo es la familia de modelos de generación de vídeo basada en IA, desarrollada por la compañía china MiniMax. Recientemente, la empresa ha lanzado su nueva versión más avanzada, Hailuo 2.3. Esta plataforma compite directamente con Sora de OpenAI y Kling, y se ha hecho un nombre por su notable capacidad para interpretar la física del mundo real y generar movimientos complejos y fluidos.
La plataforma se ofrece ahora en dos versiones, Hailuo 2.3 (para máxima calidad) y Hailuo 2.3 Fast (para mayor velocidad), y funciona como un «Agente Multimedia» que puede crear contenido a partir de texto (Text-to-Video) o imágenes (Image-to-Video).
Sus funcionalidades clave incluyen:
- Generación de vídeo en 1080p: produce clips de alta definición de hasta 10 segundos de duración.
- Comprensión avanzada del movimiento: destaca en la creación de movimientos corporales fluidos (como bailes o acrobacias), expresiones faciales sutiles y la física de objetos.
- Control de estilizado: ofrece un gran rendimiento en diversos estilos artísticos, incluyendo anime, ilustración, pintura tradicional china (ink wash) y CG de videojuegos.
- Entrada multimodal: acepta tanto descripciones de texto como imágenes de referencia para animar o crear escenas.
Pros
- Calidad del movimiento y física: su principal ventaja competitiva es el realismo del movimiento. Donde otros modelos fallan, Hailuo 2.3 maneja con gran fluidez la física de los cuerpos y las transiciones de cámara
- Consistencia de personajes: es notablemente bueno manteniendo la identidad de un personaje, su atuendo y los detalles faciales (microexpresiones) a lo largo de un clip.
- Velocidad y coste (Versión Fast): el modelo «Fast» está optimizado para ser hasta un 50% más barato y mucho más rápido, haciéndolo ideal para la iteración rápida de conceptos o la creación de contenido en lote.
- Disponibilidad y API: a diferencia de Sora (aún en beta cerrada), Hailuo 2.3 ya está disponible a través de su sitio web, aplicación móvil y, fundamentalmente, vía API, lo que permite su integración en otras plataformas.
Contras
- Límite de duración: al igual que sus competidores, sigue limitado a clips muy cortos (10 segundos como máximo), lo que dificulta la creación de narrativas largas sin una edición posterior intensiva.
- Coherencia temporal: aunque es bueno en el movimiento, algunas reseñas técnicas indican que puede tener dificultades con la coherencia temporal perfecta en escenas muy complejas o abstractas.
- Adherencia al prompt: puede capturar el «ambiente» o «estilo» de un prompt complejo, pero a veces se desvía de los detalles más específicos o de la física más precisa si la petición es muy abstracta.
Precio
Modelo freemium