Google ha dado un salto notable en la edición de imágenes generadas por IA con su nueva versión del modelo integrado en la app Gemini: Gemini 2.5 Flash Image, apodado “nano banana”. Lanzado el lunes 26 de agosto de 2025, este modelo apunta a superar a herramientas de la competencia como las de OpenAI en precisión y coherencia visual2.
La clave del éxito de nano banana es su capacidad para ejecutar ediciones avanzadas sin comprometer el parecido del sujeto. Ya sea una persona, su mascota u otros elementos, el modelo conserva los detalles esenciales incluso al cambiar escenarios, estilos o fondos. Este enfoque enfrenta uno de los mayores retos de la IA en imágenes: la tendencia a introducir inconsistencias sutiles que distorsionan el reconocimiento.
Gemini 2.5 Flash Image ofrece opciones como “edición multiturno”, que permite modificar progresivamente partes específicas sin afectar otros elementos; y una función de “style mixing”, que aplica texturas o patrones de una imagen a otra, como vestir botas con un diseño floral.
Además, los usuarios pueden combinar fotos para crear escenas nuevas, por ejemplo, integrar una foto personal con una de su mascota en un entorno imaginativo como una carretera o una sala nueva. Todo ello está disponible para todos los usuarios de Gemini, tanto gratuitos como de pago, y se implementa globalmente desde hoy.
Google también ha reforzado la transparencia: cada imagen generada lleva una marca visible y otra digital imperceptible llamada SynthID, lo que ayuda a identificar contenidos creados por IA. Esta implementación responde en parte a críticas previas sobre la generación de imágenes inapropiadas o inexactas por parte de Gemini.
En declaraciones citadas por TechCrunch, Nicole Brichtova, líder de producto en DeepMind, destaca que el modelo “hace un trabajo mucho mejor en unir ediciones de forma fluida” y es ya usable para cualquier propósito. En plataformas especializadas como LMArena, el modelo ha sido evaluado como de vanguardia, evidenciando su eficacia técnica.
No obstante, esta sofisticación tiene un lado oscuro: mientras OpenAI expresionó cómo su generador de imágenes disparó el uso de ChatGPT, Google compite por cerrar esa brecha. En julio, se reportaron 450 millones de usuarios mensuales de Gemini, frente a más de 700 millones semanales de ChatGPT, lo que sugiere una adopción inferior y la necesidad de innovar para atraer más audiencia.
Con Gemini 2.5 Flash Image (nano banana), Google redefine el estándar en edición de imágenes por IA, combinando precisión, creatividad y seguridad. La capacidad de preservar la identidad visual durante ediciones complejas y la inclusión de marcas de autenticidad sitúan a la plataforma en una posición competitiva sólida frente a competidores como OpenAI. El reto ahora será traducir esta innovación técnica en una mayor adopción entre usuarios y desarrolladores.
Abre un paréntesis en tus rutinas. Suscríbete a nuestra newsletter y ponte al día en tecnología, IA y medios de comunicación.