El gigante tecnológico Google continúa compitiendo por el primer puesto en la carrera de la inteligencia artificial. En esta ocasión ha presentado de forma oficial Nano-Banana, su modelo de generación de imágenes mediante inteligencia artificial que constituye el núcleo de su nuevo modelo Gemini 2.5 Flash Image. Presentada a finales de agosto de 2025, la funcionalidad ya está disponible tanto en la versión web como en la aplicación móvil de Gemini, y es accesible para usuarios gratuitos y suscriptores, consolidando la posición de Google en uno de los primeros puestos en la carrera por la IA.
Este modelo destaca por su capacidad para realizar ediciones paso a paso sin comprometer la coherencia visual. Hasta ahora, los editores de imágenes basados en IA tendían a deformar rasgos o distorsionar elementos tras sucesivas modificaciones. Nano-Banana se presenta como el salvador de la edición de imágenes mediante IA por su habilidad para preservar rasgos, expresiones y detalles incluso al cambiar escenarios, vestimenta o estilo, algo muy difícil de conseguir con los modelos preexistentes.
La tecnología ha sido desarrollada por Google DeepMind y se ha posicionado rápidamente en los más altos niveles de desempeño, alcanzando las primeras posiciones en los rankings de evaluación técnica como los de LMArena. Su capacidad de combinar inteligentemente varias imágenes en una sola composición coherente y responder a comandos en lenguaje natural representa un avance significativo. Esto permite pasar de una idea verbal a una transformación visual con rapidez, sin necesidad de conocimientos de diseño gráfico o de prompts y sin utilizar complejas herramientas.
No obstante, y pese a su sofisticación, el sistema todavía no cubre funciones básicas como el recorte preciso de imágenes según una proporción concreta. Esta limitación, aunque técnica, ha sido objeto de críticas dentro del ámbito especializado, aunque se espera que esta funcionalidad llegue en futuras actualizaciones.