Ir al contenido principal

¡Adiós, Photoshop! 'Nano Banana' de Google: La IA que revoluciona la edición de imágenes

¡Adiós, Photoshop! 'Nano Banana' de Google: La IA que revoluciona la edición de imágenes

27 de agosto de 2025

Durante semanas, el enigmático 'Nano Banana' estuvo generando expectación tras aparecer de forma anónima en la plataforma de evaluación colaborativa LMArena. Los expertos sospechaban de Google, dada la calidad del modelo y la costumbre de la compañía de usar nombres de frutas para sus proyectos. Recientemente, Google ha confirmado los rumores: este modelo de Google DeepMind ha sido integrado en su ecosistema, ofreciendo capacidades de edición de imágenes que muchos consideran revolucionarias.

Líder Indiscutible en LMArena: ¡Una Ventaja Colosal!

En la plataforma LMArena.ai/leaderboard/image-edit, donde se comparan sistemas de IA, Gemini 2.5 Flash Image Preview se ha posicionado como el modelo número 1 a nivel mundial en edición de imágenes. Su superioridad es tal que la diferencia en puntuación Elo entre el primer y el segundo lugar es casi la misma que entre el segundo y el décimo. Con una tasa de victorias del 70% frente a sus competidores y un puntaje de 0.89 en los benchmarks GenEval (superando a DALL-E 3 que obtuvo 0.76), la comunidad lo ha aclamado como "posiblemente el mejor hasta la fecha para editar imágenes".

Fortalezas que Desafían el Statu Quo

Este modelo ha sido diseñado para transformar la forma en que interactuamos con las imágenes, ofreciendo un abanico de funcionalidades impresionantes:

  • Edición por Lenguaje Natural: Permite transformar imágenes mediante simples instrucciones de texto, sin necesidad de complejas capas o herramientas manuales, logrando resultados coherentes y estéticamente logrados.

  • Consistencia de Personajes Inigualable: Mantiene la apariencia de personas, mascotas u objetos de forma coherente a través de múltiples ediciones y escenarios. Esto es particularmente útil para la ilustración, la publicidad y, según algunos, un cambio monumental para la generación de video.

  • Edición en Múltiples Pasos: Puedes refinar una imagen paso a paso, alterando partes específicas mientras se preserva el resto de la composición.

  • Fusión y Mezcla de Diseños: Permite combinar elementos de diferentes imágenes, reestilizar entornos o aplicar el estilo de una imagen a un objeto en otra, fusionando varias fotos en una nueva escena realista.
  • Velocidad Impresionante: Genera imágenes de alta calidad de forma casi instantánea.
  • Casos de Uso Variados: Desde mejorar fotografías borrosas, generar nuevas perspectivas de productos, contextualizarlos en diferentes entornos, hasta imaginar nuevos complementos o explorar ideas creativas, el potencial es enorme.

Debilidades y Áreas de Oportunidad

A pesar de sus capacidades avanzadas, 'Nano Banana' aún presenta algunas limitaciones:

  • Censura y Restricciones: El modelo es considerado "insanamente censurado" en la aplicación de Gemini, especialmente al trabajar con imágenes de personas reales o celebridades, lo que puede dificultar la generación de contenido aparentemente inofensivo.
  • Renderizado de Texto: Aunque puede incorporar tipografías a partir de referencias, no es tan bueno como otros modelos en el renderizado de texto legible dentro de las imágenes.
  • Resolución Limitada: Las imágenes generadas directamente en Gemini tienen una resolución de 1024x1024 píxeles, lo cual puede ser insuficiente para usos profesionales o de impresión sin un escalado posterior.
  • Fallos Anatómicos: En algunos casos, puede presentar errores en la representación de manos y detalles anatómicos en ángulos complicados.
  • Transferencia de Estilos: Aunque ofrece versatilidad, algunos usuarios han reportado que no es tan efectivo en la transferencia o el cambio de estilos como versiones anteriores.

¿Dónde Probar Esta Revolución?

Puedes experimentar con las capacidades de 'Nano Banana' en varias plataformas:

  • Aplicación de Gemini (Google): Disponible gratuitamente para todos los usuarios, tanto de pago como gratuitos a nivel mundial.
  • Google AI Studio (aistudio.google.com): Accesible para desarrolladores, y se ha reportado que su uso en AI Studio tiene significativamente menos censura en comparación con la aplicación de Gemini.
  • LMArena: Fue su lugar de origen, aunque el acceso es aleatorio.
  • Freepik: Esta plataforma de terceros ya ha incorporado el modelo en su asistente, ofreciendo una opción más profesional, especialmente para trabajar con imágenes de referencia de personas reales y cambios de estilo sin las restricciones de Gemini. Las suscripciones Premium Plus de Freepik permiten generar imágenes de modo ilimitado y escalar la resolución con Magnific.
  • Google Fotos: Se espera que esté disponible próximamente (en las próximas semanas) para dispositivos Android e iOS en la aplicación de Google Fotos.

El Impacto en Photoshop: ¿El Fin de una Era?

'Nano Banana' representa una amenaza real para el statu quo dominado por Photoshop. Su capacidad para interpretar instrucciones en lenguaje natural y generar imágenes de alta calidad en segundos, sin la necesidad de capas o herramientas manuales, promete agilizar procesos creativos que antes tomaban horas.

Esta inmediatez, personalización y facilidad de uso no solo desafía la dependencia de la destreza manual en la edición gráfica, sino que también democratiza el acceso a la edición profesional. Aunque Photoshop sigue siendo una herramienta fundamental para flujos de trabajo profesionales que exigen un control milimétrico, 'Nano Banana' está redefiniendo las expectativas de rapidez y accesibilidad, marcando un paso hacia herramientas cada vez menos dependientes de la habilidad manual.

En definitiva, Gemini 2.5 Flash Image Preview (Nano Banana) no es solo una mejora incremental; es un salto gigantesco en la edición de imágenes con IA. Su llegada promete una oleada de innovación que podría transformar radicalmente la forma en que creamos y editamos contenido visual, invitando a todos a explorar las infinitas posibilidades que ofrece.

Resumen de Notebook

Comentarios

Entradas populares de este blog

Diseñando imágenes y videos ilimitados con RoboNeo

  Diseñando imágenes y videos ilimitados con RoboNeo 23 de julio de 2025 El día 22 de julio de 2025 RoboNeo , de la compañía china Xiamen Meitu Technology, presenta su última actualización.  En esta entrada presentamos algunos ejercicios realizados con esta herramienta. Diseño de imágenes Es importante, si no sabes chino, que cambies el idioma a ingles haciendo clic sobre tu perfil y seleccionando "System Settings".  A continuación, presentamos las acciones que hemos realizado y los resultados obtenidos.  Prompt . Dibuja una linda bruja tomando café en París Con la herramienta AI editing cambiamos el color del sombrero, haciendo inpainting sobre el sombrero y luego escrubiendo "Sombrero azul". Prompt . Crea dos imágenes de una linda bruja en una calle de México Seleccionamos la segunda y con la herramienta "Add to Chat" le pedimos "Haz esta imagen estilo realista" Con AI Extender ampliamos la segunda bruja Creando videos Prompt . Haz un video de...

Di Adiós a las Líneas de Tiempo Aburridas: Genera Historias Visuales con IA en Segundos

Di Adiós a las Líneas de Tiempo Aburridas: Genera Historias Visuales con IA en Segundos 13 de agosto de 2025 ¿Recuerdas esas interminables horas en el colegio (o en la oficina) intentando crear una línea de tiempo? Buscar fechas, resumir eventos, encontrar imágenes decentes que no tuvieran una marca de agua gigante... El resultado solía ser una aburrida sucesión de puntos en una línea que no inspiraba a nadie. Esos días han terminado. Hoy, estamos increíblemente emocionados de presentar una herramienta que va a revolucionar la forma en que creas, visualizas y compartes la historia. Te presentamos el  Generador de Líneas de Tiempo con Inteligencia Artificial , una aplicación web que hemos diseñado para transformar cualquier tema histórico en una obra de arte interactiva y funcional en menos de un minuto. ¿Qué es el Generador de Líneas de Tiempo y por qué te encantará? Imagina esto: escribes "La Carrera Espacial", seleccionas un estilo artístico como "Foto Antigua", ...

HunyuanVideo-Avatar - Vídeo digital controlado por voz humana

HunyuanVideo-Avatar - Vídeo digital controlado por voz humana 28 de julio de 2025 En los últimos años se ha presenciado un progreso significativo en la animación humana basada en audio. Sin embargo, persisten desafíos críticos en (i) generar videos altamente dinámicos mientras se preserva la consistencia del personaje, (ii) lograr una alineación precisa de las emociones entre los personajes y el audio, y (iii) habilitar la animación basada en audio de múltiples personajes. Para abordar estos desafíos, proponemos HunyuanVideo-Avatar, un modelo basado en transformador de difusión multimodal (MM-DiT) capaz de generar simultáneamente videos dinámicos, controlables por emociones y con diálogos de múltiples personajes. Concretamente, HunyuanVideo-Avatar introduce tres innovaciones clave: (i) Un módulo de inyección de imágenes de personajes está diseñado para reemplazar el esquema convencional de condicionamiento de personajes basado en la adición, eliminando el desajuste de condiciones inher...