Cambia tu look gracias a la IA: Google Gemini ahora te permite editar imágenes fácilmente
La última actualización de Google Gemini permite editar fotos de personas, y también de otros tipos, con resultados bastante buenos.
Hace poco que ChatGPT es capaz de editar imágenes de manera realista, y Google no quiere quedarse atrás en la carrera de la IA. Ahora bien, nuestras pruebas indican que Gemini no está a la altura de ChatGPT por el momento.
La nueva actualización se denomina Gemini 2.5 Flash Image (nombre clave nano-banana) y permite, por ejemplo, cambiar la ropa de una persona o el fondo por otro diferente.
También añadir o quitar objetos de las fotos, e incluso combinar elementos de imágenes de manera natural. Nosotros hemos realizado una prueba, combinando tres fotografías mediante el siguiente comando:
Combina estas tres fotos. El chico de la camisa roja de cuadros debe llevar el traje azul, y tener como fondo la foto de la oficina.
El resultado es aceptable en cuando a realismo, pero el rostro no se parece mucho al ejemplo proporcionado:
En nuestra experiencia, Gemini 2.5 Flash Image no ha sido tan bueno como ChatGPT. De hecho, empleando fotos con perspectivas complejas hemos recibido algunos resultados muy malos, sin coherencia en las proporciones.
Eso sí, Google ofrece algunas optimizaciones, como la consistencia de los personajes. Si creamos varias imágenes mediante plantillas con la misma persona, Gemini se esfuerza porque salga lo más parecido posible en todas ellas.
El modelo no acepta fotos de niños, por seguridad, pero tiene pocas limitaciones aparte de esa. Es capaz de hacernos más atractivos, cambiar el color de nuestra piel o poner músculos, si bien nunca generará imágenes sexualmente explícitas.
El objetivo parece muy claro: sustituir a los diseñadores gráficos. Aunque los virales de aplicar diferentes estilos a nuestras imágenes con IA han logrado mucha popularidad, los esfuerzos de Google siempre apuntan a reducir los costes de las empresas.
Gemini también interpreta esquemas
Gemini 2.5 Flash Image también es capaz de entender esquemas, fórmulas matemáticas y otros problemas visuales, razonando para dar una respuesta.
Por ejemplo, en esta prueba de razonamiento ha funcionado bien:
Por ahora, la nueva edición está en la herramienta Google AI Studio, orientada a profesionales. Cualquiera puede acceder y generar algunas imágenes, aunque de manera limitada, si no tenemos un plan de pago.
Suponemos que es cuestión de tiempo que llegue a la versión general de Gemini, pues la IA evoluciona rápido, y las funciones que era de pago pasan a ser gratuitas a medida que llegan otras más avanzadas.
Web: Google AI Studio
Cómo activar un "Chat temporal" en ChatGPT
- Ver Comentarios