Gemini ya edita imágenes como ChatGPT ¡No te lo pierdas!

Si te quedaste flipando cuando ChatGPT y DALL-E te permitían convertir tus selfies en obras de arte al estilo Studio Ghibli o crear memes instantáneos, prepárate, porque Google no se iba a quedar de brazos cruzados viendo cómo OpenAI se llevaba toda la gloria creativa. La compañía de Mountain View acaba de anunciar oficialmente (el 8 de mayo, aunque ya se está desplegando) que su IA estrella, Gemini, ahora puede editar imágenes que subas o que ella misma genere, plantando cara a las funciones que hicieron viral a su rival.

Sí, has oído bien. Eso de cambiar el fondo de una foto, añadirle un ovni a tu paisaje de vacaciones o, por qué no, cambiarte el color del pelo a un azul eléctrico o ponerle una elegante chistera a tu perro, ya es posible con la IA de Google. ¡La guerra de las IA creativas está que arde!

Gemini se pone el mono de artista digital: ¿Qué puedes hacer?

La idea es sencilla pero potente: tú le das una imagen a Gemini (una tuya o una que haya generado previamente) y, mediante prompts de texto, le dices qué quieres modificar. La IA intentará mantener el sujeto principal de la foto intacto mientras aplica tus «genialidades». Algunos ejemplos de lo que ya se puede hacer (según Google y los primeros vistazos de medios como 9to5Google):

Cambios de escenario: «Pon esta foto mía en una playa de Bali» o «Cambia el fondo de esta imagen a un paisaje espacial«.
Añadir o quitar elementos: «Añade un gato negro durmiendo en este sofá» o «Quita a esa persona del fondo«.
Transformaciones de sujetos: «Ponle una gorra de béisbol a este perro» o «Convierte este coche en un descapotable rojo«.
Cambios de look: «Cambia el color de mi pelo a rubio platino» o «Ponme una chaqueta de cuero en esta foto«.
Estilos artísticos: Y sí, aunque no lo mencionan como el foco principal, la capacidad de aplicar estilos («haz que esta foto parezca un cuadro impresionista«) también está ahí.

La clave, como siempre con estas IA, es ser claro y específico con tus prompts. Y si no sale a la primera, ¡a iterar! Puedes ir dándole nuevas instrucciones a Gemini sobre la imagen ya modificada hasta que quede a tu gusto.

Flexibilidad y potencia: edición multi-paso y más

Google destaca que esta nueva función de Gemini es bastante flexible. Por ejemplo, puedes empezar con un prompt de texto para generar una imagen inicial, y luego subir tú una o varias imágenes de referencia para darle a Gemini una idea más exacta de lo que buscas en el resultado final. Además, esto se une a la reciente capacidad de Gemini para cargar varias imágenes a la vez, lo que abre un abanico de posibilidades para creaciones más complejas.

La magia (y la técnica) detrás: Gemini 2.0 Flash y la marca de agua SynthID

Para los más techies, la edición de imágenes en Gemini se apoya en el modelo Gemini 2.0 Flash. Aunque esta funcionalidad es accesible usando cualquiera de los modelos de Gemini disponibles en la app móvil o la web, Google presume de que «Flash» trae mejoras en la calidad visual, una representación del texto más precisa y, muy importante, una reducción significativa de los bloqueos por filtros de seguridad. Esto último es un alivio, porque a veces estas IA son más papistas que el Papa con lo que te dejan generar.

Y como no todo es jauja en el mundo de las imágenes generadas por IA, Google sigue los pasos de Adobe Firefly e implementa una marca de agua digital llamada SynthID. Todas las imágenes creadas o editadas con la IA de Gemini llevarán esta marca (discretamente en la esquina inferior derecha) para que se sepa que han sido «tocadas» por una inteligencia artificial. Un intento de ponerle «chip» anti-fakes al asunto.

Google vs. OpenAI: La batalla por el pincel digital

No hay que ser un lince para ver que esta novedad de Gemini es una respuesta directa a la popularidad de las funciones de edición de imágenes de DALL-E en ChatGPT. Google, que según la fuente «tardó un mes» en reaccionar (probablemente desde el boom de alguna tendencia específica), no quiere perder comba en el terreno de la IA creativa. La carrera por ofrecer la IA más potente, versátil y, por qué no, divertida, está en su punto más álgido.

Conclusión: Gemini saca la artillería creativa (¡A probarla!)

La llegada de la edición de imágenes avanzada a Gemini es una excelente noticia para los usuarios y un nuevo capítulo en la fascinante (y a veces un poco loca) evolución de la IA generativa. Aunque tarde un poco más que la competencia en algunos frentes, Google demuestra que tiene músculo para plantar cara.

Ahora te toca a ti: ¿vas a probar a cambiarte el look con Gemini? ¿Qué ediciones locas se te ocurren? ¡Cuéntanoslo en los comentarios y comparte tus creaciones (y los inevitables fails de la IA)! Y, por supuesto, para estar al día de todas las novedades del universo IA, sigue Gurú Tecno. Nos vemos en YouTube, Instagram y Facebook.

¡Google contraataca! Gemini ya edita imágenes como ChatGPT: así puedes cambiar tu pelo o ponerle sombrero a tu gato

Gemini se pone el mono de artista digital: ¿Qué puedes hacer?

Flexibilidad y potencia: edición multi-paso y más

La magia (y la técnica) detrás: Gemini 2.0 Flash y la marca de agua SynthID

Google vs. OpenAI: La batalla por el pincel digital

Conclusión: Gemini saca la artillería creativa (¡A probarla!)

Brillo extremo sin miedo al ‘quemado’: Así funciona la tecnología MLA que ha salvado a las pantallas OLED

El fin de la degradación: Las baterías de estado sólido saltan a la electrónica de consumo y cambian las reglas

NVIDIA rompe todos los límites: La nueva GPU Rubin aplasta a Blackwell con 336 mil millones de transistores

Apple la lía con iOS 27: El código revela por error el secreto del iPhone Ultra plegable

¡Google contraataca! Gemini ya edita imágenes como ChatGPT: así puedes cambiar tu pelo o ponerle sombrero a tu gato

Gemini se pone el mono de artista digital: ¿Qué puedes hacer?

Flexibilidad y potencia: edición multi-paso y más

La magia (y la técnica) detrás: Gemini 2.0 Flash y la marca de agua SynthID

Google vs. OpenAI: La batalla por el pincel digital

Conclusión: Gemini saca la artillería creativa (¡A probarla!)

Brillo extremo sin miedo al ‘quemado’: Así funciona la tecnología MLA que ha salvado a las pantallas OLED

El fin de la degradación: Las baterías de estado sólido saltan a la electrónica de consumo y cambian las reglas

NVIDIA rompe todos los límites: La nueva GPU Rubin aplasta a Blackwell con 336 mil millones de transistores

Apple la lía con iOS 27: El código revela por error el secreto del iPhone Ultra plegable

NVIDIA rompe todos los límites: La nueva GPU Rubin aplasta a Blackwell con 336 mil millones de transistores

Google acelera en la guerra de la IA: Lanza Gemini 3.6 Flash y un modelo blindado para ciberseguridad

El pánico a la IA vacía las aulas virtuales: Australia impone exámenes orales y presenciales para salvar sus títulos