
Si pensabas que la guerra de la Inteligencia Artificial generativa ya estaba que ardía, espera a ver lo que Google ha cocinado para su Google I/O 2025. Hoy mismo, la compañía de Mountain View ha sacado la artillería pesada y ha presentado sus nuevas y mejoradas armas para la creación de contenido multimedia: Veo 3, su modelo para generar vídeo, e Imagen 4, para la creación de imágenes. Y ojo, porque vienen con novedades que, según Google, van a hacer que la competencia (sí, OpenAI, te estamos mirando a ti y a tu combo ChatGPT/DALL-E/Sora) se replantee muy seriamente su existencia.
Especialmente Veo 3, que llega con una capacidad que podría cambiarlo todo: ¡generar vídeos con efectos de sonido, ruido de fondo e incluso DIÁLOGOS coherentes entre personajes! Si creías que la IA ya era la leche creando clips mudos, prepárate, porque ahora Google quiere que sus vídeos tengan alma… y banda sonora propia.
Veo 3: La IA de vídeo que no solo ve, ¡También HABLA, SUENA y DIRIGE!
Sin duda, la gran estrella de los modelos generativos de Google para este I/O es Veo 3. Y no es para menos, porque su principal novedad es una auténtica revolución:
- ¡Sonido y diálogos nativos en tus vídeos IA! Esta es la funcionalidad que Google está vendiendo como «nunca antes vista» de forma tan integrada. Ya no solo le pides a la IA que cree una escena en vídeo, sino que puedes detallarle qué efectos de sonido quieres (el viento entre los árboles, el tráfico de una ciudad), qué ruido de ambiente debe tener, e incluso qué deben decir los personajes que aparezcan y cómo deben sonar sus voces. Imagina crear un corto animado donde tú escribes los diálogos y Veo 3 se encarga del resto. Se acabó el generar un vídeo mudo y luego volverte loco buscando efectos de sonido en librerías. Veo 3 te lo da todo en uno, ¡como el menú del día pero del futuro cinematográfico!.
- Calidad mejorada y realismo: Aunque Veo 2 ya era capaz de generar vídeos de hasta 2 minutos en resolución 4K, se espera que Veo 3 dé un salto importante en cuanto a realismo, coherencia de movimiento y calidad visual general.
- Motor de «Flow»: Veo 3 no viene solo. Es el músculo detrás de una nueva herramienta de IA también anunciada en el I/O llamada Flow. Esta plataforma promete combinar el poder de Veo 3, Imagen 4 y Gemini para permitir a los usuarios crear clips cinematográficos, editar escenas complejas y obtener resultados de nivel profesional con mucha más facilidad.
Pero, como siempre con lo más top de Google, hay una pequeña pega (o gran pega, según se mire): la disponibilidad de Veo 3 será, de momento, bastante limitada. Llegará a la app de Gemini en forma de versión beta, pero será EXCLUSIVA para los usuarios que paguen el misterioso plan «Google AI Ultra» (un nuevo tier premium que Google parece estar preparando) y, para empezar, solo estará disponible en Estados Unidos. El futuro siempre mola más si tienes la cartera llena y vives en el sitio adecuado, ¿verdad, Google?.
Imagen 4: Creando fotos a la velocidad del rayo y con calidad de museo (o casi)
Si Veo 3 es la revolución en vídeo, Imagen 4 quiere serlo en la creación de imágenes estáticas. Las mejoras son sustanciales:
- Velocidad de vértigo: Google presume de que una de las versiones de Imagen 4 es hasta 10 VECES más rápida que su predecesora, Imagen 3. Menos tiempo esperando, más tiempo creando (o pidiéndole a la IA que cree por ti).
- Calidad y detalle para «fliparlo»: La nueva generación promete un «detalle increíble» en prácticamente cualquier escenario y estilo, incluyendo imágenes abstractas. Y con una resolución de hasta 2K, lo que la hace perfectamente válida para impresiones o presentaciones de alta calidad.
- Adiós al cuadrado (si quieres): Imagen 4 ahora permite generar contenidos en diferentes relaciones de aspecto, dándote más flexibilidad para tus creaciones.
- Textos que SÍ se entienden: Una de las grandes mejoras es la capacidad para generar imágenes con texto legible y con buena ortografía. Ideal para crear tarjetas de visita, invitaciones, carteles o memes sin que parezca que los ha escrito un mono con un teclado.
La buena noticia es que Imagen 4 está disponible desde ya en la aplicación de Gemini. Además, Google ha anunciado que se integrará progresivamente en otras plataformas y herramientas de su ecosistema, como Slides, Vids (su nueva app de creación de vídeo para Workspace) y Docs.
SynthID al rescate: Google quiere que sepas si te la están colando (con su propia IA)
Con tanto poder generativo, la preocupación por los deepfakes y la desinformación es real. Google lo sabe, y por eso ha reforzado su apuesta por la transparencia:
- Todo el contenido que se cree a partir de Imagen 4 (y se espera que Veo 3 también cuando esté más disponible) llevará la marca de agua digital invisible SynthID.
- Y aquí la novedad importante: Google ha anunciado en el I/O una nueva herramienta llamada SynthID Detector. Los usuarios podrán subir imágenes (o fragmentos de ellas) a esta herramienta para verificar si se trata de contenido generado por la Inteligencia Artificial de Google. Un intento de Google por ser el poli bueno de la IA generativa… al menos con las ‘armas’ que ellos mismos fabrican. Veremos si sirve de algo contra el tsunami de fakes que se nos viene encima.
Google vs. OpenAI: ¿Quién lleva la delantera en la IA que «lo peta» de verdad?
No hay duda de que estos anuncios son un derechazo de Google en su particular combate con OpenAI. La capacidad de Veo 3 para generar vídeo CON audio y diálogos de forma nativa es, de momento, un diferenciador clave frente a modelos como Sora, que aún no ofrecen esta integración de manera tan directa al usuario final (o al menos, no tan publicitada).
La afirmación de que estas funciones son «imposibles para ChatGPT» es, evidentemente, parte del marketing agresivo de Google. OpenAI y otros no se van a quedar quietos. Pero hoy por hoy, Google ha puesto sobre la mesa unas herramientas que, sobre el papel, parecen llevar la delantera en ciertos aspectos muy concretos y espectaculares.
Conclusión Gurú Tecno: Google saca músculo en la creación multimedia con IA (pero pasa por caja)
Google ha llegado al I/O 2025 con la intención de demostrar que en la carrera de la IA generativa, ellos también tienen mucho que decir (y mostrar). Veo 3 y su capacidad para crear vídeos sonorizados y con diálogos es una auténtica pasada y abre un nuevo mundo de posibilidades. Imagen 4, con su velocidad y calidad mejorada, también es una evolución muy bienvenida.
El SynthID Detector es un paso necesario (aunque veremos su efectividad real) hacia un uso más responsable de estas tecnologías. La «pega», como siempre, es la disponibilidad limitada de lo más top (Veo 3) a planes de pago y geografías concretas.
¿Estamos ante un nuevo paradigma en la creación de contenido multimedia o solo ante la siguiente y más espectacular ronda de la guerra de las IA? El tiempo, nuestras pruebas exhaustivas cuando podamos echarle el guante, y sobre todo, lo que haga la competencia, lo dirán. De momento, ¡Google ha repartido juego y del bueno!
¿Qué te parecen estas nuevas IA de Google? ¿Te ves creando vídeos con diálogos generados por Veo 3? ¡Cuéntanos tu opinión en los comentarios! Y no te despegues de gurutecno.com para la cobertura más completa y sin pelos en la lengua de todo lo que se cuece en el Google I/O. Estamos en YouTube, Instagram y Facebook.