
Desde hace unas semanas he estado probando Whisk, el nuevo generador de imágenes de Google con inteligencia artificial, lanzado por Google Labs en diciembre de 2024. Quería ver por mí mismo si realmente valía la pena y si podía convertirse en una alternativa útil a los generadores de imágenes que ya conocemos. Y la verdad es que me ha sorprendido más de lo que esperaba.
A diferencia de otros generadores que dependen por completo de los prompts (esas descripciones que hay que escribir con precisión casi quirúrgica), Whisk propone algo distinto: un enfoque “visual-first”, donde lo importante son las imágenes que le das, no lo bien que redactes el texto. Esto hace que la experiencia sea mucho más intuitiva, casi como un juego.
Qué es Whisk y por qué me llamó la atención
Whisk, también conocido como el generador de imágenes de Google Whisk, forma parte de los experimentos de Google Labs, y su objetivo es facilitar la exploración visual rápida. Es decir, te permite probar combinaciones de estilos, fondos y sujetos sin tener que escribir ni una sola palabra, si no quieres. Su lema lo resume bien: “Prompt less, play more” —menos texto, más juego—.
Personalmente, esto me pareció un soplo de aire fresco, porque suelo aburrirme de probar prompts hasta dar con uno que funcione. Con Whisk, basta con subir tres imágenes: una del sujeto principal, otra del fondo o la escena, y una más para definir el estilo artístico. A partir de ahí, el sistema genera algo completamente nuevo mezclando los tres elementos.
Por ejemplo, subí una foto de una modelo posando en un entorno urbano, una escena de selva tropical y una pintura al estilo acuarela. El resultado fue increíble: la modelo apareció integrada en medio de la jungla, con la luz filtrándose entre los árboles y todo el entorno transformado en una ilustración con textura de acuarela. No era una simple mezcla, sino una reinterpretación artística coherente y muy natural.

Algo que me llamó especialmente la atención fue la consistencia con la que Whisk respeta al personaje principal en cada imagen. Incluso usando fotos personales, mantiene los rasgos y la postura con una coherencia impresionante, pese a cambios drásticos de escena. Esto demuestra el nivel de precisión del generador de imágenes de Google Whisk al combinar contextos tan diferentes sin perder la identidad del sujeto.
Cómo funciona técnicamente (y por qué importa)
Detrás de lo simple que parece, hay mucha tecnología. Whisk usa una combinación de modelos de Google DeepMind, entre ellos Gemini y Imagen. Lo que hace es, primero, analizar las imágenes que le das, entender qué las hace únicas y, con esa información, construir un prompt detallado (de esos que normalmente tendrías que escribir tú). Luego ese prompt lo pasa al modelo Imagen, que genera la nueva imagen fusionando todo.
Esto me llamó mucho la atención, porque significa que Whisk, el generador de imágenes de Google, está creando sus propios prompts invisibles con una precisión que pocas veces lograríamos manualmente. Además, permite añadir texto si quieres refinar algo concreto, pero no es obligatorio.
Mi experiencia con Whisk Animate
En abril de 2025, Google añadió Whisk Animate, una función que me pareció especialmente interesante. Básicamente, puedes tomar una de tus imágenes generadas y transformarla en un video corto de unos 8 segundos. No es una animación genérica: mantiene la coherencia del movimiento con la escena original.
La imagen se anima a través de un prompt que describe el tipo de movimiento deseado, aunque el sistema interpreta automáticamente gran parte de la acción. Además, la animación solo está permitida en formato 16:9, lo cual limita las proporciones pero asegura una presentación cinematográfica consistente.
Probé esta función (con acceso limitado) y el resultado fue bastante fluido. Usa el modelo Veo 2 o incluso Veo 3 en los planes más avanzados. Eso sí, no es gratuito; forma parte del plan premium de Google One AI Pro, que concentra las funciones más potentes.
Acceso y disponibilidad (y lo que comprobé personalmente)
Whisk se usa directamente desde Google Labs (labs.google.com/whisk), y para acceder solo necesitas una cuenta de Google. Por ahora, el servicio está en fase freemium: puedes generar algunas imágenes gratis cada mes, pero si quieres más o probar la parte de video, tienes que suscribirte a los planes AI Pro o Ultra.
En principio, el generador de imágenes de Google Whisk se puede utilizar entrando con una cuenta de Google desde España, y entiendo que probablemente funcione en toda Europa, aunque no lo puedo confirmar con certeza.
Durante mis pruebas, pude realizar alrededor de 50 imágenes en un día sin restricciones. En cambio, para las animaciones, el límite es de 9 al mes (180 créditos mensuales, 20 por animación). Si también usas Flow, otra herramienta de Google, ambos servicios comparten el mismo saldo de créditos.
Por qué Whisk es diferente de DALL·E o Midjourney
Después de probar Whisk y compararlo con otros generadores, noté una diferencia clave: aquí no se trata tanto de precisión, sino de jugar visualmente. No busca reemplazar a los modelos clásicos de texto a imagen como DALL·E o Midjourney, sino ofrecer un enfoque más libre y experimental.
| Característica | Whisk (Google) | DALL·E / Midjourney |
|---|---|---|
| Método de Entrada | Imágenes de referencia | Texto detallado |
| Filosofía | Exploración visual, prueba y error | Control preciso del resultado |
| Control del Usuario | Intuitivo, basado en remezcla visual | Basado en redacción exacta del prompt |
En mi caso, lo que más me gustó fue que no necesitas ser experto en IA para obtener algo decente. Whisk, el generador de imágenes de Google, es ideal para quienes quieren experimentar sin complicaciones, probar estilos, crear prototipos o simplemente divertirse viendo cómo la IA interpreta sus ideas.
Si bien es cierto que la creación de imágenes mezclando ideas, tipos y estilos hace de esta herramienta una auténtica maravilla, lo que más me ha impresionado es la posibilidad de pedirle que respete —y además con mucha fidelidad— la imagen de referencia. Sumado a la opción de incluir texto, que Whisk reproduce con una precisión sorprendente, se pueden crear animaciones ideales para intros de videos o clips visuales muy atractivos.
Os dejo por aquí un video con un pequeño resumen hablando de Whisk y sus características, que puede ayudar a complementar este artículo. Aunque la parte sobre accesibilidad puede estar un poco desfasada, el resto del contenido sigue siendo bastante claro y útil.
En resumen, Whisk, el generador de imágenes de Google con IA, me pareció una herramienta distinta dentro del ecosistema de Google. No pretende ser un editor profesional ni competir directamente con los grandes modelos, sino una especie de laboratorio creativo accesible para todos. Si tienes curiosidad por la IA generativa y te gusta explorar visualmente, vale la pena probarlo.
Si quieres ver otras herramientas como esta aquí puede ver mas


