Google Actualiza Gemini: Ahora Capaz de Crear Imágenes Fotorrealistas de Personas

Espacio de trabajo con pantallas mostrando imágenes fotorrealistas generadas por la IA de Google Gemini, utilizando la tecnología Imagen 3 para crear retratos precisos.

Google ha dado un paso importante en el campo de la inteligencia artificial con la última actualización de su modelo Gemini, permitiendo la creación de imágenes fotorrealistas que incluyen personas, una capacidad que estaba previamente restringida. La decisión de Google de expandir esta función ha surgido después de enfrentar polémicas relacionadas con representaciones inexactas y sesgos culturales. Con la nueva tecnología Imagen 3, Google busca generar imágenes realistas a partir de descripciones de texto, abriendo nuevas oportunidades en el ámbito creativo.

El Contexto de la Restricción Anterior

Anteriormente, Google había desactivado la generación de imágenes de personas en Gemini debido a controversias relacionadas con la precisión histórica y la representación étnica. Un ejemplo notorio fue la creación de soldados alemanes con características poco representativas del contexto histórico, lo que generó críticas sobre los sesgos culturales presentes en las imágenes generadas. Para abordar estos problemas, Google ha incluido nuevas salvaguardas en la actualización de Gemini, con el objetivo de mejorar la precisión y el control sobre el contenido generado.

Tecnología Imagen 3: Mayor Precisión en la Creación de Imágenes

La nueva versión de Gemini utiliza la tecnología Imagen 3, que ha sido diseñada para producir imágenes realistas basadas en descripciones de texto. Esta actualización promete una mayor exactitud en la representación de personas, reduciendo los errores que anteriormente suscitaban críticas. Además, Google ha implementado políticas más estrictas para garantizar la calidad y seguridad del contenido generado.

Con la actualización, las imágenes generadas no serán de personas identificables, ni incluirán menores de edad, y se ha reforzado la moderación para evitar contenido violento o explícito. Estas medidas buscan equilibrar la creatividad con la responsabilidad, asegurando que el uso de Gemini cumpla con altos estándares éticos.

Disponibilidad y Nuevas Funciones de Gemini

Por ahora, la capacidad de generar imágenes de personas está disponible únicamente en inglés y solo para usuarios que cuenten con versiones avanzadas del modelo, como Gemini Advanced, Business y Enterprise. Esta restricción permite a Google supervisar y mejorar la función antes de lanzarla a un público más amplio.

Una de las características destacadas en esta actualización es la técnica conocida como outpainting, que permite ampliar el lienzo generado. Esta función ofrece mayor flexibilidad a los usuarios que desean extender sus creaciones, proporcionando nuevas posibilidades tanto para profesionales como para artistas.

Un Avance Significativo en la Competencia de Modelos Generativos

Aunque esta actualización de Gemini se ha lanzado discretamente, representa un avance importante para Google en la competencia con otros modelos generativos. La compañía busca encontrar un equilibrio entre la precisión cultural y la capacidad de personalización, un aspecto esencial para mantenerse relevante en un mercado en constante evolución.

La eliminación de restricciones para generar imágenes de personas no solo impulsa la creatividad en aplicaciones artísticas, sino que también abre nuevas oportunidades en ámbitos profesionales. Esta capacidad de personalización podría ser un factor determinante en la preferencia de los usuarios a la hora de elegir entre diferentes modelos de generación de imágenes.

Conclusión

La actualización de Gemini marca un hito en el desarrollo de modelos generativos de Google. Con la incorporación de salvaguardas adicionales y la nueva tecnología Imagen 3, la compañía demuestra su compromiso con la precisión y la responsabilidad en la generación de contenido. A medida que esta función esté disponible para más usuarios y en más idiomas, es probable que se convierta en una herramienta clave en la creación de imágenes fotorrealistas de manera ética y controlada.