viernes, mayo 17, 2024
InicioCiencia y ComputaciónGoogle lanza su alternativa a DALL-E 3

Google lanza su alternativa a DALL-E 3

Luego de presentar las capacidades de su nuevo modelo de lenguaje Gemini , Google hace oficial una nueva versión de Imagen, su modelo text-to-image que permite generar fotografías a partir de descripciones de texto.

Se trata de  Imagen 2 y la compañía ha prometido grandes avances en la precisión, el realismo y la versatilidad del modelo.

La compañía afirma que Imagen 2 es su tecnología de generación de imágenes más avanzada hasta la fecha. Con respecto a la anterior versión de Imagen, esta es capaz de proporcionar fotografías más realistas y de mayor calidad, además de haber mejorado de manera notable la consistencia de los resultados a partir de los prompts del usuario.

Imagen 2 llega con el punto de mira puesto en DALL-E 3, la última versión del modelo text-to-image de Open AI. La compañía del buscador asegura haber añadido descripciones adicionales a las imágenes usadas en el conjunto de datos que se utilizó para entrenar al modelo, de modo que este sea capaz de comprender diferentes estilos y ser más preciso a la hora de seguir las indicaciones del usuario.

Durante el entrenamiento, Google también se centró en mejorar algunos de los puntos débiles de Imagen (y de otros modelos de este tipo), como el renderizado de imágenes, dientes, rostros humanos u otros rasgos con los que la IA suele tener problemas.

Combinando texto e imágenes como entrada, Imagen 2 es capaz de generar imágenes diferentes que mantengan la consistencia.

Imagen 2 es capaz de insertar texto legible en las imágenes, así como de hacer un mejor trabajo a la hora de generar logos o iconos para marcas. Y quienes busquen mantener la consistencia entre diferentes imágenes generadas con Imagen 2, tendrán la capacidad de combinar prompts de texto e imágenes de entrada para «forzar» al modelo a que genere imágenes con el mismo estilo.

Google explica que la nueva versión de su modelo también puede ser utilizado para editar fotografías, por ejemplo añadiendo contenido a imágenes ya existentes o extendiéndolas para ocupar un mayor área.

Imagen 2 ya está disponible de manera general para los clientes de Vertex AI que tengan acceso a la anterior versión de la herramienta. De momento, la herramienta de generación de imágenes integrada en SGE sigue estando basada en la primera versión del modelo Imagen.

 

ARTÍCULOS RELACIONADOS
- Advertisment -

MÁS POPULARES