miércoles, mayo 1, 2024
InicioCiencia y ComputaciónGoogle anuncia Gemini 1.5 para dejar atrás a ChatGPT

Google anuncia Gemini 1.5 para dejar atrás a ChatGPT

Días después de presentar su IA más avanzada, Google anuncio una nueva versión con rendimiento mejorado.

El lanzamiento de ChatGPT fue un balde de agua fría para Google, que llevaba años invirtiendo en Inteligencia Artificial sólo para que OpenAI se le adelantase con un producto para el público general muy popular. Desde entonces, Google ha intentado ponerse a la altura, y un año después ya se acerca a su rival con Google Gemini, al menos en algunos aspectos.

El desarrollo de la IA dentro de Google se ha acelerado a niveles nunca vistos, así lo demuestra la presentación, la semana pasada, de Gemini 1.5, una nueva versión sólo unos días después de poner Gemini 1.0 al alcance de todo el mundo. Incluso  Gemini lleguo a Android y en español, un ritmo de lanzamientos acelerado que no habíamos visto ni en los mejores tiempos de Google.

Como el “.5” indica, esta nueva versión de Gemini no es una renovación completa de la IA generativa, pero sí que es una mejora sustancial en un aspecto fundamental: el rendimiento y la eficiencia. En otras palabras, hacer más en menos tiempo y por menor coste, lo que abre la puerta a otras mejoras como la cantidad de información que la IA es capaz de procesar a la vez y lo rápido que es posible entrenarla para diferentes tareas.

Google llega afirmar que Gemini 1.5 cuenta con una ventana de 1 millón de ‘tokens’ de manera consistente; por comparar, Gemini 1.0 Pro ‘sólo’ era capaz de procesar 32.000 tokens, y GPT4 Turbo, la última versión del modelo en el que está basado ChatGPT, puede procesar 128.000 tokens. Los tokens son bloques usados para procesar información, y pueden ser partes o subsecciones de palabras, imágenes, vídeos, sonido y código; cuanto mayor sea la ‘ventana’ de contexto, más información podrá obtener y procesar tras una petición del usuario.

Todo eso significa que la IA de Google es capaz de tomar más información de golpe, gracias a una nueva arquitectura basada en la técnica de ‘Mixture-of-experts’ (MoE), que permite seleccionar las partes más relevantes de su red neuronal dependiendo del tipo de dato introducido; y es que esta sigue siendo una IA multimodal, así que admite no sólo texto, sino también vídeo.

Todo esto supone que Gemini 1.5 Pro es capaz de procesar una hora de vídeo, 11 horas de audio, más de 30.000 líneas de código fuente, o más de 700.000 palabras sin problemas. Sin embargo, Google también confiesa que de manera estándar se usarán 128.000 tokens, y que sólo un grupo limitado de desarrolladores podrá probarlo con 1 millón de tokens en AI Studio y Vertex AI.

Procesar una mayor cantidad de información tiene una ventaja obvia en una IA generativa, ya que permite obtener un mayor contexto y presentar un resultado más consistente, relevante y útil para el usuario final. Esto puede ser lo que necesitaba Gemini para ponerse a la altura de ChatGPT y superarla, algo que notaremos en la app oficial de Android además de en apps y servicios que usen Gemini.

 

ARTÍCULOS RELACIONADOS
- Advertisment -

MÁS POPULARES