
Google I/O 2024: novedades en Gemini, Project Astra y el Buscador
Los 8 anuncios más destacados que dio a conocer la compañía en su evento anual para desarrolladores
En su evento anual Google I/O, el gigante tecnológico presentó una serie de innovaciones en inteligencia artificial (IA) que prometen revolucionar aún más nuestra forma de trabajar y comunicarnos. Los anuncios llegan apenas un día después de que OpenAI diera a conocer su nuevo GPT 4o que ya estuvo dando que hablar.
1. Gemini: la nueva generación de modelos de IA
Google anunció mejoras significativas en su familia de modelos Gemini. Por un lado, Gemini 1.5 Flash, el modelo más rápido de Gemini hasta la fecha, se destaca por su eficiencia y capacidad para tareas de alto volumen. Si bien es mas liviano que 1.5 Pro, este modelo ofrece un rendimiento destacado a la hora de hacer resúmenes, conversar, subtitular imágenes y videos, así como para extraer de datos.

Gemini 1.5 Pro, por su parte, fue optimizado para lograr un mejor rendimiento general en una amplia gama de tareas. Su ventana de contexto se amplió a 2 millones de tokens, y se mejoraron sus capacidades de generación de código, razonamiento lógico, planificación, conversación y comprensión de audio e imágenes.
Otra de las novedades llegó de la mano de Gemini Nano, diseñado para dispositivos móviles, que ahora también puede comprender entradas multimodales, incluyendo imágenes, lo que permite una interacción más natural con la IA.
2. Gemma 2 y PaliGemma: modelos abiertos
Google presentó Gemma 2, la próxima generación de modelos abiertos para la innovación responsable en IA. Con una nueva arquitectura diseñada para un rendimiento y eficiencia excepcionales, Gemma 2 estará disponible en nuevos tamaños. Además, la familia Gemma se expande con PaliGemma, el primer modelo de visión y lenguaje inspirado en PaLI-3.

3. Project Astra: Agentes de IA para la Vida Cotidiana
Google DeepMind compartió sus avances en el desarrollo de agentes de IA universales con Project Astra. Estos prototipos, basados en Gemini, pueden procesar información más rápido, entender mejor el contexto y responder rápidamente en conversaciones, lo que acerca la visión de tener asistentes de IA expertos en nuestra vida diaria.

4. Imagen 3 y Veo: generación de imágenes y videos realistas
Google presentó Imagen 3, un nuevo modelo de generación de imágenes que busca producir resultados más realistas. Además, la compañía dio a conocer Veo, un modelo de generación de videos de alta calidad.
5. Novedades en el Buscador de Google
La búsqueda en Google se vuelve más inteligente con AI Overview, que permite realizar preguntas complejas en una sola búsqueda, y con la nueva capacidad de planificación, que ayuda a crear planes para comidas, vacaciones y más. La búsqueda visual también se eleva a un nuevo nivel con la capacidad de hacer preguntas con videos.
6. Ask Photos: una manera más eficiente de buscar información
Con Ask Photos, los usuarios pueden buscar fotos de forma natural, utilizando lenguaje cotidiano. Gemini permite comprender el contexto y el tema de las fotos para extraer detalles. Por ejemplo, se podría preguntar: «¿Qué decoración usamos para la fiesta de cumpleaños de Lena?». Ask Photos comprenderá los detalles, como las decoraciones que hay en el fondo o en el pastel de cumpleaños, para ofrecer la respuesta.
7. Gemini en Workspace: resúmenes Automáticos y más
Gemini 1.5 Pro llega a la barra lateral de Gmail, Docs, Drive, Slides y Sheets, ofreciendo resúmenes automáticos y respuestas más completas. Además, se han añadido nuevas funciones en la aplicación móvil de Gmail para facilitar el acceso a Gemini y mejorar la productividad.

8. Búsquedas más inteligentes y alertas ante llamadas sospechosas
La IA se integra aún más en Android con Circle to Search, que permite buscar cualquier cosa en el teléfono con un simple gesto. Esta función ahora ofrece ayuda en tareas escolares y se ha expandido a más dispositivos.

Pronto, será posible superponer la interfaz de Gemini sobre la aplicación en uso para facilitar su utilización de diversas maneras. Por ejemplo, se podrán arrastrar y soltar imágenes generadas en Gmail, Google Messages y otros lugares, o pulsar «Preguntar a este video» para encontrar información específica en un video de YouTube.
Además, se está probando una nueva función que utiliza Gemini Nano para ofrecer alertas en tiempo real durante llamadas sospechosas.