Gemini 3.1 Pro vs ChatGPT: qué pruebas ganó el nuevo modelo de Google

Con mejoras en lógica, ciencia y análisis de información compleja, Gemini 3.1 Pro se posiciona como el nuevo competidor fuerte frente a ChatGPT en la carrera por la inteligencia artificial.

Por: Redacción de ITSitio
24 de febrero 2026

Inteligencia Artificial

Compartir nota:

La competencia por liderar la inteligencia artificial volvió a encenderse. El 19 de febrero, Google presentó Gemini 3.1 Pro, una evolución de su modelo multimodal que, según datos oficiales y benchmarks independientes, superó a las versiones más recientes de OpenAI —incluyendo ChatGPT 5.2— en razonamiento abstracto, tareas científicas y capacidades multimodales avanzadas.

El anuncio refuerza la estrategia de Google de integrar Gemini en todo su ecosistema, desde productos de consumo hasta herramientas empresariales y de desarrollo.

Google presentó su nuevo modelo de inteligencia artificial, Gemini 3.1 Pro.

Qué es Gemini 3.1 Pro

Gemini 3.1 Pro es la versión más avanzada del modelo de IA de Google hasta la fecha. Se trata de un sistema nativamente multimodal, capaz de procesar texto, imágenes, audio, video y código en simultáneo, generando respuestas integradas y contextualizadas.

A diferencia de generaciones anteriores, esta edición pone el foco en tres pilares:

Razonamiento complejo
Eficiencia computacional
Integración profunda con herramientas externas

Según Google, el modelo fue optimizado para ofrecer mayor precisión utilizando menos tokens en tareas extensas, lo que reduce costos operativos y mejora la velocidad de respuesta en entornos empresariales.

Los benchmarks donde Gemini superó a ChatGPT

Uno de los puntos más destacados del lanzamiento fue el rendimiento en pruebas de referencia internacionales.

ARC-AGI-2. Razonamiento abstracto. En el benchmark ARC-AGI-2 —que evalúa resolución de puzzles visuales y razonamiento abstracto— Gemini 3.1 Pro alcanzó 77,1%, frente al 52,9% obtenido por ChatGPT 5.2. Este tipo de prueba es clave porque mide la capacidad del modelo para generalizar reglas lógicas nuevas, no simplemente recuperar información memorizada.
Humanity’s Last Exam. En Humanity’s Last Exam, un examen diseñado para poner a prueba conocimiento experto y razonamiento avanzado, Gemini obtuvo entre 44,4% y 51,4%, superando el rango de 34,5% a 45,5% de su competidor.
GPQA (científico). En el benchmark científico GPQA, Gemini logró 93,8%, posicionándose como uno de los modelos con mejor desempeño en preguntas académicas complejas.
LMArena. En el ranking colaborativo LMArena, el modelo alcanzó 1.501 puntos, por encima de los 1.442 registrados por ChatGPT, consolidando su liderazgo en evaluaciones comparativas abiertas.

En benchmarks internacionales, Gemini 3.1 Pro superó a ChatGPT 5.2 en razonamiento abstracto, pruebas científicas y capacidades multimodales avanzadas, consolidando su liderazgo temporal en IA.

Multimodalidad avanzada y codificación agentica

Uno de los diferenciales más fuertes de Gemini 3.1 Pro es su capacidad multimodal real.

El sistema puede:

Analizar simultáneamente texto y video
Interpretar imágenes y generar código a partir de ellas
Crear animaciones SVG y simulaciones 3D interactivas
Ejecutar tareas encadenadas utilizando herramientas externas

En pruebas como VendingBench (planificación a largo plazo) y ScreenSpot-Pro (comprensión visual avanzada), el modelo mostró mejoras significativas, con ventajas amplias en matemáticas complejas y resolución visual.

Además, destaca en codificación agentica, es decir, en la capacidad de planificar pasos, utilizar APIs, ejecutar herramientas y mantener coherencia en instrucciones extensas.

Eficiencia y contexto ampliado

Gemini 3.1 Pro ofrece soporte para contextos extensos de hasta 1 millón de tokens en su versión completa, lo que permite analizar grandes volúmenes de documentación técnica o datasets completos sin fragmentarlos.

Según documentación oficial de Google, el modelo requiere menos tokens para alcanzar respuestas fiables en tareas complejas, lo que mejora el rendimiento en aplicaciones empresariales y startups tecnológicas.

Gemini 3.1 Pro optimiza recursos y permite trabajar con grandes volúmenes de información.

Cómo probar Gemini 3.1 Pro

Google habilitó distintas modalidades de acceso:

Para usuarios generales: disponible en la web oficial, gemini.google.com
Con cuenta Google gratuita, aunque con límites diarios. Existe además una prueba gratuita de 1 mes, que desbloquea funciones premium como Deep Research y contexto ampliado.
Para estudiantes: Google ofrece el programa “Gemini para Estudiantes”, que permite acceso extendido gratuito mediante verificación con correo educativo y almacenamiento ampliado en Drive.
Para desarrolladores: disponible en Google AI Studio, Gemini CLI. Con cuotas gratuitas iniciales para pruebas.
Para empresas: integrado en Vertex AI, Gemini Enterprise Diseñado para automatización, análisis de datos y despliegue de soluciones a escala.

¿Realmente superó a ChatGPT?

En métricas de razonamiento abstracto, ciencia avanzada y multimodalidad compleja, los benchmarks publicados muestran una ventaja clara de Gemini 3.1 Pro frente a ChatGPT 5.2.

Sin embargo, el liderazgo en inteligencia artificial sigue siendo dinámico. OpenAI continúa actualizando sus modelos y muchas evaluaciones dependen del tipo de tarea, configuración y contexto de uso.

Lo que sí es evidente es que Google logró cerrar —y en algunos casos revertir— la brecha en áreas donde antes estaba por detrás.