Google Cloud presenta las TPUs de 8ª generación: nueva infraestructura para la era de la IA agéntica

Durante el evento The Future of AI Infrastructure, Google Cloud anunció la octava generación de sus TPUs con dos nuevos chips —TPU 8t y TPU 8i— diseñados para acelerar el entrenamiento e inferencia de modelos de IA. La compañía busca habilitar la próxima evolución de la inteligencia artificial, impulsando sistemas agénticos más rápidos, eficientes y escalables.

Por: Maxi Fanelli
22 de abril 2026

Inteligencia Artificial

Compartir nota:

Durante el evento The Future of AI Infrastructure, donde ITSitio pudo asistir como único medio de Argentina en cubrir el evento Google Cloud Next 2026 en Las Vegas, Google Cloud anunció la octava generación de sus TPUs con dos nuevos chips —TPU 8t y TPU 8i— diseñados para acelerar el entrenamiento e inferencia de modelos de IA. La compañía busca habilitar la próxima evolución de la inteligencia artificial, impulsando sistemas agénticos más rápidos, eficientes y escalables.

Una nueva base de cómputo para la inteligencia artificial

Las Unidades de Procesamiento Tensorial (TPU) de Google son aceleradores de hardware personalizados creados específicamente para optimizar cargas de trabajo de inteligencia artificial y aprendizaje automático. A diferencia de las GPUs tradicionales, las TPUs están diseñadas desde cero para redes neuronales profundas, lo que les permite ofrecer mayor rendimiento y eficiencia energética en el entrenamiento e inferencia de modelos complejos como Gemini.

Estas unidades se utilizan para tareas clave como procesamiento de lenguaje natural, generación de imágenes, síntesis de voz y sistemas de recomendación, y funcionan a través de unidades especializadas de multiplicación de matrices (MXU) capaces de ejecutar millones de operaciones en paralelo. El acceso a esta infraestructura se realiza a través de Google Cloud TPU, dentro del ecosistema de Google Cloud, y puede integrarse con plataformas como Vertex AI para entrenar y desplegar modelos de IA a escala.

TPU 8t: el motor del entrenamiento de modelos de frontera

La TPU 8t está optimizada para el entrenamiento de modelos avanzados, con el objetivo de reducir ciclos de desarrollo de meses a semanas. Incluye pods de hasta 9.600 chips, interconexión personalizada y mejoras significativas en rendimiento y escalabilidad.

TPU 8i: la infraestructura para la inferencia agéntica

La TPU 8i está diseñada para la inferencia en tiempo real y la experiencia de IA agéntica. Integra 288 GB de memoria de alto ancho de banda y 384 MB de SRAM en chip, lo que permite mantener modelos completos activos para reducir latencia al mínimo.

Rendimiento y eficiencia: un salto de escala

Google destacó que la combinación de ambas arquitecturas permite alcanzar hasta un 80% más de rendimiento por dólar frente a la generación anterior. Esto significa que las empresas pueden procesar casi el doble de volumen de clientes con el mismo costo operativo, habilitando un crecimiento más eficiente en aplicaciones de IA a gran escala.

Infraestructura integrada de extremo a extremo

Google está desarrollando un stack completo que integra desde energía y centros de datos hasta hardware, software, modelos fundacionales y servicios.

Durante su presentación, Amin Vahdat, SVP y Chief Technologist de IA e Infraestructura en Google, subrayó el enfoque integral de la compañía: “La infraestructura necesaria para la inteligencia se está definiendo ahora mismo. Estamos construyendo un stack completo que abarca energía, centros de datos, hardware, software, modelos fundacionales y servicios”, explicó el ejecutivo. Y destacó que esta integración vertical permite maximizar eficiencia, seguridad y rendimiento en toda la cadena tecnológica.

Del cómputo tradicional a la era de los agentes de IA

El nuevo diseño de TPUs está directamente alineado con la visión de Google para la llamada era agéntica, donde múltiples sistemas de IA trabajan coordinados para resolver tareas complejas de razonamiento y automatización. En palabras de Vahdat:“Estamos pasando de mejorar herramientas de IA a construir sistemas de inteligencia capaces de razonar, delegar y ejecutar tareas de manera autónoma”, señaló durante la keynote.

Un salto de innovación acelerada

Google también destacó la velocidad de evolución de su infraestructura, pasando de ciclos de innovación de tres años a mejoras anuales. Según la compañía, esto abre la puerta a avances que antes tomaban una década de investigación. Las nuevas TPU 8t y TPU 8i estarán disponibles de forma general a finales de este año, consolidándose como la base tecnológica de la próxima generación de IA en Google Cloud.

Leer más

Google Cloud Next 2026: Gemini Enterprise Agentic impulsa la nueva era de empresas con IA autónoma

Google Chrome penalizará páginas que bloquean el botón “volver”: cómo afectará al SEO desde junio de 2026

Google y Gemini elevan la seguridad publicitaria: más de 8.300 millones de anuncios bloqueados en 2025

Compartir nota:

Maxi Fanelli

Ver Publicaciones

Google, Google Cloud Next

Google Cloud presenta las TPUs de 8ª generación: nueva infraestructura para la era de la IA agéntica

Una nueva base de cómputo para la inteligencia artificial

TPU 8t: el motor del entrenamiento de modelos de frontera

TPU 8i: la infraestructura para la inferencia agéntica

Rendimiento y eficiencia: un salto de escala

Infraestructura integrada de extremo a extremo

Del cómputo tradicional a la era de los agentes de IA

Un salto de innovación acelerada

Leer más

Maxi Fanelli

Publicaciones Relacionadas

MiQ lanza Sigma en Latinoamérica: IA para optimizar campañas publicitarias

Qué es el FOBO y por qué la inteligencia artificial está cambiando el futuro del trabajo

Gemini 3.5 Live Translate llega a Android y iPhone con traducción de voz en tiempo real

Suscríbete a nuestro newsletter

Lo más leído de Inteligencia Artificial

Publicaciones Relacionadas

MiQ lanza Sigma en Latinoamérica: IA para optimizar campañas publicitarias

Qué es el FOBO y por qué la inteligencia artificial está cambiando el futuro del trabajo

Gemini 3.5 Live Translate llega a Android y iPhone con traducción de voz en tiempo real

La nueva apuesta de las empresas: IA que conversa, ejecuta y toma decisiones en tiempo real

ChatGPT ya no quiere ser solo un chatbot: la renovación que prepara OpenAI

NiCE inaugura una nueva era para CX con IA agéntica en el centro de la plataforma

Anthropic presenta Fable 5, la nueva IA avanzada de Claude con controles de seguridad reforzados

ChatGPT evoluciona: OpenAI integrará agentes autónomos y herramientas de programación en una sola plataforma

Apple presenta Siri AI en la WWDC 2026: el nuevo asistente llegará con iOS 27