Durante el evento The Future of AI Infrastructure, donde ITSitio pudo asistir como único medio de Argentina en cubrir el evento Google Cloud Next 2026 en Las Vegas, Google Cloud anunció la octava generación de sus TPUs con dos nuevos chips —TPU 8t y TPU 8i— diseñados para acelerar el entrenamiento e inferencia de modelos de IA. La compañía busca habilitar la próxima evolución de la inteligencia artificial, impulsando sistemas agénticos más rápidos, eficientes y escalables.
Una nueva base de cómputo para la inteligencia artificial
Las Unidades de Procesamiento Tensorial (TPU) de Google son aceleradores de hardware personalizados creados específicamente para optimizar cargas de trabajo de inteligencia artificial y aprendizaje automático. A diferencia de las GPUs tradicionales, las TPUs están diseñadas desde cero para redes neuronales profundas, lo que les permite ofrecer mayor rendimiento y eficiencia energética en el entrenamiento e inferencia de modelos complejos como Gemini.
Estas unidades se utilizan para tareas clave como procesamiento de lenguaje natural, generación de imágenes, síntesis de voz y sistemas de recomendación, y funcionan a través de unidades especializadas de multiplicación de matrices (MXU) capaces de ejecutar millones de operaciones en paralelo. El acceso a esta infraestructura se realiza a través de Google Cloud TPU, dentro del ecosistema de Google Cloud, y puede integrarse con plataformas como Vertex AI para entrenar y desplegar modelos de IA a escala.
TPU 8t: el motor del entrenamiento de modelos de frontera
La TPU 8t está optimizada para el entrenamiento de modelos avanzados, con el objetivo de reducir ciclos de desarrollo de meses a semanas. Incluye pods de hasta 9.600 chips, interconexión personalizada y mejoras significativas en rendimiento y escalabilidad.
TPU 8i: la infraestructura para la inferencia agéntica
La TPU 8i está diseñada para la inferencia en tiempo real y la experiencia de IA agéntica. Integra 288 GB de memoria de alto ancho de banda y 384 MB de SRAM en chip, lo que permite mantener modelos completos activos para reducir latencia al mínimo.
Rendimiento y eficiencia: un salto de escala
Google destacó que la combinación de ambas arquitecturas permite alcanzar hasta un 80% más de rendimiento por dólar frente a la generación anterior. Esto significa que las empresas pueden procesar casi el doble de volumen de clientes con el mismo costo operativo, habilitando un crecimiento más eficiente en aplicaciones de IA a gran escala.
Infraestructura integrada de extremo a extremo
Durante su presentación, Amin Vahdat, SVP y Chief Technologist de IA e Infraestructura en Google, subrayó el enfoque integral de la compañía: “La infraestructura necesaria para la inteligencia se está definiendo ahora mismo. Estamos construyendo un stack completo que abarca energía, centros de datos, hardware, software, modelos fundacionales y servicios”, explicó el ejecutivo. Y destacó que esta integración vertical permite maximizar eficiencia, seguridad y rendimiento en toda la cadena tecnológica.
Del cómputo tradicional a la era de los agentes de IA
El nuevo diseño de TPUs está directamente alineado con la visión de Google para la llamada era agéntica, donde múltiples sistemas de IA trabajan coordinados para resolver tareas complejas de razonamiento y automatización. En palabras de Vahdat:“Estamos pasando de mejorar herramientas de IA a construir sistemas de inteligencia capaces de razonar, delegar y ejecutar tareas de manera autónoma”, señaló durante la keynote.
Un salto de innovación acelerada
Google también destacó la velocidad de evolución de su infraestructura, pasando de ciclos de innovación de tres años a mejoras anuales. Según la compañía, esto abre la puerta a avances que antes tomaban una década de investigación. Las nuevas TPU 8t y TPU 8i estarán disponibles de forma general a finales de este año, consolidándose como la base tecnológica de la próxima generación de IA en Google Cloud.
Leer más
Google Cloud Next 2026: Gemini Enterprise Agentic impulsa la nueva era de empresas con IA autónoma