Componentes

Lo nuevo de ARM: innovaciones para abarcarlo todo

La tecnología ARM está prácticamente en todos lados: teléfonos, computadoras personales, dispositivos móviles, servidores, autos, televisores, electrodomésticos inteligentes, consolas de juego, y la lista sigue. Mantener la vigencia en tantos y tan diversos mercados requiere un esfuerzo constante orientado a la innovación en cada uno de ellos. Es por eso que la empresa mantiene múltiples equipos de diseño en diferentes ubicaciones, todos ellos trabajando en paralelo. En una de esas instalaciones (la de Cambridge, en Inglaterra) se llevó a cabo el evento anual TechDay de 2017, en el que se presentaron las últimas tecnologías de la empresa: DynamIQ, Mali-G72, Cortex-A75 y el esperado sucesor del pequeño A53: Cortex-A55.

Simon Segars en ARM TechCon
Simon Segars en ARM TechCon

 

DIMINUTO PERO PODEROSO

El Cortex-A53 lleva varios años en el mercado y ha logrado un inmenso éxito (ya sea por sí mismo o como la componente “little” de configuraciones big.LITTLE), con más de 40 licenciatarios y más de 1.700 millones de unidades distribuidas en apenas tres años. En este período, ARM mantuvo una cadencia anual de lanzamiento de nuevos “grandes” núcleos, desde A57 hasta A75 y A73, pero el A53 se mantuvo sin cambios, aun cuando la brecha de performance entre los grandes y los pequeños se ampliaba.

Por tal motivo, el principal objetivo del A55 fue mejorar la performance de la serie de pequeños núcleos. El A53, de doble expedición y ejecución en orden (el cual representa el punto de partida para el A55) ofrece un adecuado rendimiento de su pipeline de instrucciones, por lo que ARM puso su foco en mejorar el sistema de memoria. Un nuevo prefetch de datos, una caché L2 integrada que reduce la latencia en un 50 por ciento y un nivel extra de caché L3, entre otras mejoras, dan al A55 una performance de memoria sustancialmente mayor, la cual se pone en evidencia en una mejora de casi el doble de performance en el test de copia de memoria LMBench (según cifras suministradas por ARM).

Las mejoras de performance y eficiencia del Cortex-A75

Las cifras comparativas muestran también un aumento de performance del 18 por ciento en SPECint 2006 y uno del 38 por ciento en SPECfp 2006, en relación al A53. Estas cifras comparan un núcleo A55 con un A53 funcionando con iguales frecuencias, iguales tamaños de caché L1 y L2, mismo compilador utilizado, etc. En la práctica, las mejoras deberían ser aún mayores, dado que los fabricantes de los SoCs se beneficiarán del agregado de caché L3, la cual no es tenida en cuenta en estas comparaciones.

Sin embargo, la performance agregada tiene un costo. El consumo energético se eleva un 3 por ciento en relación al A53, si bien la eficiencia (rendimiento sobre consumo) mejora un 15 por ciento en SPECint 2000, debido a la mayor performance del núcleo.

El A55 incluye otras diversas características que ayudarán a expandir su alcance a nuevos mercados. Por ejemplo, las Virtual Host Extensiones (VHE) son importantes para el mercado automotriz, mientras que las características de seguridad y confiabilidad avanzadas, tales como soporte RAS y paridad ECC para todos los niveles de caché, son críticas también para el mercado industrial. A su vez, una nueva instrucción Int8 de producto de puntos resulta de utilidad para la aceleración de redes neuronales.

SUBIENDO LA VARA DE PERFORMANCE

Cuando ARM anunció el A73 el año pasado, hizo referencia a mejorar la performance sostenida y a trabajar dentro de un marco térmico ajustado. En otras palabras, la mira del A73 estaba en mejorar la eficiencia energética. El A75 va en una dirección diferente: aprovechando el margen térmico logrado por el A73, ARM puso el foco en mejorar la performance manteniendo la eficiencia. Las cifras oficiales de la empresa muestran notables mejoras del A75 sobre el A73, tanto en procesamiento de números enteros como de punto flotante, al igual que en streaming de memoria.

Las comparaciones muestran que el A75, operando a 3 GHz sobre un nodo de 10 nm, consigue mejor performance y la misma eficiencia que un A73 operando a 2,8 GHz también en un nodo de 10 nm, lo cual implica que el nuevo núcleo consume más energía.

Mobile MultiView y seguimiento ocular con la GPU Mali-G72

ARM busca llevar al A75 a dispositivos de formatos más grandes, con consumos superiores a los 750 mW por núcleo de los dispositivos móviles, al elevar sus frecuencias. Es posible suponer que las Chromebook o las ultraportátiles 2-en-1 están dentro del target de este nuevo núcleo. Funcionando con 1 W por núcleo, el A75 ofrece un 25 por ciento más de frecuencia que el A73, y corriendo a 2 W por núcleo, la ventaja se eleva al 30 por ciento, comparando mediante el benchmark SPECint 2006. Esto demuestra que, cuando se eleva la performance de un chip únicamente aumentando su frecuencia, el consumo dinámico se eleva exponencialmente.

El A73 apuntaba específicamente al mundo móvil, al poner el foco en la eficiencia energética y quitar algunas características útiles para otras aplicaciones con la finalidad de simplificar el diseño. El A75, al incorporar esas características que el A73 había dejado de lado (por ejemplo, ECC/paridad en todos los niveles de caché, protección contra “envenenamiento” de datos, soporte RAS, etc.), representa una actualización para el A72 en los mercados de servidores e infraestructura.

Se estima que la velocidad del A75 seducirá a los vendors de SoCs ARM para colocarlos en Chromebooks y en ultraportátiles con Windows. Patrick Moorhead, fundador y presidente de Moor Insights & Strategy, opina que “el A75 representa una gran capacidad de escalamiento, y si funciona, será la única CPU de la que tengo conocimiento que habrá escalado tanto”.

GPU RENOVADA

Para ponerse a tiro con las nuevas CPUs A55 y A75, la división de núcleos gráficos de ARM también estuvo trabajando en una renovación de sus productos. Este trabajo dio como resultado el diseño Mali-G72, el reemplazo de Mali-G71 que apunta a mejorar la performance gráfica y eficiencia energética de los SoCs de alta performance.

Mali-G72 no aporta cambios radicales a la arquitectura Bitfrost nacida con la GPU G71. Las mejoras en G72 están en los múltiples detalles de optimización que elevan su performance y su eficiencia. La G72, según ARM, ofrecerá una mejora de eficiencia del 25 por ciento en comparación con G71 sobre la misma tecnología de proceso. La empresa también asegura que ofrecerá un 17 por ciento de mejora en eficiencia en tareas de aprendizaje de máquina.

Pero además del aprendizaje de máquina, el otro terreno en el que ARM busca afirmarse gracias al G72 es el de realidad virtual móvil, con nuevas características tales como Mobile Multiview (optimización del renderizado de imágenes diferentes para cada ojo) y “foveated rendering” (proceso de renderización concentrada en el punto focal). Estas características no sólo ayudan a reducir la energía consumida por aplicaciones de mobile VR, sino también a mejorar su performance, elevando la calidad de las experiencias de realidad virtual móvil.

Puede estimarse que los chips basados en Mali-G72 comenzarán a salir al mercado en un plazo de un año aproximadamente. Si bien ARM no es responsable por los productos finales en los que se implementan sus diseños, la GPU Mali-G71 apareció en el chip HiSilicon Kirin 960 apenas 8 meses después del anuncio por parte de ARM. Los fabricantes de chips podrían implementar Mali-G72 en un plazo similar.

DYNAMIQ

La tecnología big.LITTLE de ARM tuvo gran éxito al permitir encadenar múltiples clusters de hasta 4 CPUs, abasteciendo al mercado de dispositivos móviles con una extensa gama de combinaciones de núcleos Cortex-A capaces de impulsar toda clase de teléfonos. La combinación de big.LITTLE y Cortex-A trascendió el mundo de los teléfonos y tablets para conquistar otros espacios, como servidores densos e informática automotriz.

DynamIQ es la evolución de big.LITTLE, aggiornada para hacerse más flexible, escalable y con mayor performance. Al igual que big.LITTLE, DynamIQ conecta clusters de CPUs entre sí y con otros componentes del sistema, pero agrega la posibilidad de colocar CPUs Cortex-A grandes y pequeñas dentro de un mismo cluster (con big.LITTLE, en cambio, diferentes CPUs deben estar en diferentes clusters).

Arquitectura de clusters A55-A75 con DynamIQ

DynamIQ permite crear clusters de hasta 8 núcleos que combinan los nuevos núcleos A75 y A55 junto con un DSU (DynamIQ Shared Unit), lo cual ayuda a optimizar el ancho de banda y la latencia. La tradicional configuración 4+4 de big.LITTLE sigue siendo posible con los nuevos A75 y A55, pero colocándolos en clusters DynamIQ individuales consiguen amplias ventajas de latencia y eficiencia.

PLANES A LARGO PLAZO

Los anuncios que ha hecho ARM durante la primera mitad del año son una indicación de la importancia que tienen para la empresa y sus clientes cuestiones tales como aprendizaje de máquina e inteligencia artificial. También ponen en primer plano a aspectos como la privacidad, seguridad y performance. Paralelamente, las capacidades de los dispositivos se orientarán a brindar mejores experiencias de usuario, lo cual permitirá un mejor aprovechamiento de la inteligencia artificial.

Los chips con las nuevas tecnologías ARM tardarán algo así como un año en estar disponibles, pero los fabricantes no dejarán pasar de largo estas innovaciones, y presumiblemente las combinarán con tecnologías de proceso de 10nm de última generación para potenciar las ventajas de consumo energético y de tamaño.

“Este fue un sólido anuncio para ARM Holdings, a tono con la industria y con las necesidades de los usuarios finales”, concluye Moorhead, quien agrega que: “Es un paso hacia su objetivo de impulsar los próximos 100.000 millones de dispositivos en un plazo de cinco años”.

Autor

  • Gustavo Dumortier

    Analista en Computación y periodista especializado en informática. Trabajó en diversas publicaciones de tecnología y negocios y es autor de libros sobre algoritmos y programación. Actualmente es socio de la consultora argentina MasterSoft, en la que se desempeña como analista funcional.

[mdx-adserve-bstreet region="MED"]

Gustavo Dumortier

Analista en Computación y periodista especializado en informática. Trabajó en diversas publicaciones de tecnología y negocios y es autor de libros sobre algoritmos y programación. Actualmente es socio de la consultora argentina MasterSoft, en la que se desempeña como analista funcional.

Publicaciones relacionadas

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Botón volver arriba