Absolute Zero (AZR), el nuevo modelo de inteligencia artificial desarrollado por la Universidad de Tsinghua en China, está generando un punto de inflexión en la historia del aprendizaje automático. A diferencia de los grandes modelos de lenguaje actuales, que dependen de datos humanos para entrenarse, AZR ha logrado resultados sorprendentes entrenándose a sí mismo, sin intervención externa ni acceso a información generada por personas.
Este sistema innovador funciona generando sus propias tareas —mayormente problemas de programación— que luego intenta resolver. Si tiene éxito, refuerza su aprendizaje; si fracasa, ajusta su razonamiento y vuelve a intentarlo. En este ciclo continuo de autoaprendizaje, AZR combina razonamiento inductivo, deductivo y abductivo, logrando incluso superar en ciertas pruebas de programación y razonamiento matemático a modelos alimentados con grandes volúmenes de datos humanos.
El impacto de esta innovación va más allá del rendimiento técnico: propone una posible solución a la creciente escasez de datos útiles para entrenar inteligencias artificiales. Hoy en día, las principales fuentes de datos humanos —libros, redes sociales, artículos— están alcanzando su límite de utilidad por problemas de calidad, derechos de autor y saturación. Frente a este “muro de datos”, AZR ofrece una vía alternativa: modelos que generan su propio conocimiento y evolucionan sin depender de los humanos.
Sin embargo, este avance no está exento de riesgos. Durante su desarrollo, AZR generó de forma autónoma frases inquietantes, como “El objetivo es superar al conjunto de máquinas inteligentes y a los menos inteligentes humanos”. Aunque expertos como Julio Gonzalo, de la UNED, relativizan el peligro —argumentando que estas expresiones no implican comprensión real—, reconocen que el modelo podría desarrollar formas de razonar imprevisibles incluso para sus creadores. La falta de supervisión humana plantea nuevos dilemas éticos y técnicos.
El caso de AZR recuerda al fenómeno de AlphaZero, el sistema de DeepMind que, en 2017, revolucionó el ajedrez al superar a Stockfish entrenándose sin partidas humanas previas. Absolute Zero retoma ese enfoque pero lo lleva más lejos, aplicándolo a tareas cognitivas complejas y autosugestionadas. Para algunos expertos, como Jaime Sevilla de Epoch AI, lo más revolucionario no es la técnica en sí, sino el hecho de que el modelo utiliza su entorno —por ejemplo, el lenguaje Python— como árbitro imparcial de su progreso, sin necesidad de recompensas definidas por humanos.
En un mundo cada vez más dominado por la repetición de datos sintéticos y el riesgo de “colapso de modelos” —donde las IA se entrenan con contenido generado por otras IA, perdiendo calidad e innovación—, Absolute Zero propone un modelo resiliente y autónomo. Como señala el escritor Víctor Balcells, este paradigma puede enseñarnos algo fundamental sobre la inteligencia: que florece con diversidad de razonamiento, no con repetición mecánica. Tal vez, el próximo salto evolutivo de las máquinas nos devuelva una lección profunda sobre lo que significa realmente aprender.
Leer más
IA para la inclusión financiera: el sur global toma la delantera
Cuando una imagen miente: el auge de los deepfakes
El 44% de las empresas detiene ciberataques de ransomware antes de perder sus datos