Mythos: la falacia del salto cualitativo

Claude Mythos puede realizar ciberataques a redes empresariales que ningún modelo anterior IA lograba. Pero antes de declarar el fin de la ciberseguridad, conviene examinar qué dice la evidencia real sobre dónde está el verdadero cambio de escenario.

Por: Gustavo Aldegani
21 de mayo 2026

Seguridad

Compartir nota:

Cuando el 7 de abril de 2026 Anthropic anunció Claude Mythos Preview, decidió no publicarlo.

Se trata un modelo de IA de propósito general, sin diseño específico para ciberseguridad, cuyos resultados en pruebas de hacking autónomo resultaron inesperadamente avanzados, por lo que la compañía consideró que liberarlo públicamente representaba un riesgo inadmisible. En cambio, lanzó el Proyecto Glasswing, un programa de acceso restringido para que un grupo selecto de empresas de seguridad pudiera estudiar sus capacidades antes de hacer un despliegue más amplio.

Lo que siguió fue predecible: titulares que hablaban de “el fin de la ciberseguridad”, alertas en los mercados financieros y reuniones entre reguladores y bancos.

La pregunta relevante no es si Mythos puede hackear. La pregunta es si cambia algo fundamental. Y la respuesta, documentada en evaluaciones independientes publicadas en las últimas semanas, es más compleja que lo que se dio a conocer a través de las redes.

Lo que muestran las evaluaciones

El UK AI Security Institute (AISI) publicó el 13 de abril su evaluación independiente de Claude Mythos Preview. Los números son interesantes: en tareas de nivel experto de Capture the Flag, ejercicios de hacking donde ningún modelo lograba nada antes de abril de 2025, Mythos tuvo una tasa de éxito del 73%. El AISI documentó que el modelo puede ejecutar ataques multi-etapa en redes vulnerables y descubrir y explotar vulnerabilidades de forma autónoma, tareas que tomarían a profesionales humanos días de trabajo.

Pero el AISI también fue explícito sobre los límites de esta medición: los Capture the Flag prueban habilidades específicas en entornos controlados. Los ataques reales requieren encadenar docenas de pasos a través de múltiples hosts y segmentos de red. El propio AISI señaló que sus evaluaciones futuras involucrarán rangos que simulen entornos con monitoreo activo, detección de endpoints y respuesta a incidentes en tiempo real.

Claude Mythos Preview fue sometido a pruebas internas por Anthropic antes de quedar restringido al programa Glasswing.

Por su parte, la Cloud Security Alliance publicó a mediados de abril un análisis técnico que proporciona el contexto de rendimiento. Claude Opus 4.6, el modelo antecesor, tenía una tasa de éxito de aproximadamente 2 por ciento en intentos contra los mismos objetivos de generación de exploits. Mythos no es, entonces, un salto desde la imposibilidad hacia la omnipotencia; es un salto desde un porcentaje de eficiencia bajo a un nivel de competencia razonable. Esta es una gran diferencia en términos de evaluación de riesgo, pero muy distinta de la narrativa del “la IA que reemplaza a los Expertos en Ciberseguridad.

La prueba de estrés en código maduro

Antes de analizar las implicaciones estratégicas, es necesario examinar más evidencias objetivas. Daniel Stenberg, creador de Curl, una biblioteca de transferencia de datos presente en miles de dispositivos, sometió a Mythos a un análisis de su código fuente de 176.000 líneas. Mythos afirmó encontrar 5 vulnerabilidades de seguridad críticas. Tras la verificación humana, 3 eran falsos positivos, 1 era un bug funcional sin implicaciones de seguridad, y solo 1 era una vulnerabilidad real, de baja severidad.

La conclusión de Stenberg fue que el modelo de IA puede ser marginalmente mejor que las herramientas anteriores en código extremadamente maduro y revisado, pero no en un grado que suponga un gran impacto en el análisis de código. Es una advertencia metodológica importante: las capacidades de un sistema en entornos de laboratorio controlados, no se traducen directamente a su rendimiento en código de producción auditado durante décadas.

Por otro lado, la investigación de Carnegie Mellon sobre LLMs en entornos empresariales reales apunta en la misma dirección. Los modelos de última generación con acceso a herramientas de seguridad fallaron completamente en los desafíos cuando operaban sin contexto estructurado. Con la abstracción adecuada, una capa intermedia que les proporciona un modelo mental del entorno de ataque, el rendimiento mejoró drásticamente. El contexto no es un detalle de implementación. Es la variable que define el resultado.

La asimetría que hace la diferencia

Aikido Security analizó más de 1.000 pentests realizados con IA y documentó un factor crítico: la asimetría de información entre atacante y defensor. Un atacante externo opera en modo caja negra, sin acceso al código fuente, a la arquitectura interna o al historial de cambios. Un defensor opera en modo caja blanca, con acceso a todo el contexto estático y dinámico de su sistema.

Mythos no modifica esta ecuación. La IA ofensiva opera en la ignorancia del contexto, sin suficiente información sobre el código estático y su comportamiento en ejecución, incluso los modelos más avanzados no superan a modelos de código abierto mucho más ligeros. El defensor que maneja la visibilidad de su propia superficie de ataque, trabaja con una ventaja estructural que ningún modelo puede compensar desde el exterior.

Claude Mythos logró resolver desafíos avanzados de hacking autónomo en entornos controlados de laboratorio.

El colapso de la ventana de divulgación

Si hay un cambio real que Mythos genera, y que trasciende a cualquier modelo de IA específica, es la aceleración de la cadena de explotación. El investigador de seguridad Himanshu Anand documentó recientemente un caso con React: descargó varios parches de seguridad y, con asistencia de un modelo de lenguaje, construyó un exploit funcional en 30 minutos. Los ingenieros de Ciberseguridad expertos pueden necesitar días para el mismo trabajo.

El riesgo de utilizar esta capacidad de Mythos quedó dimensionado en el dashboard zerodayclock.com, que rastrea códigos generados para explotar vulnerabilidades detectadas. Esto muestra que la media de tiempo entre el descubrimiento de una vulnerabilidad y su explotación ha disminuidos de 771 días en 2018 a menos de 4 horas en 2024 y la proyección para 2026 es menos de una hora.

Esta aceleración convierte el modelo estándar de divulgación responsable, que consiste en notificar al fabricante, darle 90 días para parchear y publicar, en una política diseñada para un mundo que ya no existe.

Hoja de ruta operativa

Para los equipos de Ciberseguridad, las implicaciones prácticas son independientes de si el debate sobre el salto cualitativo se resuelve de una u otra manera, deben comenzar a tomar medidas como las siguientes:

Ciclos de parcheo continuos. El modelo trimestral ya era insuficiente; en un entorno donde el tiempo mediano de explotación es de días, la gestión de vulnerabilidades requiere automatización y actualización continua. La ventana operativa ya no es de 90 días sino de horas.

Inventario de superficie de ataque. El 90% de las brechas comienzan en activos no gestionados u olvidados. La IA ofensiva no tiene forma de conocer el contexto interno de una organización, pero sí puede explotar activos expuestos que no aparecen en los inventarios. La visibilidad es la primera línea defensiva.

Pruebas de penetración continuas con IA. Los escáneres estáticos ya no son suficientes. Los equipos que despliegan IA defensiva para pruebas de penetración continuas sobre su propia infraestructura, con contexto completo, tienen la misma ventaja de velocidad que los atacantes, pero multiplicada por la información con la que cuentan.

Simulacros de respuesta a incidentes de IA. Los playbooks diseñados para adversarios humanos que actúan en ciclos de horas o días no sirven contra sistemas autónomos que actúan en milisegundos. Los ejercicios de crisis deben incluir escenarios de ataque orquestado por agentes.

Conclusión

Claude Mythos no es un hacker que lo sabe todo y lo ejecuta de manera inmedita. Es el primer modelo que supera de forma sostenida tareas de hacking de nivel experto en entornos controlados. La diferencia es importante: haber superado el umbral de casi nunca funciona a funciona la mayoría de las veces en laboratorio, no implica que Mythos haya llegado a un nivel a partir del cual desaparezca la Ciberserguridad.

Lo que Mythos sí representa es la demostración empírica de que la velocidad de explotación ya supera la velocidad de remediación en la mayoría de las organizaciones. El problema no es el modelo de Anthropic. El problema es que el catálogo de vulnerabilidades creció en un 20% en lo que va de 2026, que el 45% de las vulnerabilidades empresariales siguen sin parchearse después de un año, y que el tiempo medio de remediación para aplicaciones empresariales complejas supera los cinco meses.

La pregunta correcta no es ¿puede Mythos comprometer mis sistemas? La pregunta correcta es: ¿mi ciclo de gestión de vulnerabilidades puede competir con un adversario cuyo tiempo de construcción de exploits se mide en minutos?

Si la respuesta es no, el problema no es la inteligencia artificial de Anthropic. Es la capacidad de respuesta de los equipos de Ciberseguridad y los recursos con que cuenta.

Leer más

Compartir nota:

Gustavo Aldegani

Ver Publicaciones

Anthropic, Claude, Cybertalks

Mythos: la falacia del salto cualitativo

Lo que muestran las evaluaciones

La prueba de estrés en código maduro

La asimetría que hace la diferencia

El colapso de la ventana de divulgación

Hoja de ruta operativa

Conclusión

Leer más

Gustavo Aldegani

Publicaciones Relacionadas

La IA de OpenAI salió de control: el hackeo alcanzó a cuatro plataformas tecnológicas

Deepfakes, bots emocionales y phishing inteligente: los fraudes digitales que más preocupan a las empresas

El perímetro de la IA Corporativa: cómo los modelos internos se convierten en vectores de fuga de información

Suscríbete a nuestro newsletter

Lo más leído de Seguridad

Publicaciones Relacionadas

La IA de OpenAI salió de control: el hackeo alcanzó a cuatro plataformas tecnológicas

Deepfakes, bots emocionales y phishing inteligente: los fraudes digitales que más preocupan a las empresas

El perímetro de la IA Corporativa: cómo los modelos internos se convierten en vectores de fuga de información

¿Por qué la biometría tradicional ya no es suficiente?

El nuevo candado de Microsoft contra las licencias falsas

Usuarios de macOS enfrentan más ciberamenazas que los de Windows, pero están menos protegidos

Campaña de malware explotó Claude.ai y afectó a 29 organizaciones con el troyano SectopRAT

Google lanza una video selfie para recuperar tu cuenta si olvidás la contraseña

Falsas preventas y supuestos estrenos anticipados de Spider-Man podrían robar datos bancarios de los fanáticos