La inteligencia artificial acaba de cruzar una línea que hasta hace poco parecía de ciencia ficción. Un nuevo modelo desarrollado por Anthropic no solo puede encontrar fallas críticas en sistemas informáticos, sino también explotarlas por sí mismo. Se trata de Claude Mythos, una herramienta tan poderosa que ni siquiera sus propios creadores se atrevieron a liberarla al público.
Durante pruebas internas, esta IA logró identificar miles de vulnerabilidades incluyendo errores ocultos durante décadas y generar ataques funcionales en la mayoría de los casos. Para expertos en ciberseguridad, esto no es solo un avance tecnológico, es una advertencia clara de lo que podría venir.
En los últimos años, los ciberataques han crecido en volumen y sofisticación. Según reportes recientes de empresas como IBM y Check Point Software, el costo promedio de una filtración de datos a nivel global supera los 4.5 millones de dólares, mientras que los ataques de tipo ransomware siguen aumentando año con año. En este escenario, la aparición de una IA capaz de encontrar fallos antes que los humanos parece una ventaja… pero también un arma de doble filo.

Qué hace diferente a Claude Mythos
Claude Mythos destaca por su capacidad de identificar vulnerabilidades del tipo “zero-day”, es decir, errores desconocidos incluso para los propios desarrolladores. Este tipo de fallos son especialmente peligrosos porque pueden ser explotados sin previo aviso, dejando a empresas y gobiernos completamente expuestos.
Durante sus pruebas iniciales, el modelo logró detectar miles de vulnerabilidades en sistemas operativos y navegadores ampliamente utilizados. Más aún, fue capaz de generar exploits funcionales para aproximadamente el 72% de ellas en ciertas categorías, lo que representa un salto significativo frente a herramientas tradicionales de análisis de seguridad.
Mientras que muchas plataformas actuales requieren intervención humana constante, Claude Mythos puede realizar auditorías de seguridad de forma casi autónoma. A partir de simples instrucciones, es capaz de analizar grandes volúmenes de código en cuestión de minutos, algo que antes podía tomar semanas o incluso meses.
Un ejemplo que ilustra su alcance es el hallazgo de una vulnerabilidad con 27 años de antigüedad en OpenBSD, un sistema reconocido precisamente por su enfoque en la seguridad. Este descubrimiento pone sobre la mesa una realidad incómoda: incluso el software más robusto puede contener fallos invisibles durante décadas.

Por qué preocupa a los expertos
El principal motivo de preocupación no es únicamente lo que Claude Mythos puede hacer, sino quién podría hacerlo en el futuro. La misma tecnología que permite reforzar sistemas también podría ser utilizada para atacarlos.
Firmas de ciberseguridad como Palo Alto Networks y CrowdStrike han advertido que la inteligencia artificial está reduciendo drásticamente los tiempos necesarios para encontrar y explotar vulnerabilidades. Lo que antes requería equipos especializados trabajando durante meses, ahora podría lograrse en minutos con modelos avanzados.
Este cambio altera por completo el equilibrio en la ciberseguridad. Tradicionalmente, los defensores tenían cierta ventaja en la detección y corrección de fallos. Sin embargo, con herramientas como Claude Mythos, los atacantes potenciales podrían automatizar procesos complejos, aumentando la escala y velocidad de los ataques.
Además, existe el riesgo de que el desarrollo de estas tecnologías avance más rápido que la capacidad de regulación o adaptación de la industria. En otras palabras, podríamos enfrentar un escenario en el que las herramientas para explotar vulnerabilidades evolucionen más rápido que las soluciones para prevenirlas.
Consciente del riesgo, Anthropic optó por no liberar públicamente Claude Mythos. En su lugar, lanzó una iniciativa colaborativa bajo el proyecto “Glasswing”, convocando a cerca de 50 organizaciones tecnológicas para trabajar en la corrección de fallos detectados.
Entre los participantes se encuentran gigantes como Amazon Web Services, Apple, Google, Microsoft, Nvidia y la The Linux Foundation. El objetivo es claro: cerrar las brechas antes de que puedan ser explotadas.
Como parte de este esfuerzo, la empresa planea destinar hasta 100 millones de dólares en créditos de uso de IA, permitiendo a estas organizaciones analizar y reforzar el software que sustenta gran parte de la infraestructura digital global.
Anthropic sostiene que su estrategia busca adelantarse a un escenario inevitable: el uso de inteligencia artificial en ciberataques. Al desarrollar y controlar estas herramientas, la compañía pretende fortalecer las defensas antes de que otros actores puedan replicarlas.
Sin embargo, la historia de la tecnología sugiere que cualquier avance significativo eventualmente se democratiza.
Lee más:
- Conflicto en Irán ya impacta la ciberseguridad global: ataques a la nube y hacktivismo en aumento
- Así usa Volaris la nube para operar más de 30 millones de pasajeros al año
- La nueva frontera del crecimiento digital: Generar valor posventa









