La carrera por dominar la ciberseguridad impulsada por IA se intensifica. Mientras OpenAI presentó esta semana nuevas herramientas ofensivas y defensivas, Anthropic ya ha causado revuelo con un modelo que, según círculos de inteligencia estadounidenses, representa una de las demostraciones de seguridad más dramáticas en la historia de la IA.

OpenAI se enfoca en el código abierto

OpenAI anunció «Patch the Planet» — una iniciativa con el objetivo de identificar y cerrar sistemáticamente vulnerabilidades de seguridad en software de código abierto. La iniciativa va acompañada de una versión actualizada de GPT-5.5-Cyber, un modelo diseñado específicamente para tareas de ciberseguridad, según Wired.

El software de código abierto constituye la columna vertebral de gran parte de la infraestructura digital mundial, pero a menudo sufre de falta de recursos y problemas de seguridad acumulados. El enfoque de OpenAI es aplicar la capacidad de la IA para llenar este vacío.

OpenAI se enfrenta a la IA de Anthropic que irrumpió en sistemas de la NSA - Bilde 1

Mythos de Anthropic: La IA que superó a la NSA

El trasfondo de todo esto es tan fascinante como inquietante. El modelo Mythos no publicado de Anthropic —más concretamente «Mythos Preview»—, según el senador Mark Warner, vicepresidente del Comité de Inteligencia del Senado, habría irrumpido en «casi todos» los sistemas clasificados de la Agencia de Seguridad Nacional (NSA) en cuestión de pocas horas. Warner habría sido informado por el general Joshua Rudd, jefe de la NSA y del U.S. Cyber Command.

Esta es una afirmación no verificada de índole política, y ni Anthropic ni la NSA han confirmado los detalles públicamente. Es importante subrayar que se trató de una prueba de seguridad controlada —no un ataque real.

Mythos Preview ya ha encontrado miles de vulnerabilidades graves — entre ellas en todos los principales sistemas operativos y navegadores

El AI Security Institute (AISI) evaluó Mythos Preview y concluyó que el modelo representa un avance significativo en comparación con modelos de vanguardia anteriores en ciberseguridad. Según la evaluación, el modelo es capaz de atacar sistemas empresariales pequeños y débilmente defendidos de forma autónoma, sin supervisión humana, si primero ha obtenido acceso a la red.

Una vulnerabilidad de 27 años encontrada — de forma autónoma

Entre los ejemplos más concretos de las capacidades de Mythos Preview se encuentra el descubrimiento de una vulnerabilidad de 27 años en OpenBSD — un sistema operativo conocido por su robusta seguridad. Según la información relacionada con la evaluación del modelo, la vulnerabilidad habría permitido a un atacante externo bloquear cualquier máquina que ejecutara OpenBSD, simplemente conectándose a ella. El modelo descubrió esto —y desarrolló el código de explotación asociado— sin intervención humana.

Una IA que puede encontrar y explotar vulnerabilidades de seguridad de forma autónoma es un arma de doble filo: la misma herramienta puede defender —o atacar.

Respuesta de las autoridades: Acceso limitado

El gobierno estadounidense reaccionó ordenando a Anthropic que desactivara Fable 5 y Mythos 5 a nivel global, con acceso reservado para ciudadanos estadounidenses. Según Anthropic, la carta que recibieron no especificaba la justificación concreta, pero mencionaba indicaciones verbales de un posible jailbreak estrecho que potencialmente podría permitir a Fable 5 identificar vulnerabilidades de software.

$100M
Créditos de uso de Anthropic para investigación de seguridad
$4M
Donaciones directas para seguridad de código abierto

Dos empresas, el mismo escenario

Tanto OpenAI como Anthropic se están posicionando fuertemente en la ciberseguridad impulsada por IA —pero con enfoques diferentes. OpenAI apuesta por un parcheo amplio de código abierto a través de «Patch the Planet», mientras que Anthropic, con Project Glasswing, reúne a los actores más importantes de la industria en torno a su modelo Mythos Preview para el escaneo defensivo de infraestructura crítica.

Anthropic también ofrece «Claude Code Security», una función integrada en Claude Code que analiza la base de código en busca de vulnerabilidades y propone soluciones. La herramienta está actualmente en vista previa limitada para clientes Enterprise y Team, con acceso prioritario para mantenedores de código abierto.

El denominador común es claro: Los modelos de IA con capacidad real para encontrar y explotar vulnerabilidades de seguridad ya no son hipotéticos. La pregunta que queda es si el uso defensivo podrá seguir el ritmo del potencial ofensivo.