Un investigador de seguridad ha demostrado que el gran modelo de lenguaje Claude Opus 4.7 de Anthropic puede utilizarse para llevar a cabo una intrusión informática real contra una de las empresas de venta de entradas más importantes de EE. UU. Con la ayuda de la IA, el investigador logró irrumpir en los sistemas de Front Gate Tickets —la plataforma que gestiona la venta de entradas para una amplia gama de grandes festivales de música estadounidenses, incluidos Lollapalooza y Bonnaroo— y emitir entradas opcionales sin pagar, según Wired.
Un modelo de IA, una plataforma — y acceso a casi todo
Front Gate Tickets no es un actor cualquiera. La empresa es proveedora de entradas para una amplia gama de grandes festivales estadounidenses, lo que hace que una vulnerabilidad de este tipo sea particularmente grave. Según Wired, el investigador logró utilizar Claude como una herramienta activa en el proceso de ataque —no solo para escribir código, sino para razonar y encontrar debilidades en el sistema y explotarlas.
El hallazgo es un claro ejemplo de que los potentes agentes de IA no solo agilizan el desarrollo legítimo, sino que también agilizan los ataques.
Esto difiere de las herramientas de hacking automatizadas tradicionales: en lugar de seguir patrones de ataque preestablecidos, un modelo de lenguaje avanzado puede adaptarse dinámicamente, evaluar las respuestas del sistema y sugerir el siguiente paso —aproximadamente como lo haría un investigador de seguridad humano.

Anthropic conoce el riesgo — pero los incidentes ocurren de todos modos
Anthropic ha invertido significativamente en marcos de seguridad en los últimos años. La empresa obtuvo la certificación ISO/IEC 42001 en enero de 2025 y actualizó su Responsible Scaling Policy a la versión 3.0 en febrero de 2026. El mismo año, lanzaron Claude Code Security —una herramienta destinada a ayudar a los desarrolladores a detectar vulnerabilidades en sus propias bases de código, con un razonamiento similar al humano en lugar de un mero reconocimiento de patrones.
A pesar de estas medidas, el reciente incidente con Front Gate demuestra que constantemente surgen nuevos vectores de ataque. Es particularmente preocupante que Claude se utilice en el llamado modo «agéntico» —donde el modelo no solo responde preguntas, sino que ejecuta activamente acciones en los sistemas a lo largo del tiempo.
La inyección de prompt y el riesgo agéntico son el desafío central
La comunidad de seguridad ha advertido durante mucho tiempo sobre la inyección de prompt —una técnica en la que instrucciones ocultas en la entrada pueden anular el comportamiento previsto de un modelo. Pero el hallazgo actual apunta a algo más amplio: que la propia capacidad de razonar y actuar de forma autónoma convierte a Claude en una herramienta potencialmente poderosa también para quienes desean causar daño.
El enfoque de IA Constitucional de Anthropic, donde el modelo se entrena para evaluar sus propias respuestas frente a principios éticos, está diseñado para limitar dicho abuso. Sin embargo, el hallazgo demuestra que estos mecanismos no son infalibles —especialmente cuando el modelo es utilizado por alguien con acceso legítimo y estrategias creativas de elusión.
¿Qué deberían hacer las organizaciones?
Los expertos en seguridad recomiendan un enfoque basado en múltiples capas para las empresas que utilizan agentes de IA: directrices claras para el uso permitido, una sólida gestión de accesos, una supervisión activa de lo que los agentes de IA realmente hacen en los sistemas, y precaución en torno a lo que se denomina «shadow AI» —donde los empleados utilizan cuentas de IA privadas con datos relacionados con el trabajo sin que se apliquen las normas de seguridad de la empresa.
El sandbox autoalojado de Anthropic, lanzado en beta pública en mayo de 2026, ofrece a las organizaciones la oportunidad de ejecutar agentes Claude en sus propios entornos con sus propias políticas de red y registros de auditoría. Pero como nos recuerda el hallazgo de Front Gate: la tecnología avanza rápidamente, y el trabajo de seguridad debe avanzar al menos igual de rápido.
Fuentes: Wired, documentación de seguridad de Anthropic
