Guerra en la terminal

Las dos herramientas de codificación con IA más potentes del mundo reclaman la victoria — y ambas tienen razón. OpenAI informa que Codex ya supera los 3 millones de usuarios semanales (OpenAI vía coursiv.io, mayo de 2026) y afirma que la herramienta es cuatro veces más eficiente en tokens que Claude Code (afirmación de OpenAI recogida por aitoolsrecap.com, abril de 2026). Anthropic responde con Claude Code 2.0, 1 millón de tokens de contexto y un sistema de rollback que te permite rebobinar el código como una máquina del tiempo. Ambos tienen razón. Ambos se equivocan. Aquí está el veredicto honesto.


Codex gana a Claude Code en velocidad pero pierde en razonamiento: el veredicto de 2026 - Bilde 1

Tabla comparativa

CaracterísticaOpenAI CodexClaude Code
Modeloo3 / GPT-4oClaude Opus 4.7 / 4.8
Ventana de contexto128K (CLI)200K estándar, 1M (Opus 4.8)
Terminal-Bench 2.077,3%No publicado
Ejecución paralelaMulti-Agent Worktrees (GA)Subagentes paralelos (experimental)
Instrucciones de proyectoAGENTS.mdCLAUDE.md
Soporte MCP
Hooks/scriptsSistema Skills (.codex/skills)Hooks (shell + HTTP)
MemoriaCloud sandboxAuto Memory
RollbackNo integrado/rewind (Claude Code 2.0)
Entrada de vozNo indicado20 idiomas
Integración GitHubEtiqueta @Codex en PRNo directa
Código fuenteApache 2.0, CLI en RustNo es código abierto
Precio (uso intensivo)~$100–200/mes (incl. Plus $20)~$100–200/mes (Claude Max)
PlataformaCLI, IDE, Web, App, MóvilTerminal-first, CLI, VS Code

Fuentes: aitoolsrecap.com (abril de 2026), coursiv.io (mayo de 2026), claudify.tech, code.claude.com


Codex: El enfoque de ametralladora

El Codex CLI de OpenAI está ahora en la versión 0.120.0 (abril de 2026), escrito en Rust y publicado como código abierto bajo la licencia Apache 2.0. No es solo una herramienta de codificación — es un sistema de orquestación.

Multi-Agent Worktrees ya está disponible de forma general: puedes desplegar múltiples agentes de IA trabajando en worktrees de git aislados simultáneamente, en paralelo, sin interferir entre sí (según vibehackers.io). La función de cloud sandbox te permite lanzar trabajos de agentes asíncronos y recoger los resultados cuando estén listos — el clásico fire-and-forget.

> PULLQUOTE: «77,3% en Terminal-Bench 2.0 — Codex lidera a todos sus rivales en completación de tareas de terminal puras»

> (Fuente: aitoolsrecap.com, abril de 2026)

La integración con GitHub es especialmente impresionante: etiqueta @Codex en un pull request y el agente revisa el código automáticamente, genera comentarios e incluso puede enviar correcciones directamente (aitoolsrecap.com). Para equipos que viven en GitHub, esto supone un ahorro de tiempo masivo.

El sistema Skills (.codex/skills) te permite crear paquetes de instrucciones compartibles y distribuibles — piensa en ellos como paquetes npm para el comportamiento de la IA. El archivo AGENTS.md proporciona instrucciones específicas del proyecto, y la integración con servidores MCP conecta Codex a fuentes de datos y herramientas externas.


CAJA DE DATOS: Cifras de Codex a junio de 2026

  • Más de 3 millones de usuarios semanales (OpenAI vía coursiv.io)
  • 77,3% de puntuación en Terminal-Bench 2.0 (aitoolsrecap.com)
  • ~4x más eficiente en tokens que Claude Code (afirmación propia de OpenAI)
  • 128K tokens de contexto en la versión CLI
  • $20/mes para usuarios de Plus (Codex incluido)

Claude Code: El poder cerebral contraataca

La respuesta de Anthropic no es una ametralladora — es un bisturí. Claude Code funciona con una filosofía terminal-first con Claude Opus 4.7 como modelo predeterminado y, con Claude Code 2.0, 1 millón de tokens de contexto mediante Opus 4.8 (coursiv.io). Eso es casi ocho veces más que el CLI de Codex.

¿Qué significa esto en la práctica? Puedes cargar una base de código completa y extensa, documentación y conjuntos de pruebas en un único contexto y dejar que el agente razone sobre todo a la vez — sin perder el hilo.

La función Agent Teams (experimental a junio de 2026) introduce roles de Lead y Teammate, donde un agente principal coordina subagentes especializados (heyuan110.com). Los subagentes paralelos de Claude Code 2.0 consiguen algo similar a los worktrees de Codex, pero siguen marcados como experimentales.

Lo que realmente distingue a Claude Code es el sistema Hooks: scripts personalizados basados en shell y HTTP que se activan por eventos del flujo de trabajo (claudify.tech, code.claude.com). Es automatización seria para desarrolladores que quieren control total. Auto Memory retiene comandos de compilación y experiencias de depuración entre sesiones (juejin.cn) — una función que Codex no ofrece de forma nativa.

La función /rewind de Claude Code 2.0 es elegante: los auto-checkpoints se guardan continuamente y puedes volver a un punto anterior con un solo comando. Para los desarrolladores que alguna vez han visto a un agente destrozar código a las dos de la madrugada, esto vale su peso en oro.

La entrada de voz en 20 idiomas (vibesparking.com) es un bonus inesperado — y podría convertir a Claude Code en la opción preferida para equipos sensibles a la accesibilidad.


CIFRA CLAVE

1.000.000 de tokens

Claude Code 2.0 con Opus 4.8 puede mantener un millón de tokens en contexto — equivalente aproximadamente a 750.000 palabras, o toda una base de código extensa más documentación, en una sola conversación.


Precios: ¿Quién es más barato?

Ambas herramientas terminan en un punto similar para uso intensivo:

  • Codex: incluido en ChatGPT Plus ($20/mes), Pro ($200/mes) o Business ($30/usuario/mes). Precios basados en tokens de API desde abril de 2026. Estimado en $100–200 por desarrollador al mes para uso intensivo (aitoolsrecap.com).
  • Claude Code: suscripción Claude Max a $100–200 al mes (coursiv.io).

Para equipos, Codex es potencialmente más barato a través del plan Business, pero los costes de API pueden escalar rápidamente con un uso agéntico de alto volumen. Claude Max ofrece una tarificación más predecible.

Nota: Las estimaciones de precios de ambas empresas son propias. El coste real varía significativamente según el patrón de uso.


La competencia a su alrededor

Vale la pena señalar que Codex y Claude Code no compiten en el vacío:

  • Grok Build (xAI) ofrece 8 subagentes simultáneos, 2 millones de tokens de contexto y enrutamiento automático entre Grok Code Fast 1 y Grok 4.3 por $299/mes ($99 los primeros seis meses) (coursiv.io). Es la ventana de contexto más grande del mercado.
  • Cursor SDK funciona con múltiples modelos con Composer 2 como predeterminado a $0,50 por millón de tokens de entrada (lushbinary.com) — el más barato para flujos de trabajo intensivos en tokens.
  • GitHub Copilot ahora tiene el modo agente con disponibilidad general en JetBrains (marzo de 2026) y creación de PR mediante arquitectura agéntica (coursiv.io) — y está profundamente integrado para equipos de desarrollo que ya viven en el ecosistema GitHub.

La integración de Codex con GitHub lo sitúa más cerca de Copilot en caso de uso — pero con una orquestación más avanzada.


LÍNEA DE TIEMPO: Eventos clave en 2026

  • Enero de 2026: Claude Code lanza el sistema Hooks y soporte para CLAUDE.md
  • Marzo de 2026: GitHub Copilot modo agente con disponibilidad general en JetBrains
  • Abril de 2026: Se publica Codex v0.120.0. Se introduce la tarificación basada en tokens de API. Se publican los resultados de Terminal-Bench 2.0
  • Mayo de 2026: Codex supera los 3 millones de usuarios semanales. Claude Code 2.0 se lanza con /rewind, auto-checkpoints y contexto de 1M de tokens
  • Junio de 2026 (ahora): Se añade soporte móvil a Codex. Claude Code Agent Teams sigue siendo experimental

¿Quién debería elegir qué?

Elige Codex si:

  • Trabajas en GitHub y quieres revisiones automáticas de PR
  • Necesitas agentes asíncronos y paralelos ejecutándose en segundo plano mientras haces otra cosa
  • Ya eres suscriptor de ChatGPT Plus y quieres la herramienta incluida
  • Valoras el código abierto y quieres contribuir al CLI o bifurcarlo
  • Necesitas amplio soporte de plataforma (CLI, IDE, Web, App, Móvil)

Elige Claude Code si:

  • Trabajas con bases de código grandes y complejas que requieren contexto profundo
  • Quieres rollback y auto-checkpoints como red de seguridad
  • Los Hooks y los scripts personalizados son importantes para tu flujo de trabajo
  • Necesitas entrada de voz o funciones de accesibilidad
  • El razonamiento y la fiabilidad pesan más que la velocidad bruta en terminal

CONCLUSIÓN FINAL

OpenAI Codex gana en amplitud, velocidad e integración. Tres millones de usuarios semanales y un 77,3% en Terminal-Bench 2.0 son cifras que no se pueden ignorar. El CLI de código abierto y la integración con GitHub lo convierten en la elección natural para equipos ya inmersos en el ecosistema de OpenAI y GitHub.

Pero Claude Code gana en profundidad. Un millón de tokens, /rewind y un sistema Hooks maduro lo convierten en la opción más segura para desarrolladores que no pueden permitirse arriesgar con código complejo y crítico. Agent Teams sigue siendo experimental — pero la dirección es clara.

El veredicto de 2026: Codex para velocidad y escala. Claude Code para fiabilidad y complejidad. La mayoría de los equipos de desarrollo serios acabarán usando ambos.


Evaluación de fuentes: Este artículo ha sido verificado contra 2 fuentes primarias abiertas (code.claude.com/docs, github.com/openai/codex) y 6 análisis/sitios de noticias independientes (aitoolsrecap.com, coursiv.io, claudify.tech, vibehackers.io, heyuan110.com, vibesparking.com). La afirmación de eficiencia de tokens de OpenAI es propia de la empresa y no ha sido verificada de forma independiente.