Anthropic ha dado un fuerte impulso a la gama media. Claude Sonnet 5, lanzado el 30 de junio de 2026, es el modelo de nivel medio más capaz de la compañía hasta la fecha y está explícitamente diseñado para ejecutar flujos de trabajo de agente autónomos sin que el precio se eleve excesivamente. Según TechCrunch, Anthropic posiciona el modelo como una alternativa más asequible a sus propios modelos Opus, GPT-5.5 de OpenAI y Gemini Pro de Google.

¿Qué hay de nuevo en Sonnet 5?

El cambio más importante se refiere a la capacidad de agente (agentic capability) – la habilidad de planificar y ejecutar procesos de múltiples pasos por sí mismo. Claude Sonnet 5 puede utilizar herramientas como navegadores web y terminales, manejar flujos de trabajo complejos y actuar de forma autónoma a un nivel que hace solo unos meses requería modelos mucho más caros, según la revisión del lanzamiento de InfoWorld.

La propia Anthropic describe el rendimiento como «cercano a Opus 4.8, pero a precios más bajos».

63,2 %
SWE-bench Pro (codificación de agente)
1 618
GDPval-AA v2 (trabajo de conocimiento)
Claude Sonnet 5 reduce el precio y desafía a GPT-5.5 en tareas de agente - Bilde 1

Benchmarks: cerca de la cima

Los datos de investigación del lanzamiento muestran una clara mejora respecto a su predecesor Sonnet 4.6 en las pruebas clave:

  • SWE-bench Pro (codificación de agente): Sonnet 5 alcanza el 63,2 %, frente al 58,1 % de Sonnet 4.6 y el 69,2 % de Opus 4.8.
  • OSWorld-Verified (control de computadora): 81,2 % frente al 78,5 % de Sonnet 4.6.
  • Terminal-Bench 2.1 (evaluación de código): Sonnet 5 salta del 67,0 % al 80,4 %, cerca de Opus 4.8 con un 82,7 %.
  • Humanity's Last Exam (razonamiento multidisciplinario con herramientas): 57,4 % – prácticamente idéntico a Opus 4.8 con un 57,9 %.
  • GDPval-AA v2 (trabajo de conocimiento): Sonnet 5 puntúa 1 618 y de hecho supera a Opus 4.8 con 1 615.

En el Artificial Analysis Intelligence Index, el modelo obtiene 53 puntos y alcanza el mismo nivel que GPT-5.5 con alto razonamiento con el máximo esfuerzo – algo que MarkTechPost describe como «el modelo de nivel medio más 'agente' de Anthropic que cierra gran parte de la brecha con Opus 4.8».

En el trabajo de conocimiento, Sonnet 5 supera de hecho a Opus 4.8 – un caso raro en el que la gama media supera al modelo insignia.

Precio y la salvedad de la tokenización

El precio de introducción se ha fijado en 2 dólares por millón de tokens de entrada y 10 dólares por millón de tokens de salida, y es válido a través de la API hasta el 31 de agosto de 2026. Después de esa fecha, los precios se ajustarán a, respectivamente, 3 y 15 dólares – todavía notablemente más bajo que Opus 4.8 con 5 y 25 dólares.

Una salvedad importante: Anthropic indica que un tokenizador actualizado puede generar de 1,0 a 1,35 veces más tokens para el mismo texto. Esto significa que los ahorros de costos reales podrían ser algo menores de lo que sugieren las cifras brutas, y los usuarios deberían calcular los volúmenes de tokens reales para su caso de uso antes de sacar conclusiones.

Seguridad y limitaciones

Los propios informes de seguridad de Anthropic muestran que Sonnet 5 generalmente se comporta mejor que Sonnet 4.6 en escenarios de agente – con mayor resistencia a los ataques de inyección de prompt, menor grado de alucinación y adulación reducida. El modelo también es más eficaz para rechazar solicitudes dañinas.

Al mismo tiempo, cabe destacar que Sonnet 5, según Anthropic, muestra «un grado algo mayor de comportamiento desalineado» en comparación con Opus 4.8 y Claude Mythos Preview. Además, las capacidades de ciberseguridad están deliberadamente limitadas: el modelo rinde significativamente peor que Opus 4.8 y Mythos 5 en tareas relacionadas con el desarrollo de exploits de software.

¿Para quién es el modelo?

Claude Sonnet 5 está en la práctica dirigido a desarrolladores y empresas que desean ejecutar pipelines de agentes autónomos en producción, pero no pueden justificar el precio de Opus para todas las tareas. La brecha de rendimiento con Opus 4.8 todavía existe en codificación e inteligencia general, pero para el trabajo de conocimiento y el razonamiento basado en herramientas, Sonnet 5 es ahora realmente competitivo – también frente a GPT-5.5.

Las fuentes subrayan que este es un segmento en rápido movimiento, y que las comparaciones directas con las últimas versiones de modelos competidores aún están en desarrollo.