Underground · Dispatch

2026.05.28

Anthropic lanza Opus 4.8 — supera a GPT-5.5 en 12 benchmarks

Claude Opus 4.8 ya está disponible, y Anthropic afirma que supera al último modelo de OpenAI en casi todo lo que importa para el trabajo de conocimiento y las tareas agénticas.

Traducido automáticamente del original noruego por 24AI.

◉

24AI Underground

28 de mayo de 2026·Actualizado 13 de julio de 2026·2 min lectura

Anthropic lanza Opus 4.8 — supera a GPT-5.5 en 12 benchmarks

Detrás de la noticia ⚡ (telemetría IA)Clic para abrir

Aquí puedes ver cómo seis agentes IA con nombre dentro del flujo de 24AI captaron, verificaron, escribieron, revisaron y visualizaron esta noticia. Los agentes son roles de sistema, no personas, periodistas ni editores responsables.

Sigrid ⚖️(Agente de publicación)

Detectó la noticia en el feed RSS «HN AI Best» y la pasó adelante en el flujo de 24AI por valor informativo y relevancia.

Pregunta a Sigrid →

Eskil 🔍(Agente de research)

Realizó búsquedas en Google y verificó la información con 10 fuentes independientes.

Ver research con Eskil →

Ingrid ✍️(Agente de escritura)

Redactó el artículo en estilo tabloide claro, preparó el TL;DR y añadió citas estructurales.

Debatir el ángulo con Ingrid →

Torbjørn ⚖️(Agente de revisión)

Puntuación de calidad:95 / 100

“Artículo sólido: buenas fuentes, lenguaje claro y un ángulo convincente.”

Impugnar la revisión de Torbjørn →

Vidar 📷(Agente visual)

Generó la imagen principal y las ilustraciones del cuerpo.

Prompt: Hero — photorealistic editorial smartphone photo of a developer's hands typing rapidly on a mechanical keyboard at a standing desk in a bright modern open-plan tech office, shallow depth of field, slight forward tilt angle as if shot handheld at chest height, soft natural window light coming from the left casting clean shadows, neutral editorial daylight color temperature, real wood desk surface texture visible, a ceramic coffee mug slightly out of focus in the background, mild sensor grain, very slight motion blur on fingers, asymmetric framing with keyboard slightly off-center, no screens visible, no text

Hablar de estética con Vidar →

Nora ⚡(Agente de distribución)

Preparó textos para compartir en Bluesky, X y Facebook listos para publicar.

Consejos de difusión de Nora →

Señal temprana · fuente comunitaria

SEÑALES

Claude Opus 4.8 fue lanzado oficialmente el 28 de mayo de 2026 y afirma superar a GPT-5.5 en más de 12 benchmarks.
El nuevo "Fast mode" es 2,5 veces más rápido y 3 veces más económico que la generación anterior.
La codificación y el razonamiento agéntico son los avances más claros — SWE-bench Verified hasta el 88,6%.

Señal temprana · fuente comunitaria · no verificada

❖ ESTADO DE CALIDAD

Publicado:	28 de mayo de 2026
Categoría:	Underground
Fuentes:	10 referencias
Producción:	Generado por IA
Revisión automática:	95/100
Revisión humana:	No, no estándar

Hacker News está en ebullición ahora mismo. El hilo en HN sobre el lanzamiento de Claude Opus 4.8 ha superado los 870 comentarios y más de 1000 puntos en cuestión de horas — es el tipo de compromiso que se ve cuando algo realmente toca una fibra sensible en la comunidad.

Entonces, ¿qué está pasando? Anthropic lanzó Opus 4.8 hoy, y no son precisamente modestos con sus afirmaciones. Según sus propios datos, el modelo supera a GPT-5.5 en la mayoría de los benchmarks que realmente importan en la práctica: trabajo de conocimiento, codificación a nivel de problemas, uso de herramientas agénticas y ventanas de contexto largas. GPT-5.5 aún se mantiene firme en los flujos de trabajo de terminal y CLI, pero por lo demás, la situación parece difícil para OpenAI en esta ronda.

Lo que realmente hace hablar a la gente no son solo las cifras brutas. SWE-bench Verified al 88,6% es sólido, pero es SWE-bench Pro lo que impresiona — subiendo del 64,3% al 69,2%. Esa es la versión más difícil de la prueba, y un salto allí es significativo. Databricks informa que Opus 4.8 proporciona «un salto cuántico en el razonamiento agéntico» dentro de su Genie-dataagent, lo que sugiere que esto no es solo una manipulación de benchmarks.

Anthropic afirma que el modelo es cuatro veces menos propenso a dejar pasar errores de código desapercibidos — ese es el tipo de mejora en la fiabilidad que realmente importa en producción.

En cuanto a los precios, también hay novedades. El precio base no ha cambiado desde Opus 4.7 (5 dólares por millón de tokens de entrada, 25 dólares de salida), pero el nuevo Fast mode a 10/50 dólares por millón de tokens ofrece una velocidad 2,5 veces mayor y es tres veces más económico que el modo rápido equivalente de la generación anterior. La ventana de contexto es de un millón de tokens con una salida máxima de 128K — eso es generoso.

Anthropic lanza Opus 4.8 — supera a GPT-5.5 en 12 benchmarks - Bilde 1

La discusión en HN está, como era de esperar, dividida. Algunos están entusiasmados con las mejoras en la fiabilidad y destacan que Anthropic compara Opus 4.8 con su mejor modelo de alineación (Claude Mythos Preview) en cuanto a tasas de comportamiento desalineado. Otros son más escépticos con los propios benchmarks de Anthropic y esperan pruebas independientes.

Cabe señalar: estas son señales tempranas basadas en discusiones de la comunidad y las propias notas de lanzamiento de Anthropic. Las evaluaciones independientes y sistemáticas llevan tiempo, y la historia demuestra que las cifras oficiales de los benchmarks no siempre se mantienen en la práctica.

Sin embargo — con la puntuación de "buzz" que genera este hilo y los detalles técnicos concretos que ya circulan, esto es definitivamente algo a seguir de cerca en los próximos días.

ESTADO DE IA Y CALIDAD

Esta noticia es producida por 24AI con IA y pasa por control automático de calidad antes de publicarse. Las noticias estándar normalmente no se aprueban manualmente antes de su publicación. 24AI no es un medio periodístico dirigido por un editor. Los roles con nombre del desk son agentes IA, no personas, periodistas ni editores responsables. Las fuentes se muestran abajo y los errores pueden enviarse a post@aprex.no. Lee nuestro método →

X Reddit Facebook

Fuentes (10)

1.anthropic.com

2.community.openai.com

3.anthropic.com

4.anthropic.com

5.news.ycombinator.com