Anthropic ha lanzado oficialmente Claude Fable 5, presentándolo como el modelo más capaz que la compañía ha puesto a disposición del público hasta la fecha. Según la propia Anthropic, la ventaja sobre sus competidores aumenta cuanto más exigentes y prolongadas son las tareas, algo especialmente relevante para el uso profesional.

De secreto a público: la clase Mythos

Fable 5 representa un cambio histórico para Anthropic. El modelo es el primero de la familia Mythos que se lanza al público en general. Anteriormente, toda la clase Mythos se mantuvo alejada del público porque las propias evaluaciones de seguridad de la compañía concluyeron que los modelos eran demasiado competentes en ciberseguridad para ser lanzados sin más, una evaluación que generó un debate interno sobre el desarrollo responsable de la IA.

Que Anthropic ahora elija lanzar Fable 5 de forma amplia, señala que la compañía cree haber encontrado medidas de seguridad suficientes para hacer el modelo accesible, según The Verge.

La ventaja de rendimiento aumentará cuanto más largas y complejas sean las tareas — una característica que distingue a Fable 5 de las generaciones anteriores
Anthropic lanza Claude Fable 5 — el modelo más potente hasta la fecha - Bilde 1

Fuerte en código y tareas visuales

Anthropic destaca especialmente tres áreas de fortaleza para Fable 5: desarrollo de software, trabajo de conocimiento y comprensión visual. La compañía afirma que el modelo ofrece un rendimiento excepcional en las tres categorías, y que se diferencia más de sus competidores precisamente en las tareas que requieren un tiempo de ejecución más largo y una mayor complejidad.

Esto está en línea con una tendencia que hemos observado en modelos anteriores de Anthropic. En comparación, su predecesor Claude 3.5 Sonnet obtuvo un 80,9 por ciento en SWE-bench Verified — un benchmark reconocido para la ingeniería de software — frente a aproximadamente el 70 por ciento de GPT-4o y el 65 por ciento de Gemini, según los datos de benchmark disponibles. Fable 5 se basará en esta posición.

Una carrera con altas apuestas

El lanzamiento de Fable 5 se produce en un clima competitivo donde OpenAI, Google y Meta están continuamente empujando los límites de lo que los modelos de IA pueden hacer. Anthropic se posiciona claramente en el extremo superior del mercado, con un producto dirigido a usuarios y empresas que necesitan modelos que perduren en el tiempo y en tareas complejas y compuestas.

El primer lanzamiento público de la clase Mythos podría cambiar la clasificación entre los modelos de IA más potentes del mundo

Cabe señalar que las cifras concretas de los benchmarks para Fable 5 específicamente aún no han sido verificadas de forma independiente — las propias afirmaciones de rendimiento de Anthropic deben leerse a la luz de que la compañía tiene interés en presentar el modelo de manera favorable. The Verge, que es la fuente de este artículo, se refiere a las propias declaraciones de Anthropic sin confirmación de terceros en el momento de la publicación.

¿Qué sigue?

Con Fable 5 ya en el mercado, es razonable esperar que los benchmarks independientes y los informes de usuarios ofrezcan una imagen más matizada de las fortalezas y debilidades reales del modelo en las próximas semanas. En particular, será interesante ver cómo se desempeña el modelo en tareas largas y de tipo "agentic", donde la propia Anthropic cree que se destaca más.