Un hilo que está ganando tracción en Product Hunt ahora mismo trata sobre Poolside y sus nuevos modelos Laguna — y vale la pena echar un vistazo más de cerca antes de que se ahogue en el ruido de los grandes nombres habituales.

Poolside es una empresa con sede en San Francisco que ha pasado relativamente desapercibida, pero que, evidentemente, ha aprovechado bien el tiempo. La familia Laguna consta de dos modelos: M.1, el buque insignia con 225 mil millones de parámetros totales (pero solo 23 mil millones activados gracias a la arquitectura MoE), y XS.2, un hermano menor compacto de 33 mil millones de parámetros totales con solo 3 mil millones activados.

Ambos han sido entrenados con 30 billones de tokens con un propósito claro: codificación agéntica. No son chatbots generales. No son modelos para todo. Código, tareas largas, llamadas a herramientas — para esto están construidos.

XS.2 obtiene una puntuación del 68,2% en SWE-bench Verified — y se ejecuta en tu portátil.

Las cifras que hacen que la gente levante las cejas: Laguna M.1 alcanza el 72,5% en SWE-bench Verified, lo que supera a Devstral 2 (72,2%) y lo sitúa justo por debajo de Claude Sonnet 4.6 (79,6%) en esa lista. En SWE-Bench Pro, M.1 se acerca a modelos como Qwen-3.5 y DeepSeek V4-Flash — modelos que son significativamente más grandes.

Lanzamiento de Poolside Laguna: Modelo pequeño supera a grandes competidores - Bilde 1

Pero lo realmente interesante es XS.2. Obtiene una puntuación del 44,5% en SWE-Bench Pro — casi idéntica a la de su hermano mayor M.1 — y ha sido lanzado como open-weight bajo Apache 2.0. Puedes descargarlo, ejecutarlo localmente, usarlo comercialmente. Y solo requiere 36 GB de RAM, es decir, al alcance de un Mac Studio o similar.

¿Por qué es esto interesante más allá de las cifras de los benchmarks? Porque demuestra que el entrenamiento personalizado en aprendizaje por refuerzo agéntico y la curación de datos sintéticos pueden compensar masivamente el tamaño puro del modelo. Poolside no ha ganado lanzando más computación al problema — ha ganado enfocándose.

M.1 está disponible de forma gratuita a través de la API de Poolside y en OpenRouter ahora mismo (por tiempo limitado), lo que permite a los desarrolladores probarlo sin pagar nada. Esto reduce la barrera para probarlo por sí mismos.

Hay que tener en cuenta que estas son señales tempranas de fuentes de la comunidad y de la página del producto — aún faltan evaluaciones independientes y a largo plazo de estos modelos en producción. Pero las cifras son lo suficientemente buenas como para que valga la pena seguir de cerca a Poolside en el futuro. Especialmente si trabajas con flujos de trabajo agénticos y buscas una alternativa de peso abierto que realmente cumpla.