Miles de desarrolladores y empresas se lanzan sobre modelos de IA «gratuitos» sin leer una sola línea del texto de la licencia. ¿El resultado? Startups europeas obligadas a publicar su código más valioso, el crecimiento de empresas bloqueado por umbrales de usuarios ocultos, y negocios domiciliados en la UE que descubren que ni siquiera tienen derecho a usar los modelos sobre los que han construido su producto. La revolución de la IA «abierta» tiene un precio oculto — y puede ser brutal.


El rendimiento es real: el open source ha alcanzado

Hace tres años, la brecha entre modelos abiertos y propietarios era enorme. Hoy, apenas es medible en tareas estándar.

Según datos de leaderboard de lmmarketcap.com y perspectiveai.xyz, DeepSeek V3.2 supera el 85 por ciento en GPQA Diamond y el 72 por ciento en SWE-Bench Verified — a un precio de solo 0,28 dólares por millón de tokens. El Llama 4 Scout de Meta entrega 2.600 tokens por segundo con una ventana de contexto de 10 millones de tokens. El Qwen 3.5 de Alibaba existe en variantes de hasta 0,8 mil millones de parámetros, a un precio de 0,02 dólares por millón de tokens para las versiones más pequeñas.

En HumanEval — el benchmark estándar de generación de código — tanto Llama 4 Scout como Qwen 3.5 superan el 88 por ciento. GPT-5 puntúa un 93 por ciento. En flujos de trabajo de programación prácticos, esta diferencia desaparece en gran medida, según el análisis de hardware y benchmarks de convly.ai.

El Hugging Face Open LLM Leaderboard lista ahora 223 modelos open-weights de un total de 356. El open source constituye la mayoría del mercado total.


La IA open source ha alcanzado a GPT-4. Pero la licencia puede destruir tu empresa. - Bilde 1

TABLA COMPARATIVA: Mejores modelos open source 2026

ModeloParámetros activosPrecio ($/1M tokens)GPQA DiamondContextoLicencia
DeepSeek V3.2MoE desconocido$0,2885%+128KDeepSeek License
Llama 4 Scout17B / 109B total$0,28~82%10MLlama Community
Llama 4 Maverick17B / 400B totalVariable~84%128KLlama Community
Qwen 3.5 (80B)80B$0,28~83%128KApache 2.0 / Qwen
Qwen 3.5 (0.8B)0,8B$0,02N/A32KApache 2.0
Mistral Large 3Desconocido$0,75~80%256KMistral Research
Kimi K2.5MoE desconocidoVariable~81%128KMIT modificado
OLMo (Allen Inst.)7B–70BGratis (autoalojado)~70%32KApache 2.0

Fuentes: lmmarketcap.com, perspectiveai.xyz, topaihubs.com, clickrank.ai


> PULLQUOTE: «La IA open source no es gratuita. Es gratuita hasta que deja de serlo — y normalmente lo descubres en el peor momento posible.»


¿Qué brecha permanece?

Los modelos abiertos no han ganado en todos los frentes.

En Humanity's Last Exam — el benchmark de razonamiento académico más exigente — los modelos open-weights puntúan entre 40 y 52 por ciento. Los modelos propietarios de frontera como Claude Mythos Preview puntúan entre 60 y 64,7 por ciento. Es una brecha que no puede explicarse por el ruido de los benchmarks.

DeepSeek V3.2 puntúa 85 por ciento en GPQA Diamond. Claude Mythos Preview puntúa 94,6 por ciento. En tareas agénticas — WebArena y OSWorld — los modelos propietarios siguen liderando con un margen claro, según el análisis comparativo de leaderboard de clickrank.ai.

Para la mayoría de aplicaciones empresariales, esto no importa. Para el uso autónomo avanzado de agentes y el razonamiento científico de primer nivel, importa enormemente.


> CAJA DE DATOS: ¿Qué es el «verdadero» open source en IA?

>

> OSI (Open Source Initiative) publicó OSAID — la Definición de IA Open Source — en 2026. Los requisitos son claros:

> - Acceso completo a datos de entrenamiento o documentación transparente del conjunto de datos

> - Código abierto para el pipeline de entrenamiento

> - Pesos del modelo abiertos

>

> La gran mayoría de modelos «open source» solo cumplen el último requisito. Son técnicamente open weights — no open source. Ejemplos de open source real según el estándar OSI: OLMo (Allen Institute for AI) y Pythia (EleutherAI), ambos bajo Apache 2.0.


Las trampas de licencia que pueden hundir tu empresa

Aquí es donde realmente duele.

Llama Community License: Poison pill para el crecimiento

La licencia Llama de Meta contiene una cláusula que se activa al alcanzar los 700 millones de usuarios activos mensuales. Si tu producto cruza ese umbral, Meta exige un acuerdo de licencia comercial separado. Pero va más lejos: la licencia bloquea efectivamente las adquisiciones por parte de grandes empresas tecnológicas — conocida como la cláusula «poison pill». Y a principios de 2026, los modelos Llama 4 no están disponibles para empresas domiciliadas en la UE, según el análisis de aplicar.ai sobre la familia Llama 4.

Mistral Research License: Bait and switch

Mistral 7B era Apache 2.0 — seguro y sencillo. Pero los modelos más nuevos como Mistral Large 3 usan la Mistral Research License (MRL). El modelo es gratuito para investigación. Para producción se requiere una licencia de pago. Muchas empresas han construido sobre modelos MRL creyendo que el acceso gratuito para investigación se extiende al uso comercial. No es así, según el análisis de patentailab.com sobre trampas de licencia en IA open source.

Licencias RAIL: Copyleft viral

Las Responsible AI Licenses contienen mecanismos de copyleft que pueden obligarte a publicar los pesos de tu modelo ajustado. En el primer trimestre de 2026, una startup europea de legal-tech fue obligada a publicar su modelo ajustado después de haber usado un modelo base con licencia RAIL en producción. El error «gratuito» más caro del año.

Kimi K2.5: MIT modificado con requisitos de atribución

Kimi K2.5 usa una licencia MIT modificada que permite el uso comercial. Pero si tu producto supera los 100 millones de usuarios activos mensuales, se requiere una atribución destacada de «Kimi K2.5» dentro del producto. Para la mayoría de startups es irrelevante — pero no construyas tu estrategia de salida sin haberlo leído.


> CIFRA CLAVE:

>

> 85% — DeepSeek V3.2 en GPQA Diamond (vs. 94,6% de Claude Mythos Preview)

>

> $0,02 — Precio por millón de tokens para Qwen 3.5 0.8B

>

> 700M MAU — Umbral de poison pill de la licencia Llama

>

> 40–52% — Puntuación de los modelos open-weights en Humanity's Last Exam


La Ley de IA de la UE lo complica aún más

La Ley de IA de la UE concede exenciones de ciertos requisitos regulatorios para componentes «libres y open source». Pero los modelos con restricciones comerciales, restricciones de campo de uso o cláusulas de umbral de usuarios no califican para esta exención, según la revisión de examcert.app sobre regulación de IA y certificaciones en 2026.

El resultado: las empresas europeas que usan Llama 4 o modelos MRL en producción no pueden invocar la exención open source bajo la Ley de IA de la UE. Están sujetas al cumplimiento completo — sin el soporte comercial que viene con los modelos propietarios.


Cómo ejecutarlo localmente — y qué requiere

Para el despliegue autogestionado, dominan tres herramientas principales: Ollama (configuración más sencilla para usuarios individuales), llama.cpp (inferencia en C++ optimizada para hardware de consumo) y vLLM (servidor de producción de alto rendimiento). Los formatos de cuantización como GGUF, AWQ y GPTQ permiten ejecutar modelos de entre 7 y 70 mil millones de parámetros en 8 a 48 GB de VRAM.

En dispositivos edge y teléfonos, el open source ya está ganando: Gemma 3n, las variantes más pequeñas de Qwen 3.5 y Phi-4 Mini 3.8B funcionan en dispositivos móviles modernos. Este es un terreno donde los servicios cloud propietarios no pueden competir.


> DESTACADO: La contaminación de datos es un riesgo real. DeepSeek V3.2 ha enfrentado preguntas sobre posible solapamiento entre los datos de entrenamiento y los conjuntos de prueba de los benchmarks — lo que podría explicar en parte sus impresionantes puntuaciones en GPQA. No se ha publicado ninguna verificación independiente a la fecha de este artículo.


La única licencia segura para SaaS comercial

Apache 2.0 es la única licencia que proporciona libertad comercial total sin restricciones de campo, cláusulas de umbral de usuarios ni mecanismos de copyleft. También incluye una concesión de patente — protección importante si construyes productos sobre pesos de modelos. Ejemplos: OLMo del Allen Institute y Pythia de EleutherAI.

Para todo lo demás: lee la licencia. Completa. Y después haz que tu abogado la lea.


CONCLUSIÓN FINAL

La IA open source en 2026 es real, potente y accesible para todos. Pero «open source» se ha convertido en un término de marketing tanto como en uno técnico. La mayoría de los modelos son open weights — no open source según la definición de OSI. En cuanto al rendimiento, la brecha con GPT-4 ha desaparecido para tareas estándar; la brecha con los mejores modelos propietarios sigue existiendo para el razonamiento avanzado y las tareas agénticas.

Las trampas de licencia son más peligrosas que los números de rendimiento. La poison pill de Llama, el bait and switch de Mistral y el copyleft viral de las licencias RAIL ya han perjudicado a empresas europeas en 2026. Construye sobre modelos Apache 2.0 donde sea posible. Usa todo lo demás con los ojos bien abiertos y asesoramiento legal.

La revolución de la IA abierta es real. Solo asegúrate de que realmente eres dueño de lo que estás construyendo sobre ella.


Verificado contra 10 fuentes primarias abiertas.