Open Source

La IA open source ha alcanzado a GPT-4. Pero la licencia puede destruir tu empresa.

DeepSeek, Llama y Qwen ahora igualan a GPT-4 en la mayoría de pruebas. Pero «open source» no significa lo que crees, y la licencia equivocada puede hundir tu empresa.

Traducido automáticamente del original noruego por 24AI.

24AI Automated Desk

7 de junio de 2026·7 min lectura

La IA open source ha alcanzado a GPT-4. Pero la licencia puede destruir tu empresa.

Detrás de la noticia ⚡ (telemetría IA)Clic para abrir

Aquí puedes ver cómo seis agentes IA con nombre dentro del flujo de 24AI captaron, verificaron, escribieron, revisaron y visualizaron esta noticia. Los agentes son roles de sistema, no personas, periodistas ni editores responsables.

Sigrid ⚖️(Agente de publicación)

Consideró la noticia muy relevante para la audiencia y la pasó adelante en el flujo de 24AI.

Pregunta a Sigrid →

Eskil 🔍(Agente de research)

Realizó búsquedas en Google y verificó la información con 10 fuentes independientes.

Ver research con Eskil →

Ingrid ✍️(Agente de escritura)

Redactó el artículo en estilo tabloide claro, preparó el TL;DR y añadió citas estructurales.

Debatir el ángulo con Ingrid →

Torbjørn ⚖️(Agente de revisión)

Puntuación de calidad:74 / 100

“Artículo sólido: buenas fuentes, lenguaje claro y un ángulo convincente.”

Impugnar la revisión de Torbjørn →

Vidar 📷(Agente visual)

Generó la imagen principal y las ilustraciones del cuerpo.

Prompt: A developer in a modern Scandinavian office sits at a workstation with multiple monitors showing terminal windows and code, natural bright Nordic daylight floods through floor-to-ceiling windows, hands on keyboard mid-workflow, documentary style, mild sensor grain, no text or logos visible, photorealistic editorial photography

Hablar de estética con Vidar →

Nora ⚡(Agente de distribución)

Preparó textos para compartir en Bluesky, X y Facebook listos para publicar.

Consejos de difusión de Nora →

TL;DR

Modelos open source como DeepSeek V3.2, Llama 4 Scout y Qwen 3.5 igualan o superan a GPT-4 en la mayoría de benchmarks en 2026
«Open source» es en la mayoría de casos una mentira: la mayoría son solo «open weights», sin datos de entrenamiento ni código abiertos
Licencias como la «poison pill» de Llama y el «bait and switch» de Mistral pueden paralizar tu crecimiento o forzarte a una exposición legal peligrosa
Apache 2.0 es el único refugio seguro para SaaS comercial: todo lo demás requiere revisión legal

❖ ESTADO DE CALIDAD

Publicado:	7 de junio de 2026
Categoría:	Open Source
Fuentes:	10 referencias
Producción:	Generado por IA
Revisión automática:	Verificada
Revisión humana:	No, no estándar

Miles de desarrolladores y empresas se lanzan sobre modelos de IA «gratuitos» sin leer una sola línea del texto de la licencia. ¿El resultado? Startups europeas obligadas a publicar su código más valioso, el crecimiento de empresas bloqueado por umbrales de usuarios ocultos, y negocios domiciliados en la UE que descubren que ni siquiera tienen derecho a usar los modelos sobre los que han construido su producto. La revolución de la IA «abierta» tiene un precio oculto — y puede ser brutal.

El rendimiento es real: el open source ha alcanzado

Hace tres años, la brecha entre modelos abiertos y propietarios era enorme. Hoy, apenas es medible en tareas estándar.

Según datos de leaderboard de lmmarketcap.com y perspectiveai.xyz, DeepSeek V3.2 supera el 85 por ciento en GPQA Diamond y el 72 por ciento en SWE-Bench Verified — a un precio de solo 0,28 dólares por millón de tokens. El Llama 4 Scout de Meta entrega 2.600 tokens por segundo con una ventana de contexto de 10 millones de tokens. El Qwen 3.5 de Alibaba existe en variantes de hasta 0,8 mil millones de parámetros, a un precio de 0,02 dólares por millón de tokens para las versiones más pequeñas.

En HumanEval — el benchmark estándar de generación de código — tanto Llama 4 Scout como Qwen 3.5 superan el 88 por ciento. GPT-5 puntúa un 93 por ciento. En flujos de trabajo de programación prácticos, esta diferencia desaparece en gran medida, según el análisis de hardware y benchmarks de convly.ai.

El Hugging Face Open LLM Leaderboard lista ahora 223 modelos open-weights de un total de 356. El open source constituye la mayoría del mercado total.

La IA open source ha alcanzado a GPT-4. Pero la licencia puede destruir tu empresa. - Bilde 1

TABLA COMPARATIVA: Mejores modelos open source 2026

Modelo	Parámetros activos	Precio ($/1M tokens)	GPQA Diamond	Contexto	Licencia
DeepSeek V3.2	MoE desconocido	$0,28	85%+	128K	DeepSeek License
Llama 4 Scout	17B / 109B total	$0,28	~82%	10M	Llama Community
Llama 4 Maverick	17B / 400B total	Variable	~84%	128K	Llama Community
Qwen 3.5 (80B)	80B	$0,28	~83%	128K	Apache 2.0 / Qwen
Qwen 3.5 (0.8B)	0,8B	$0,02	N/A	32K	Apache 2.0
Mistral Large 3	Desconocido	$0,75	~80%	256K	Mistral Research
Kimi K2.5	MoE desconocido	Variable	~81%	128K	MIT modificado
OLMo (Allen Inst.)	7B–70B	Gratis (autoalojado)	~70%	32K	Apache 2.0

Fuentes: lmmarketcap.com, perspectiveai.xyz, topaihubs.com, clickrank.ai

> PULLQUOTE: «La IA open source no es gratuita. Es gratuita hasta que deja de serlo — y normalmente lo descubres en el peor momento posible.»

¿Qué brecha permanece?

Los modelos abiertos no han ganado en todos los frentes.

En Humanity's Last Exam — el benchmark de razonamiento académico más exigente — los modelos open-weights puntúan entre 40 y 52 por ciento. Los modelos propietarios de frontera como Claude Mythos Preview puntúan entre 60 y 64,7 por ciento. Es una brecha que no puede explicarse por el ruido de los benchmarks.

DeepSeek V3.2 puntúa 85 por ciento en GPQA Diamond. Claude Mythos Preview puntúa 94,6 por ciento. En tareas agénticas — WebArena y OSWorld — los modelos propietarios siguen liderando con un margen claro, según el análisis comparativo de leaderboard de clickrank.ai.

Para la mayoría de aplicaciones empresariales, esto no importa. Para el uso autónomo avanzado de agentes y el razonamiento científico de primer nivel, importa enormemente.

> CAJA DE DATOS: ¿Qué es el «verdadero» open source en IA?

> OSI (Open Source Initiative) publicó OSAID — la Definición de IA Open Source — en 2026. Los requisitos son claros:

> - Acceso completo a datos de entrenamiento o documentación transparente del conjunto de datos

> - Código abierto para el pipeline de entrenamiento

> - Pesos del modelo abiertos

> La gran mayoría de modelos «open source» solo cumplen el último requisito. Son técnicamente open weights — no open source. Ejemplos de open source real según el estándar OSI: OLMo (Allen Institute for AI) y Pythia (EleutherAI), ambos bajo Apache 2.0.

Las trampas de licencia que pueden hundir tu empresa

Aquí es donde realmente duele.

Llama Community License: Poison pill para el crecimiento

La licencia Llama de Meta contiene una cláusula que se activa al alcanzar los 700 millones de usuarios activos mensuales. Si tu producto cruza ese umbral, Meta exige un acuerdo de licencia comercial separado. Pero va más lejos: la licencia bloquea efectivamente las adquisiciones por parte de grandes empresas tecnológicas — conocida como la cláusula «poison pill». Y a principios de 2026, los modelos Llama 4 no están disponibles para empresas domiciliadas en la UE, según el análisis de aplicar.ai sobre la familia Llama 4.

Mistral Research License: Bait and switch

Mistral 7B era Apache 2.0 — seguro y sencillo. Pero los modelos más nuevos como Mistral Large 3 usan la Mistral Research License (MRL). El modelo es gratuito para investigación. Para producción se requiere una licencia de pago. Muchas empresas han construido sobre modelos MRL creyendo que el acceso gratuito para investigación se extiende al uso comercial. No es así, según el análisis de patentailab.com sobre trampas de licencia en IA open source.

Licencias RAIL: Copyleft viral

Las Responsible AI Licenses contienen mecanismos de copyleft que pueden obligarte a publicar los pesos de tu modelo ajustado. En el primer trimestre de 2026, una startup europea de legal-tech fue obligada a publicar su modelo ajustado después de haber usado un modelo base con licencia RAIL en producción. El error «gratuito» más caro del año.

Kimi K2.5: MIT modificado con requisitos de atribución

Kimi K2.5 usa una licencia MIT modificada que permite el uso comercial. Pero si tu producto supera los 100 millones de usuarios activos mensuales, se requiere una atribución destacada de «Kimi K2.5» dentro del producto. Para la mayoría de startups es irrelevante — pero no construyas tu estrategia de salida sin haberlo leído.

> CIFRA CLAVE:

> 85% — DeepSeek V3.2 en GPQA Diamond (vs. 94,6% de Claude Mythos Preview)

> $0,02 — Precio por millón de tokens para Qwen 3.5 0.8B

> 700M MAU — Umbral de poison pill de la licencia Llama

> 40–52% — Puntuación de los modelos open-weights en Humanity's Last Exam

La Ley de IA de la UE lo complica aún más

La Ley de IA de la UE concede exenciones de ciertos requisitos regulatorios para componentes «libres y open source». Pero los modelos con restricciones comerciales, restricciones de campo de uso o cláusulas de umbral de usuarios no califican para esta exención, según la revisión de examcert.app sobre regulación de IA y certificaciones en 2026.

El resultado: las empresas europeas que usan Llama 4 o modelos MRL en producción no pueden invocar la exención open source bajo la Ley de IA de la UE. Están sujetas al cumplimiento completo — sin el soporte comercial que viene con los modelos propietarios.

Cómo ejecutarlo localmente — y qué requiere

Para el despliegue autogestionado, dominan tres herramientas principales: Ollama (configuración más sencilla para usuarios individuales), llama.cpp (inferencia en C++ optimizada para hardware de consumo) y vLLM (servidor de producción de alto rendimiento). Los formatos de cuantización como GGUF, AWQ y GPTQ permiten ejecutar modelos de entre 7 y 70 mil millones de parámetros en 8 a 48 GB de VRAM.

En dispositivos edge y teléfonos, el open source ya está ganando: Gemma 3n, las variantes más pequeñas de Qwen 3.5 y Phi-4 Mini 3.8B funcionan en dispositivos móviles modernos. Este es un terreno donde los servicios cloud propietarios no pueden competir.

> DESTACADO: La contaminación de datos es un riesgo real. DeepSeek V3.2 ha enfrentado preguntas sobre posible solapamiento entre los datos de entrenamiento y los conjuntos de prueba de los benchmarks — lo que podría explicar en parte sus impresionantes puntuaciones en GPQA. No se ha publicado ninguna verificación independiente a la fecha de este artículo.

La única licencia segura para SaaS comercial

Apache 2.0 es la única licencia que proporciona libertad comercial total sin restricciones de campo, cláusulas de umbral de usuarios ni mecanismos de copyleft. También incluye una concesión de patente — protección importante si construyes productos sobre pesos de modelos. Ejemplos: OLMo del Allen Institute y Pythia de EleutherAI.

Para todo lo demás: lee la licencia. Completa. Y después haz que tu abogado la lea.

CONCLUSIÓN FINAL

La IA open source en 2026 es real, potente y accesible para todos. Pero «open source» se ha convertido en un término de marketing tanto como en uno técnico. La mayoría de los modelos son open weights — no open source según la definición de OSI. En cuanto al rendimiento, la brecha con GPT-4 ha desaparecido para tareas estándar; la brecha con los mejores modelos propietarios sigue existiendo para el razonamiento avanzado y las tareas agénticas.

Las trampas de licencia son más peligrosas que los números de rendimiento. La poison pill de Llama, el bait and switch de Mistral y el copyleft viral de las licencias RAIL ya han perjudicado a empresas europeas en 2026. Construye sobre modelos Apache 2.0 donde sea posible. Usa todo lo demás con los ojos bien abiertos y asesoramiento legal.

La revolución de la IA abierta es real. Solo asegúrate de que realmente eres dueño de lo que estás construyendo sobre ella.

Verificado contra 10 fuentes primarias abiertas.

ESTADO DE IA Y CALIDAD

Esta noticia es producida por 24AI con IA y pasa por control automático de calidad antes de publicarse. Las noticias estándar normalmente no se aprueban manualmente antes de su publicación. 24AI no es un medio periodístico dirigido por un editor. Los roles con nombre del desk son agentes IA, no personas, periodistas ni editores responsables. Las fuentes se muestran abajo y los errores pueden enviarse a post@aprex.no. Lee nuestro método →

Fuentes (10)