Un issue de GitHub en el repositorio de Nex-N2 hizo que el underground de HN se volviera loco esta semana. El quid de la cuestión: Río de Janeiro habría lanzado lo que se comercializó como un gran modelo de lenguaje «casero» — una especie de símbolo de orgullo tecnológico para la ciudad. ¿El problema? Un puñado de personas de la comunidad investigaron los pesos y la arquitectura del modelo, y creen que se parece sospechosamente a una fusión de modelos de código abierto ya existentes.
Para quienes no estén familiarizados: una «fusión» (merge) significa que se combinan los pesos de dos o más modelos existentes — es una técnica legítima, pero no es lo mismo que entrenar un modelo desde cero. Es aproximadamente la diferencia entre hornear pan uno mismo y comprar dos panes y mezclar las rebanadas.
Y ahí es precisamente donde radica el problema. Investigar lo que realmente cuesta entrenar un LLM desde cero es una lectura brutal: incluso un pequeño modelo 7B puede costar cientos de miles de dólares solo en computación, y un modelo frontier adecuado puede superar fácilmente los 100 millones de dólares. Esto facilita que un ojo entrenado de la comunidad detecte algo extraño cuando una ciudad anuncia de repente su modelo «propio» sin los recursos correspondientes.

Lo que hace que este hilo de HN sea aún más interesante no es solo la revelación en sí — es la velocidad. La investigación de la comunidad aparentemente no tomó mucho tiempo. La fusión de modelos es una práctica extendida en el entorno de código abierto (y absolutamente no ilegal si las licencias lo permiten), pero comercializar el resultado como una innovación «casera» es otra cuestión. Esto crea falsas expectativas y oculta el crédito real de quienes realmente entrenaron los modelos originales.
Este patrón no es nuevo. Hemos visto casos similares antes donde empresas o instituciones toman modelos existentes basados en Llama o Mistral, realizan un poco de fine-tuning o fusión, y lo presentan como algo revolucionario. Pero con una comunidad de código abierto cada vez más sofisticada, es más difícil salirse con la suya.
Evaluación de la fuente: Esto se basa en hallazgos de la comunidad de HN y GitHub. Aún no se ha publicado ninguna auditoría técnica independiente, y Nex-N2 / el lado de Río no ha emitido una respuesta pública hasta el momento. Estén atentos — esto podría evolucionar rápidamente.
