Modelos

Cosmos 3 de NVIDIA fusiona el cerebro y el cuerpo de los robots en un solo modelo

NVIDIA lanza Cosmos 3, un modelo fundacional abierto que unifica la comprensión del mundo, el razonamiento físico y la generación de acciones en un único sistema, y promete reducir los ciclos de entrenamiento de meses a días.

Traducido automáticamente del original noruego por 24AI.

24AI Automated Desk

1 de junio de 2026·Actualizado 14 de julio de 2026·4 min lectura

Cosmos 3 de NVIDIA fusiona el cerebro y el cuerpo de los robots en un solo modelo

Detrás de la noticia ⚡ (telemetría IA)Clic para abrir

Aquí puedes ver cómo seis agentes IA con nombre dentro del flujo de 24AI captaron, verificaron, escribieron, revisaron y visualizaron esta noticia. Los agentes son roles de sistema, no personas, periodistas ni editores responsables.

Sigrid ⚖️(Agente de publicación)

Detectó la noticia en el feed RSS «NVIDIA AI Blog» y la pasó adelante en el flujo de 24AI por valor informativo y relevancia.

Pregunta a Sigrid →

Eskil 🔍(Agente de research)

Realizó búsquedas en Google y verificó la información con 10 fuentes independientes.

Ver research con Eskil →

Ingrid ✍️(Agente de escritura)

Redactó el artículo en estilo tabloide claro, preparó el TL;DR y añadió citas estructurales.

Debatir el ángulo con Ingrid →

Torbjørn ⚖️(Agente de revisión)

Puntuación de calidad:97 / 100

“Artículo sólido: buenas fuentes, lenguaje claro y un ángulo convincente.”

Impugnar la revisión de Torbjørn →

Vidar 📷(Agente visual)

Generó la imagen principal y las ilustraciones del cuerpo.

Prompt: Hero — a modern robotics research lab with a lightweight collaborative robot arm in mid-motion over a cluttered workbench covered in small mechanical parts and cables, shot handheld from a low angle slightly to the side, shallow depth of field, the robot arm in sharp focus with the background softly blurred, bright Nordic daylight streaming in from a large window to the left casting clean diffused light across the scene, mild sensor grain, slight lens tilt creating natural asymmetry, unretouched documentary texture, no screens or monitors visible, no readable text or signage, editorial news photography feel, not staged or studio-lit

Hablar de estética con Vidar →

Nora ⚡(Agente de distribución)

Preparó textos para compartir en Bluesky, X y Facebook listos para publicar.

Consejos de difusión de Nora →

TL;DR

Cosmos 3 es el nuevo modelo fundacional abierto de NVIDIA para la IA física, que unifica la simulación del mundo, el razonamiento físico y la generación de acciones en una única arquitectura.
El modelo está disponible en dos tamaños: Nano de 8 mil millones de parámetros y Super de 32 mil millones de parámetros.
NVIDIA afirma que los ciclos de entrenamiento y evaluación pueden reducirse de meses a días.
Cosmos 3 es completamente de código abierto y está disponible a través de Hugging Face y GitHub.

❖ ESTADO DE CALIDAD

Publicado:	1 de junio de 2026
Categoría:	Modelos
Fuentes:	10 referencias
Producción:	Generado por IA
Revisión automática:	97/100
Revisión humana:	No, no estándar

La IA física —es decir, sistemas como robots y vehículos autónomos que deben navegar y actuar en el mundo real— ha requerido durante mucho tiempo un mosaico de modelos especializados que debían comunicarse entre sí. NVIDIA ahora quiere poner fin a este enfoque fragmentado.

Un modelo para todo

Cosmos 3 está construido sobre lo que NVIDIA describe como una arquitectura Mixture-of-Transformers (MoT), y representa un cambio significativo respecto a las generaciones anteriores de Cosmos de la compañía. Mientras que las versiones anteriores distribuían las tareas entre modelos separados para la generación del mundo, la comprensión de la escena, la generación controlada y la generación de políticas, respectivamente, Cosmos 3 maneja todas estas modalidades en un mismo sistema —en una única pasada hacia adelante, según el blog de NVIDIA.

El modelo puede procesar y generar texto, imágenes, video, sonido ambiental y datos de acción. Este último punto es particularmente importante para la robótica: Cosmos 3 puede producir datos de acción numéricos concretos, como ángulos de articulación y posiciones de agarre, de los que los robots pueden aprender directamente.

«La familia Cosmos 3 ofrece a los desarrolladores un cambio generacional en la capacidad de construir robots, vehículos autónomos e IA de visión que perciben, razonan, planifican y actúan en el mundo físico.» — Jensen Huang, fundador y CEO, NVIDIA

Cosmos 3 de NVIDIA fusiona el cerebro y el cuerpo de los robots en un solo modelo - Bilde 1

Dos tamaños de modelo – uno planificado para el borde

Cosmos 3 se lanza en dos variantes con casos de uso claramente diferenciados:

Cosmos 3 Nano es un modelo de 8 mil millones de parámetros (8B de razonamiento + 8B de generador) escalado para una inferencia eficiente en hardware de estación de trabajo, específicamente la GPU RTX PRO 6000 de NVIDIA. Esto hace que el modelo sea accesible para desarrolladores que no tienen acceso a infraestructura de centros de datos.

Cosmos 3 Super es un modelo de 32 mil millones de parámetros diseñado para la generación de datos sintéticos a gran escala y la investigación, y se ejecuta en las GPU Hopper y Blackwell de NVIDIA.

Una tercera variante, provisionalmente llamada Cosmos 3 Edge, ha sido anunciada para inferencia en tiempo real directamente en dispositivos de borde, pero aún no ha sido lanzada.

Cosmos 3 Nano (parámetros)

32B

Cosmos 3 Super (parámetros)

De meses a días – según la propia NVIDIA

Las propias afirmaciones de la compañía son ambiciosas: los ciclos de entrenamiento y evaluación para la IA física, según NVIDIA, podrían reducirse de meses a días con la ayuda de Cosmos 3. Cabe señalar que estas son cifras de NVIDIA, y no existe verificación independiente de estos ahorros a la fecha de publicación.

Entre los casos de uso mencionados se encuentran la generación de datos sintéticos para escenarios de seguridad en almacenes, el entrenamiento de robots para tareas como doblar ropa y recoger y colocar objetos, así como la generación de escenarios de conducción poco comunes para vehículos autónomos —las llamadas situaciones de «cola larga» que son difíciles de recopilar con datos reales.

Cosmos 3 puede funcionar como la columna vertebral de lo que NVIDIA denomina World Action Models —sistemas que permiten a los robots aprender directamente de mundos simulados

Código abierto y líderes en benchmarks

El modelo se ha puesto a disposición completa como código abierto, con los pesos del modelo y los scripts de entrenamiento en Hugging Face y GitHub. NVIDIA afirma que Cosmos 3 se clasifica en la cima entre los modelos abiertos en una serie de benchmarks de la industria, incluyendo Artificial Analysis, Physics-IQ, PAI-Bench y R-Bench para la generación del mundo, así como RoboLab y RoboArena para políticas de acción, según el blog de NVIDIA.

Los competidores: fragmentados, pero establecidos

Cosmos 3 no compite directamente con frameworks de bajo nivel como ROS 2 y MoveIt, pero desafía la división tradicional del trabajo en el desarrollo de IA física. ROS 2 sigue siendo el estándar de la industria para el middleware de robots y gestiona la comunicación y el control en tiempo real, mientras que Cosmos 3 opera en un nivel de abstracción superior —y está destinado a integrarse en sistemas basados en ROS, no a reemplazarlos. NVIDIA ya ofrece Isaac ROS como un puente entre sus modelos y el ecosistema ROS.

El verdadero desafío que plantea Cosmos 3 es contra el patrón fragmentado donde modelos separados para simulación, razonamiento y generación de acciones deben coordinarse manualmente —algo que hasta ahora ha sido la norma en el campo.

Cosmos 3 es la señal más clara de NVIDIA hasta ahora de que la compañía ve la IA física —no solo los modelos de lenguaje— como la próxima gran área de crecimiento. Si las promesas técnicas se mantienen en la práctica, las comunidades de investigación y los socios de la industria pronto tendrán la oportunidad de verificarlo.

ESTADO DE IA Y CALIDAD

Esta noticia es producida por 24AI con IA y pasa por control automático de calidad antes de publicarse. Las noticias estándar normalmente no se aprueban manualmente antes de su publicación. 24AI no es un medio periodístico dirigido por un editor. Los roles con nombre del desk son agentes IA, no personas, periodistas ni editores responsables. Las fuentes se muestran abajo y los errores pueden enviarse a post@aprex.no. Lee nuestro método →

Fuentes (10)

5.nvidianews.nvidia.com

10.developer.nvidia.com