La IA agéntica —sistemas capaces de planificar, razonar y ejecutar tareas complejas con mínima intervención humana— ha sido prometedora en teoría durante mucho tiempo. Ahora, NVIDIA y Microsoft intentan entregar la infraestructura subyacente que convertirá esa promesa en realidad, según una publicación de blog de NVIDIA.
Una pila coherente
La asociación tiene como objetivo cubrir toda la cadena: hardware potente, modelos optimizados, entornos de ejecución seguros y una capa de datos receptiva. Según NVIDIA, esto es necesario para que los agentes puedan ejecutarse de manera estable durante mucho tiempo y en entornos de producción — no solo como demostraciones en un laboratorio.
Por el lado de Azure, Microsoft está desplegando cientos de miles de GPU NVIDIA Blackwell, incluyendo sistemas a escala de rack GB200 NVL72. El objetivo es un rendimiento equivalente a diez veces el de las supercomputadoras más rápidas de la actualidad, lo que proporcionará una capacidad masiva para tareas de inferencia en la nube.

Microservicios NIM y modelos de razonamiento
Azure AI Foundry ahora integra los microservicios NIM de NVIDIA —contenedores preoptimizados para más de dos docenas de modelos fundacionales populares—. Estos están diseñados para acelerar la inferencia en flujos de trabajo basados en agentes.
Además, los modelos Llama Nemotron Reason de NVIDIA se ponen a disposición a través de Azure AI Foundry, y son especialmente adecuados para marcos de agentes como LangChain Deep Agents. Nemotron 3 Ultra también forma parte de la oferta y está optimizado para tareas de razonamiento intensivas.
La IA agéntica requiere más que buenos modelos — requiere hardware rápido, entornos de ejecución seguros y una capa de datos receptiva.
Seguridad bajo la capa de agente
Uno de los elementos técnicamente más interesantes de la colaboración es el marco de seguridad OpenShell, construido sobre los Contenedores de Ejecución (MXC) de Microsoft. El concepto es que los mecanismos de seguridad y gobernanza se colocan debajo de la capa de agente — no encima de ella.
Esto implica ejecución en sandbox, políticas de acceso y protección de información de identificación personal. OpenShell se integra en Windows, Red Hat AI y Ubuntu, lo que proporciona una amplia cobertura de plataforma.
De la nube al escritorio
Para distribuciones locales, NVIDIA presenta dos productos. RTX Spark es un nuevo superchip diseñado para PC con Windows y, según NVIDIA, está especialmente diseñado para agentes de IA personales. Con hasta 1 petaflop de cálculo de IA y 128 GB de memoria unificada, permitirá ejecutar agentes de forma local y privada. Se esperan laptops y equipos de escritorio basados en RTX Spark para otoño de 2026.
DGX Station para Windows se dirige al mercado empresarial y es una supercomputadora de IA compacta que puede ejecutar modelos con hasta un billón de parámetros localmente — sin enviar datos a la nube.
Investigación científica e IA industrial
La colaboración también se extiende a la investigación científica a través de la plataforma Microsoft Discovery, que fue presentada en Microsoft Build. La plataforma integra ALCHEMI NIM para simulaciones químicas y BioNeMo NIM para el desarrollo de fármacos, y está destinada a acelerar la investigación en ciencia y medicina.
Para la industria, las bibliotecas NVIDIA Omniverse se han conectado para apoyar gemelos digitales e IA física industrial. Además, NVIDIA y Microsoft lanzaron lo que llaman Agentic Launchpad — actualmente dirigido a innovadores de IA en el Reino Unido e Irlanda.
La competencia de AWS y Google
El enfoque de pila completa de NVIDIA y Microsoft compite con plataformas establecidas como AWS SageMaker y Google Vertex AI, ambas han incorporado IA agéntica en sus servicios. SageMaker ofrece, entre otras cosas, una «experiencia agéntica» para la personalización de modelos y un agente de datos integrado, mientras que Vertex AI tiene sus propias herramientas para el desarrollo de agentes.
Lo que distingue el enfoque de NVIDIA-Microsoft es la integración de hardware especializado — desde clústeres de GPU a escala de rack en la nube hasta chips dedicados en PC de consumo — combinado con un marco de seguridad común en toda la pila. Si esta integración vertical ofrece ventajas reales sobre plataformas en la nube más flexibles, queda por ver en la práctica.
