OpenAI Deja que la IA Tome el Volante
OpenAI ha lanzado GPT-5.4, una nueva versión de su modelo insignia que difiere significativamente de las iteraciones anteriores. Lo que hace que el lanzamiento sea particularmente notable es que, por primera vez, el modelo tiene la capacidad integrada de operar un ordenador directamente, sin que el usuario necesite hacer nada más que proporcionar una tarea, según The Verge.
Concretamente, esto significa que GPT-5.4 puede abrir programas, hacer clic en interfaces de usuario, rellenar formularios y navegar entre aplicaciones. La compañía destaca especialmente los casos de uso relacionados con hojas de cálculo, documentos y presentaciones, es decir, el trabajo de oficina diario.
GPT-5.4 es la primera señal importante de que las empresas de IA están pasando de responder preguntas a realmente realizar el trabajo.
¿Qué significa "uso nativo del ordenador"?
El término "uso nativo del ordenador" se refiere a que el modelo no depende de complementos externos o llamadas a la API para interactuar con un sistema operativo. Lo maneja de forma nativa. Esta es una distinción técnica con importantes implicaciones prácticas: el agente puede operar en software antiguo y aplicaciones locales, no solo en servicios basados en la nube con interfaces abiertas.

No Están Solos en la Carrera
OpenAI está lejos de ser la única empresa que invierte en este tipo de capacidad. Según las revisiones de investigación del campo, Anthropic ya ha habilitado su modelo Claude para funcionar como un operador de escritorio: puede controlar aplicaciones nativas y todo el sistema operativo, no solo el navegador. Se dice que las pruebas de rendimiento muestran un gran desempeño en tareas complejas de escritorio.
Microsoft, por su parte, ha lanzado una vista previa de "uso de ordenador" en Copilot Studio, que permite a los agentes de IA interactuar con programas tal como lo haría un humano, incluido el software heredado que carece de soporte API moderno. Google anunció Project Mariner en Google I/O 2025, un agente experimental basado en Gemini que puede realizar tareas en toda la web.

El Mercado Crece Rápidamente
Las cifras de las empresas de análisis subrayan que este no es un fenómeno de nicho. Gartner estima que el 40 por ciento de las aplicaciones empresariales habrán integrado IA basada en agentes para finales de 2026, según la revisión de investigación que sustenta este artículo. Esta cifra sugiere que la tecnología está pasando de la fase experimental al negocio principal de las grandes organizaciones.
Quedan Preguntas sobre la Supervisión
Cabe señalar que, si bien la funcionalidad ha sido confirmada por OpenAI y reportada por The Verge, muchos detalles sobre el rendimiento, las limitaciones y la seguridad aún no han sido verificados de forma independiente. Las preguntas sobre qué sucede cuando un agente de IA comete errores en un entorno de producción, quién es responsable y cómo se manejan los datos del usuario durante las operaciones del agente no se responden en el material fuente disponible.
Marcos como Semantic Kernel de Microsoft enfatizan explícitamente el cumplimiento, la gobernanza y la observabilidad para la implementación a gran escala, lo que indica que la propia industria es consciente de que la autonomía y el control deben equilibrarse.
En cualquier caso, GPT-5.4 es una señal concreta de la dirección que está tomando el viaje: hacia sistemas de IA que no solo aconsejan, sino que actúan.
