OpenAI y Broadcom han hecho público su primer chip de IA conjunto: un «Procesador de Inteligencia» a medida con el nombre en clave Jalapeño. A diferencia de los aceleradores de IA generales, el chip está construido desde cero para una única tarea: la inferencia con grandes modelos de lenguaje (LLM). Así lo ha comunicado OpenAI en su blog oficial.

Nueve meses de la idea a la producción

Una de las características más notables de Jalapeño es la velocidad de su desarrollo. Según OpenAI, solo transcurrieron nueve meses desde el inicio del diseño hasta el llamado «tape-out», la etapa en la que el chip se envía a fabricación. Se describe como uno de los ciclos de desarrollo de ASIC más rápidos en la historia de los semiconductores de alto rendimiento.

OpenAI afirma que la compañía utilizó activamente sus propios modelos de IA en partes del proceso de diseño y optimización, lo que contribuyó a reducir significativamente el tiempo empleado.

Jalapeño ha sido diseñado desde cero con una profunda comprensión de cómo funcionan realmente los grandes modelos de lenguaje, no como un acelerador genérico adaptado a posteriori.
OpenAI y Broadcom revelan Jalapeño: 50% más barato que lo mejor de Nvidia - Bilde 1

¿Qué diferencia a Jalapeño de sus competidores?

Mientras que las GPU de Nvidia y las TPU de Google están construidas para una amplia cartera de tareas de IA, Jalapeño está exclusivamente orientado a la inferencia. Esta especialización permite optimizar la arquitectura para reducir el movimiento de datos y equilibrar los recursos de computación, memoria y red de manera más precisa, con el objetivo de acercarse más al rendimiento teórico máximo en la práctica.

Broadcom es responsable de la implementación del silicio y los componentes de red de alto rendimiento, incluidos los chips de red Tomahawk. Celestica se encarga de la integración de la placa y la producción escalable.

Afirma paridad con Nvidia Blackwell

Según el material de investigación, el CEO de Broadcom, Hock Tan, habría declarado que Jalapeño es «tan bueno» como las GPU Blackwell de Nvidia y las TPU de Google en los centros de datos. Es una afirmación audaz, pero aún no está respaldada por benchmarks públicos e independientes.

OpenAI informa que los prototipos técnicos ya están ejecutando cargas de trabajo de ML en los propios laboratorios de la compañía, incluyendo GPT-5.3-Codex-Spark. Por ahora, los externos no pueden verificar las cifras de rendimiento.

9 meses
Tiempo desde el diseño hasta el tape-out
~50 %
Ahorro de costos declarado vs. GPU de IA

¿Qué dicen los competidores?

Hoy en día, Nvidia domina el mercado de inferencia de LLM con la arquitectura Blackwell (B200, GB200). Los benchmarks muestran que la B200 puede ofrecer hasta cuatro veces más rendimiento que las GPU Hopper de la generación anterior en modelos como Llama 3.3 70B. Por su parte, la TPU v5p de Google está optimizada para grandes trabajos por lotes en entornos basados en JAX.

Jalapeño entra en un mercado donde las demandas de hardware de inferencia especializado aumentan drásticamente a medida que las empresas escalan los servicios de modelos. El argumento del costo —50 por ciento más barato por token—, si se mantiene en producción, será una ventaja competitiva clave.

Aún no se han publicado benchmarks independientes; las ambiciosas afirmaciones de rendimiento deben verificarse antes de que el mercado pueda sacar conclusiones.

Despliegue a finales de 2026

La primera distribución de producción está prevista para el segundo semestre de 2026, con centros de datos como Microsoft como socios iniciales. OpenAI describe a Jalapeño como el primero de una plataforma multigeneracional, donde el próximo chip se espera en 2028 y, a partir de entonces, con actualizaciones anuales.

Queda por ver con qué rapidez y en qué medida Jalapeño reemplazará realmente las GPU de Nvidia adquiridas en la infraestructura de OpenAI. La compañía sigue manteniendo una estrecha colaboración con Microsoft, que utiliza equipos de Nvidia a gran escala. Sin embargo, es evidente que OpenAI, al igual que Google y Amazon, desea reducir a largo plazo su dependencia del hardware de IA de terceros.