Con su primer chip propio, OpenAI reescribe la economía de la inferencia IA

Introducción

El 24 de junio de 2026, OpenAI y Broadcom presentaron oficialmente Jalapeño, el primer procesador de inferencia desarrollado a medida por OpenAI. Detrás de este nombre picante se esconde una decisión estratégica de primer orden: recuperar el control sobre los costes operativos de sus modelos de lenguaje y reducir una dependencia histórica respecto a las GPU de Nvidia.

Un circuito diseñado para inferencia, no para entrenamiento

Jalapeño no es una GPU de propósito general adaptada a toda prisa para el procesamiento del lenguaje. Se trata de un circuito integrado de aplicación específica (ASIC) concebido desde cero para las cargas de trabajo de grandes modelos de lenguaje en producción. Su arquitectura apunta directamente a los cuellos de botella de memoria y red que limitan la eficiencia de las GPU en tareas de inferencia, es decir, la fase en que un modelo responde en tiempo real a las solicitudes de los usuarios.

El resultado anunciado es contundente: una reducción de aproximadamente el 50 % del coste por token de inferencia frente a las soluciones GPU actuales de Nvidia. El entrenamiento de modelos sigue siendo responsabilidad de Nvidia: Jalapeño no reemplaza toda la cadena de herramientas, sino que optimiza el eslabón más exigido en producción.

De la idea al tape-out en nueve meses

Tan llamativo como el rendimiento anunciado es el ritmo de ejecución. Desde el primer esbozo de arquitectura hasta el tape-out —la entrega de máscaras al fabricante para iniciar la producción— Jalapeño solo necesitó nueve meses. Para un ASIC de alto rendimiento, se trata de un ritmo históricamente excepcional en la industria de los semiconductores.

Esta velocidad se explica, en parte, por las propias herramientas de IA de OpenAI, empleadas para automatizar determinadas fases de verificación y optimización del diseño. Un círculo virtuoso que ilustra un principio cada vez más extendido: la inteligencia artificial acelera el diseño de los chips que permitirán ejecutar inteligencia artificial a menor coste.

La fabricación recae en TSMC, utilizando los nodos avanzados disponibles. Broadcom se encarga de la implementación en silicio, las interconexiones de red a través de sus conmutadores Tomahawk y la integración del sistema, mientras que Celestica asume el ensamblaje de tarjetas, bahías y bastidores.

La integración vertical se consolida como estándar de la IA a gran escala

OpenAI no es el único actor en este terreno. Google lleva años operando sus propias TPU; Amazon impulsa sus chips Trainium para las cargas de trabajo de los clientes de AWS. Lo que distingue a Jalapeño es que un jugador puramente de software —sin legado en hardware— da el salto al silicio propietario, con una ambición de despliegue a escala del gigavatio en alianza con Microsoft de cara a 2029.

La conclusión es ya compartida entre las grandes plataformas tecnológicas: controlar la capa física es tan estratégico como controlar los propios modelos. La era del todo-GPU externalizado está alcanzando sus límites económicos.

Qué implica esto para los presupuestos de IA empresarial

Para los departamentos de tecnología que dimensionan sus proyectos en torno a las API de OpenAI, el anuncio merece atención. Si el coste de inferencia baja de forma estructural en el lado del operador, la presión a la baja sobre la tarificación de las API seguirá de manera natural. Los proyectos de agentes IA, procesamiento documental a gran escala o automatización de flujos de negocio —frenados hasta ahora por el coste por solicitud— podrían ganar en rentabilidad sin necesidad de rediseñar la arquitectura aplicativa.

Jalapeño aún no está en producción comercial. Los despliegues piloto están previstos para finales de 2026, con una escalada progresiva durante 2027 y 2028. Pero la ecuación económica de la IA empresarial ya está reconfigurándose, y los CIO tienen todo el interés en incorporarlo a sus hojas de ruta desde ahora mismo.