Jalapeño: el primer chip de OpenAI va directo a la inferencia (y a NVIDIA)

OpenAI acaba de presentar Jalapeño, su primer chip propio, co-diseñado con Broadcom. El nombre es simpático, pero el movimiento es de los serios: OpenAI deja de ser solo un consumidor de silicio ajeno y empieza a construir su propia pila completa. Conviene entender bien qué es y qué no es.

Qué es Jalapeño (y qué no)

Lo primero, para no caer en el titular fácil: Jalapeño no es un chip de entrenamiento. Es un acelerador de inferencia optimizado para LLM —lo que OpenAI llama un “Intelligence Processor”—. Es decir, no sirve para entrenar el próximo GPT desde cero; sirve para ejecutar los modelos ya entrenados de forma más rápida y, sobre todo, más barata. En la práctica, está pensado para que ChatGPT y la API respondan a millones de consultas con mejor economía.

Esa distinción importa. El entrenamiento sigue siendo el reino indiscutible de NVIDIA. Pero la inferencia —servir el modelo en producción, día tras día— es donde está el grueso del gasto recurrente a escala. Atacar ahí es una jugada inteligente.

Los números que sí dieron

OpenAI fue parco en specs de hardware (no hay datos públicos de memoria, HBM, TFLOPs ni consumo), pero soltó tres cifras que cuentan la historia:

~50% más barato en inferencia. Esa es la promesa central: la mitad de coste frente a la alternativa actual. A la escala de OpenAI, eso son miles de millones.
9 meses de desarrollo. Un ciclo brutalmente corto para un chip custom, y reconocen que lo aceleraron usando sus propios modelos de IA en el diseño. Es una imagen poderosa: usar IA para construir el hardware que servirá más IA.
Despliegue a finales de 2026, escalando a centros de datos a escala de gigavatios. No es un experimento de laboratorio; van a producción.

La verdadera diana: NVIDIA

Todo el contexto apunta a lo mismo. Jalapeño es, sin rodeos, un golpe a la dependencia de NVIDIA. La prensa lo describió como rival del Blackwell, como una forma de cubrir la capacidad que NVIDIA no alcanza a suministrar, y como una manera de poner en jaque el poder de fijación de precios de NVIDIA en inferencia.

Es la misma jugada que ya hicieron Google (TPU), Amazon (Trainium/Inferentia) y Microsoft: si dependes de un solo proveedor para tu insumo más caro, diseñas tu propio silicio para recuperar margen y control. OpenAI llega tarde a esa fiesta, pero con un volumen de inferencia que justifica de sobra el esfuerzo.

Lo que aún no sabemos

Seamos honestos con lo que falta. No hay especificaciones técnicas públicas: ni nodo de fabricación, ni memoria, ni ancho de banda, ni rendimiento bruto. El “~50% más barato” es la cifra de OpenAI, sin benchmark independiente todavía. Y una cosa es anunciar y otra desplegar a escala de gigavatios con fiabilidad. El historial de chips custom está lleno de anuncios brillantes que tardaron en cumplir.

Mi lectura

Jalapeño me parece el movimiento correcto en el lugar correcto. Atacar la inferencia —no el entrenamiento— es pragmático: es donde más se gasta de forma recurrente y donde un 50% de ahorro se traduce directo en margen. El ciclo de 9 meses acelerado con sus propios modelos es, además, una señal de hacia dónde va todo esto. No espero que NVIDIA tiemble mañana; el entrenamiento sigue siendo suyo. Pero la inferencia es un terreno cada vez más disputado, y OpenAI acaba de plantar bandera con su propio silicio. Habrá que ver las specs y los despliegues reales, pero la dirección es inequívoca.