Categorías
Hardware

Jalapeño: el primer chip de OpenAI va directo a la inferencia (y a NVIDIA)

OpenAI presentó Jalapeño, su primer chip custom co-diseñado con Broadcom. No es para entrenar: es un acelerador de inferencia para LLM que promete ~50% menos coste, se desarrolló en 9 meses y apunta de lleno al dominio de NVIDIA.

Retrato profesional de Giovanni Moreno, ingeniero de IA, con iluminación cinematográfica en tonos púrpura.

Giovanni Moreno

Ingeniero IA/ML & Arquitecto Backend

23 de junio de 2026 3 min de lectura
Un chile jalapeño maduro sobre fondo neutro, en alusión directa al nombre del primer chip de OpenAI.

OpenAI acaba de presentar Jalapeño, su primer chip propio, co-diseñado con Broadcom. El nombre es simpático, pero el movimiento es de los serios: OpenAI deja de ser solo un consumidor de silicio ajeno y empieza a construir su propia pila completa. Conviene entender bien qué es y qué no es.

Qué es Jalapeño (y qué no)

Lo primero, para no caer en el titular fácil: Jalapeño no es un chip de entrenamiento. Es un acelerador de inferencia optimizado para LLM —lo que OpenAI llama un “Intelligence Processor”—. Es decir, no sirve para entrenar el próximo GPT desde cero; sirve para ejecutar los modelos ya entrenados de forma más rápida y, sobre todo, más barata. En la práctica, está pensado para que ChatGPT y la API respondan a millones de consultas con mejor economía.

Esa distinción importa. El entrenamiento sigue siendo el reino indiscutible de NVIDIA. Pero la inferencia —servir el modelo en producción, día tras día— es donde está el grueso del gasto recurrente a escala. Atacar ahí es una jugada inteligente.

Los números que sí dieron

OpenAI fue parco en specs de hardware (no hay datos públicos de memoria, HBM, TFLOPs ni consumo), pero soltó tres cifras que cuentan la historia:

La verdadera diana: NVIDIA

Todo el contexto apunta a lo mismo. Jalapeño es, sin rodeos, un golpe a la dependencia de NVIDIA. La prensa lo describió como rival del Blackwell, como una forma de cubrir la capacidad que NVIDIA no alcanza a suministrar, y como una manera de poner en jaque el poder de fijación de precios de NVIDIA en inferencia.

Es la misma jugada que ya hicieron Google (TPU), Amazon (Trainium/Inferentia) y Microsoft: si dependes de un solo proveedor para tu insumo más caro, diseñas tu propio silicio para recuperar margen y control. OpenAI llega tarde a esa fiesta, pero con un volumen de inferencia que justifica de sobra el esfuerzo.

Lo que aún no sabemos

Seamos honestos con lo que falta. No hay especificaciones técnicas públicas: ni nodo de fabricación, ni memoria, ni ancho de banda, ni rendimiento bruto. El “~50% más barato” es la cifra de OpenAI, sin benchmark independiente todavía. Y una cosa es anunciar y otra desplegar a escala de gigavatios con fiabilidad. El historial de chips custom está lleno de anuncios brillantes que tardaron en cumplir.

Mi lectura

Jalapeño me parece el movimiento correcto en el lugar correcto. Atacar la inferencia —no el entrenamiento— es pragmático: es donde más se gasta de forma recurrente y donde un 50% de ahorro se traduce directo en margen. El ciclo de 9 meses acelerado con sus propios modelos es, además, una señal de hacia dónde va todo esto. No espero que NVIDIA tiemble mañana; el entrenamiento sigue siendo suyo. Pero la inferencia es un terreno cada vez más disputado, y OpenAI acaba de plantar bandera con su propio silicio. Habrá que ver las specs y los despliegues reales, pero la dirección es inequívoca.

OpenAI Broadcom inferencia chips NVIDIA
Retrato profesional de Giovanni Moreno, ingeniero de IA, con iluminación cinematográfica en tonos púrpura.

El autor

Giovanni Moreno

Ingeniero Informático con 3+ años construyendo pipelines de ML, sistemas NLP y soluciones de visión por computador. Actualmente en ingeniería AIOps en IBM con Python, FastAPI y Kubernetes en AWS.

Seguir

Únete a la conversación

Cargando...

Insights relacionados