Referencia de API y configuración
Una sola API key ck_ funciona con Claude Code, OpenCode, Codex CLI, Gemini CLI, Cursor y HTTP directo. Precios de lista oficiales del proveedor en una sola factura — pago por uso, sin suscripción.
1. Primeros pasos
Zenn.Engineering es un gateway de API drop-in para los modelos de Anthropic, OpenAI y Google AI, además de generación de imágenes. Usas una sola key con prefijo ck_ en todas partes — sin cambios de código, solo apunta tu herramienta a nuestra base URL.
Elige un plan en /pricing, luego crea una key en /manage-api-keys.
Apunta tu herramienta a https://zenn.engineering/api/v1.
Funciona con Claude Code, OpenCode, Codex CLI, Gemini CLI, Cursor y cualquier cliente compatible con OpenAI/Anthropic.
2. Base URLs
Una key, tres base URLs compatibles por protocolo (Anthropic / OpenAI / Gemini), más un endpoint de generación de imágenes.
| Superficie | Base URL | Usar con |
|---|---|---|
| Compatible con Anthropic | https://zenn.engineering/api/v1 | Claude Code, Anthropic SDK, OpenCode (proveedor anthropic) |
| Compatible con OpenAI (Codex) | https://zenn.engineering/api/v1/codex | Codex CLI, OpenAI SDK, Cursor |
| Compatible con Gemini | https://zenn.engineering/api/v1/gemini | Gemini CLI, Google AI SDK |
| Generación de imágenes | https://zenn.engineering/api/v1/images/generations | gpt-image-2 (payload compatible con OpenAI) |
3. Claude Code
El CLI oficial de Anthropic para Claude. Configura dos variables de entorno y funciona como reemplazo drop-in.
Paso 1 — Configurar entorno
Agrega a tu perfil de shell (~/.zshrc o ~/.bashrc):
export ANTHROPIC_BASE_URL=https://zenn.engineering/api/v1 export ANTHROPIC_API_KEY=ck_YOUR_API_KEY
Paso 2 — Reiniciar y ejecutar
# Default model (Sonnet 4.6) claude # Pick a different model claude --model claude-opus-4-7 claude --model claude-haiku-4-5
Cómo funciona
Claude Code envía la API key vía el header x-api-key (nativo del Anthropic SDK) y agrega /messages a la base URL. Los headers anthropic-version y anthropic-beta se reenvían upstream. Streaming soportado vía SSE.
4. OpenCode
Agente de código IA multi-proveedor. Una sola configuración JSON te da Claude, GPT-5 y Gemini con una sola key.
Paso 1 — Instalar
npm i -g opencode-ai
Paso 2 — Crear configuración
Edita ~/.config/opencode/opencode.json:
{
"$schema": "https://opencode.ai/config.json",
"provider": {
"anthropic": {
"options": {
"baseURL": "https://zenn.engineering/api/v1",
"apiKey": "ck_YOUR_API_KEY"
},
"models": {
"claude-opus-4-7": { "name": "Claude Opus 4.7" },
"claude-sonnet-4-6": { "name": "Claude Sonnet 4.6" },
"claude-haiku-4-5": { "name": "Claude Haiku 4.5" }
}
},
"zenn-codex": {
"npm": "@ai-sdk/openai-compatible",
"name": "Zenn Codex",
"options": {
"baseURL": "https://zenn.engineering/api/v1/codex",
"apiKey": "ck_YOUR_API_KEY"
},
"models": {
"gpt-5.5": { "name": "GPT-5.5" },
"gpt-5.5-pro": { "name": "GPT-5.5 Pro" },
"gpt-5.5-instant": { "name": "GPT-5.5 Instant" },
"gpt-5.4": { "name": "GPT-5.4" },
"gpt-5.3-codex": { "name": "GPT-5.3 Codex" }
}
},
"zenn-gemini": {
"npm": "@ai-sdk/openai-compatible",
"name": "Zenn Gemini",
"options": {
"baseURL": "https://zenn.engineering/api/v1/gemini",
"apiKey": "ck_YOUR_API_KEY"
},
"models": {
"gemini-3.1-pro-preview": { "name": "Gemini 3.1 Pro" },
"gemini-3-pro-preview": { "name": "Gemini 3 Pro" },
"gemini-3-flash-preview": { "name": "Gemini 3 Flash" }
}
},
"zenn-chinese": {
"npm": "@ai-sdk/openai-compatible",
"name": "Zenn Chinese (DeepSeek / Moonshot / Zhipu)",
"options": {
"baseURL": "https://zenn.engineering/api/v1/codex",
"apiKey": "ck_YOUR_API_KEY"
},
"models": {
"deepseek-v4-pro": { "name": "DeepSeek V4 Pro" },
"deepseek-v4-flash": { "name": "DeepSeek V4 Flash" },
"kimi-k2.6": { "name": "Kimi K2.6" },
"glm-5.1": { "name": "GLM-5.1" }
}
}
}
}Paso 3 — Ejecutar
opencode
5. Codex CLI
El CLI oficial de OpenAI para la familia GPT-5 / Codex. Configura dos variables de entorno y apunta a nuestra base URL de Codex.
Configurar entorno
export OPENAI_BASE_URL=https://zenn.engineering/api/v1/codex export OPENAI_API_KEY=ck_YOUR_API_KEY
Ejecutar
# Default codex # Pick a model codex --model gpt-5.5 codex --model gpt-5.5-pro codex --model gpt-5.5-instant codex --model gpt-5.3-codex # Chinese coding models (via OpenAI-compatible /v1/codex) codex --model deepseek-v4-pro codex --model kimi-k2.6 codex --model glm-5.1
Codex CLI usa Authorization: Bearer y los formatos de OpenAI /chat/completions + /responses — ambos están soportados.
6. Gemini CLI
El Gemini CLI de Google envía la key vía x-goog-api-key. El proxy acepta ese header de forma transparente.
Configurar entorno
export GEMINI_BASE_URL=https://zenn.engineering/api/v1/gemini export GEMINI_API_KEY=ck_YOUR_API_KEY
Ejecutar
gemini --model gemini-3.1-pro-preview gemini --model gemini-3-flash-preview
7. Cursor IDE
En Cursor → Settings → Models → "Custom OpenAI Model":
| Campo | Valor |
|---|---|
| Override OpenAI Base URL | https://zenn.engineering/api/v1/codex |
| OpenAI API Key | ck_YOUR_API_KEY |
| Add custom models | gpt-5.5, gpt-5.5-pro, gpt-5.5-instant, gpt-5.4, gpt-5.3-codex, deepseek-v4-pro, kimi-k2.6, glm-5.1 |
Haz clic en Verify después de guardar — Cursor llamará /models en la base URL para confirmar que la key funciona.
8. API Directa (cURL)
Tres formatos de protocolo, una sola key. Elige el que ya hable tu cliente.
Compatible con Anthropic — /v1/messages
curl -X POST https://zenn.engineering/api/v1/messages \
-H "x-api-key: ck_YOUR_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-H "Content-Type: application/json" \
-d '{
"model": "claude-sonnet-4-6",
"max_tokens": 1024,
"messages": [{"role": "user", "content": "Hello, Claude"}]
}'Compatible con OpenAI — /v1/codex/chat/completions
curl -X POST https://zenn.engineering/api/v1/codex/chat/completions \
-H "Authorization: Bearer ck_YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-5.5",
"messages": [{"role": "user", "content": "Hello, GPT-5.5"}],
"stream": true
}'Gemini — /v1/gemini/chat/completions
curl -X POST https://zenn.engineering/api/v1/gemini/chat/completions \
-H "Authorization: Bearer ck_YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gemini-3.1-pro-preview",
"messages": [{"role": "user", "content": "Hello, Gemini"}]
}'9. Generación de imágenes
gpt-image-2 es el único modelo de imagen actualmente ruteable a través de la API. Los niveles de resolución (1K / 2K / 4K) se cobran a un precio plano — ver Modelos para detalles. Otros modelos de imagen, video y audio aparecen como Próximamente.
Endpoint
POST https://zenn.engineering/api/v1/images/generations GET https://zenn.engineering/api/v1/images/generations (list models)
Generar una imagen
curl -X POST https://zenn.engineering/api/v1/images/generations \
-H "Authorization: Bearer ck_YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gpt-image-2",
"prompt": "A cinematic photo of a small red apple on a marble countertop",
"n": 1
}'Comportamiento asíncrono
DocsPage.imageGen.asyncBody
En el chat del navegador
Abre /chat, elige "GPT Image 2 — Image Generation" en el selector de modelos, envía un prompt y la imagen se renderiza inline. El servidor hace polling upstream por ti y cobra 6 créditos ($0.06) por imagen.
10. Modelos y precios
Facturación basada en créditos (1.000.000 créditos = $1,00). Los precios de LLM son el precio de lista oficial del proveedor por millón de tokens; las imágenes se facturan por generación. Los modelos etiquetados Próximamente están listados pero la API los rechaza hasta su activación. Cada modelo se factura al precio de lista oficial — el valor proviene del multiplicador de créditos al recargar (Pro 1×, Max 4×, Enterprise 6×). Consulta la sección 12 para los detalles de los planes.
Claude (Anthropic)
| ID del modelo | Entrada / MTok | Salida / MTok | Lectura caché | Estado |
|---|---|---|---|---|
| claude-opus-4-7 | $15.00 | $75.00 | $1.50 | Activo |
| claude-opus-4-6 | $15.00 | $75.00 | $1.50 | Activo |
| claude-sonnet-4-6 | $3.00 | $15.00 | $0.30 | Activo |
| claude-haiku-4-5 | $1.00 | $5.00 | $0.10 | Activo |
OpenAI / GPT
| ID del modelo | Entrada / MTok | Salida / MTok | Lectura caché | Estado |
|---|---|---|---|---|
| gpt-5.5 | $5.00 | $30.00 | $0.50 | Activo |
| gpt-5.5-instant | $5.00 | $30.00 | $0.50 | Activo |
| gpt-5.5-pro | $30.00 | $180.00 | $30.00 | Activo |
| gpt-5.4 | $5.00 | $22.50 | $0.50 | Activo |
| gpt-5.3-codex | $1.75 | $14.00 | $0.17 | Activo |
| gpt-5.2 | $1.75 | $14.00 | $0.17 | Activo |
Gemini (Google)
| ID del modelo | Entrada / MTok | Salida / MTok | Lectura caché | Estado |
|---|---|---|---|---|
| gemini-3.1-pro-preview | $4.00 | $18.00 | $0.40 | Activo |
| gemini-3-pro-preview | $4.00 | $18.00 | $0.40 | Activo |
| gemini-3-flash-preview | $0.50 | $3.00 | $0.05 | Activo |
DeepSeek / Moonshot / Zhipu
| ID del modelo | Entrada / MTok | Salida / MTok | Lectura caché | Estado |
|---|---|---|---|---|
| deepseek-v4-pro | $1.74 | $3.48 | $0.01 | Activo |
| deepseek-v4-flash | $0.14 | $0.28 | $0.0028 | Activo |
| kimi-k2.6 | $0.95 | $4.00 | $0.16 | Activo |
| glm-5.1 | $1.40 | $4.40 | $0.26 | Activo |
Imagen (activo)
| ID del modelo | Créditos / imagen | Precio / imagen | Estado |
|---|---|---|---|
| gpt-image-2 | 60000 | $0.06 | Activo |
Todos los modelos de imagen, video y audio se consumen al precio de lista oficial. Otros modelos de imagen (familia Nano Banana, Gemini 3 Pro Image, Seedream) están listados en el catálogo pero actualmente como Próximamente — la API los rechaza hasta que se habiliten. Ver /models para el catálogo completo.
11. Autenticación
Todas las API keys usan el prefijo ck_. El proxy acepta todos los formatos estándar de header de los SDK para que los clientes funcionen sin modificación.
| Header | Formato | Usado por |
|---|---|---|
| x-api-key | ck_... | Claude Code, Anthropic SDK |
| Authorization | Bearer ck_... | OpenCode, Codex CLI, OpenAI SDK, cURL |
| anthropic-api-key | ck_... | Header alterno de Anthropic |
| x-goog-api-key | ck_... | Gemini CLI |
Headers reenviados
anthropic-version (por defecto 2023-06-01) y anthropic-beta pasan a través. Streaming SSE totalmente soportado.
12. Planes
Recarga única — sin suscripción. Cada recarga fija un multiplicador de créditos (Pro 1×, Max 4×, Enterprise 6×) — tus créditos mantienen ese valor de multiplicador hasta gastarse. Las recargas siguientes pueden ser de cualquier nivel.
Precio estándar. Pago por uso.
- · Todo LLM de frontera al precio de lista oficial
- · API compatible con OpenAI / Anthropic / Gemini
- · Límites de gasto por key, analítica en tiempo real
4× créditos — $100 compran $400 de uso al precio de lista.
- · Todo lo de Pro
- · 4× créditos por dólar en el momento de la recarga
- · Mismo precio de lista en cada modelo
- · Cola prioritaria + ruteo más rápido
6× créditos — $1,000 compran $6,000 de uso + canal prioritario Anthropic Max.
- · Todo lo de Max
- · 6× créditos por dólar en el momento de la recarga
- · Mismo precio de lista en cada modelo
- · Canal prioritario Anthropic Max
- · Soporte dedicado, facturación amigable para auditorías
Una regla de precios, todos los modelos
- · Cada modelo de LLM, imagen, video y audio se consume al precio de lista oficial mostrado en /models.
- · El valor de Max ($100 → 4×) y Enterprise ($1,000 → 6×) viene de los créditos extra otorgados al recargar, no de niveles de descuento por modelo.
- · Sin elegibilidad por bucket, sin letra chica por modelo — tus créditos funcionan igual en Claude Opus, GPT-5.5 y Gemini Flash.
Los multiplicadores aplican por recarga. Tus créditos Max existentes mantienen su valor 4× hasta que los gastes — recarga Pro después y esos $10 otorgan 20M créditos a 1×. Ver /pricing para el desglose completo.
13. Rate limits y errores
Rate limits por usuario
| Endpoint | Solicitudes / hora |
|---|---|
| /v1/messages, /v1/chat/completions, /v1/gemini | 1,000 |
| /v1/images/generations | 500 |
| /v1/responses, /v1/codex/* | 1,000 |
El estado del rate limit se devuelve en los headers de la respuesta: x-ratelimit-limit, x-ratelimit-remaining, x-ratelimit-reset.
Códigos de error
| Estado | Significado |
|---|---|
| 401 | API key faltante o inválida |
| 402 | Créditos insuficientes — recarga en /checkout |
| 403 | El nivel no desbloquea el modelo solicitado (ej. Opus 4.7) |
| 429 | Rate limit por usuario alcanzado |
| 503 | El modelo está listado pero como Próximamente |
| 504 | La generación de imagen agotó el tiempo (reintentar) |
14. Próximamente
Listados públicamente pero la API los rechaza hasta que el margen bajo el modelo de multiplicador de créditos se estabilice:
Familia Nano Banana, Gemini 3 Pro Image, Seedream, GPT-4o Image, Imagen.
Veo 3.1, Kling 3.0, Seedance 2.0, HappyHorse 1.0, MiniMax Hailuo, Vidu Q3, WAN 2.6.
Fish Audio TTS, Voice Clone, ASR.
Ver el listado completo en /models. Las entradas Próximamente devuelven HTTP 503 desde la API; llamarlas hoy es un no-op que no consume créditos.
¿Listo para empezar?
Una sola key funciona en Claude Code, OpenCode, Codex CLI, Gemini CLI y Cursor. Recarga créditos y crea tu API key.
