Documentación

Referencia de API y configuración

Una sola API key ck_ funciona con Claude Code, OpenCode, Codex CLI, Gemini CLI, Cursor y HTTP directo. Precios de lista oficiales del proveedor en una sola factura — pago por uso, sin suscripción.

Tabla de contenidos

1. Primeros pasos

Zenn.Engineering es un gateway de API drop-in para los modelos de Anthropic, OpenAI y Google AI, además de generación de imágenes. Usas una sola key con prefijo ck_ en todas partes — sin cambios de código, solo apunta tu herramienta a nuestra base URL.

1. Obtén una API key

Elige un plan en /pricing, luego crea una key en /manage-api-keys.

2. Configura la base URL

Apunta tu herramienta a https://zenn.engineering/api/v1.

3. Construye

Funciona con Claude Code, OpenCode, Codex CLI, Gemini CLI, Cursor y cualquier cliente compatible con OpenAI/Anthropic.

2. Base URLs

Una key, tres base URLs compatibles por protocolo (Anthropic / OpenAI / Gemini), más un endpoint de generación de imágenes.

Superficie	Base URL	Usar con
Compatible con Anthropic	https://zenn.engineering/api/v1	Claude Code, Anthropic SDK, OpenCode (proveedor anthropic)
Compatible con OpenAI (Codex)	https://zenn.engineering/api/v1/codex	Codex CLI, OpenAI SDK, Cursor
Compatible con Gemini	https://zenn.engineering/api/v1/gemini	Gemini CLI, Google AI SDK
Generación de imágenes	https://zenn.engineering/api/v1/images/generations	gpt-image-2 (payload compatible con OpenAI)

3. Claude Code

El CLI oficial de Anthropic para Claude. Configura dos variables de entorno y funciona como reemplazo drop-in.

Paso 1 — Configurar entorno

Agrega a tu perfil de shell (~/.zshrc o ~/.bashrc):

shell

export ANTHROPIC_BASE_URL=https://zenn.engineering/api/v1
export ANTHROPIC_API_KEY=ck_YOUR_API_KEY

Paso 2 — Reiniciar y ejecutar

terminal

# Default model (Sonnet 4.6)
claude

# Pick a different model
claude --model claude-opus-4-7
claude --model claude-haiku-4-5

Cómo funciona

Claude Code envía la API key vía el header x-api-key (nativo del Anthropic SDK) y agrega /messages a la base URL. Los headers anthropic-version y anthropic-beta se reenvían upstream. Streaming soportado vía SSE.

4. OpenCode

Agente de código IA multi-proveedor. Una sola configuración JSON te da Claude, GPT-5 y Gemini con una sola key.

Paso 1 — Instalar

terminal

npm i -g opencode-ai

Paso 2 — Crear configuración

Edita ~/.config/opencode/opencode.json:

opencode.json

{
  "$schema": "https://opencode.ai/config.json",
  "provider": {
    "anthropic": {
      "options": {
        "baseURL": "https://zenn.engineering/api/v1",
        "apiKey": "ck_YOUR_API_KEY"
      },
      "models": {
        "claude-opus-4-7": { "name": "Claude Opus 4.7" },
        "claude-sonnet-4-6": { "name": "Claude Sonnet 4.6" },
        "claude-haiku-4-5": { "name": "Claude Haiku 4.5" }
      }
    },
    "zenn-codex": {
      "npm": "@ai-sdk/openai-compatible",
      "name": "Zenn Codex",
      "options": {
        "baseURL": "https://zenn.engineering/api/v1/codex",
        "apiKey": "ck_YOUR_API_KEY"
      },
      "models": {
        "gpt-5.5": { "name": "GPT-5.5" },
        "gpt-5.5-pro": { "name": "GPT-5.5 Pro" },
        "gpt-5.5-instant": { "name": "GPT-5.5 Instant" },
        "gpt-5.4": { "name": "GPT-5.4" },
        "gpt-5.3-codex": { "name": "GPT-5.3 Codex" }
      }
    },
    "zenn-gemini": {
      "npm": "@ai-sdk/openai-compatible",
      "name": "Zenn Gemini",
      "options": {
        "baseURL": "https://zenn.engineering/api/v1/gemini",
        "apiKey": "ck_YOUR_API_KEY"
      },
      "models": {
        "gemini-3.1-pro-preview": { "name": "Gemini 3.1 Pro" },
        "gemini-3-pro-preview": { "name": "Gemini 3 Pro" },
        "gemini-3-flash-preview": { "name": "Gemini 3 Flash" }
      }
    },
    "zenn-chinese": {
      "npm": "@ai-sdk/openai-compatible",
      "name": "Zenn Chinese (DeepSeek / Moonshot / Zhipu)",
      "options": {
        "baseURL": "https://zenn.engineering/api/v1/codex",
        "apiKey": "ck_YOUR_API_KEY"
      },
      "models": {
        "deepseek-v4-pro": { "name": "DeepSeek V4 Pro" },
        "deepseek-v4-flash": { "name": "DeepSeek V4 Flash" },
        "kimi-k2.6": { "name": "Kimi K2.6" },
        "glm-5.1": { "name": "GLM-5.1" }
      }
    }
  }
}

Paso 3 — Ejecutar

terminal

opencode

5. Codex CLI

El CLI oficial de OpenAI para la familia GPT-5 / Codex. Configura dos variables de entorno y apunta a nuestra base URL de Codex.

Configurar entorno

shell

export OPENAI_BASE_URL=https://zenn.engineering/api/v1/codex
export OPENAI_API_KEY=ck_YOUR_API_KEY

Ejecutar

terminal

# Default
codex

# Pick a model
codex --model gpt-5.5
codex --model gpt-5.5-pro
codex --model gpt-5.5-instant
codex --model gpt-5.3-codex

# Chinese coding models (via OpenAI-compatible /v1/codex)
codex --model deepseek-v4-pro
codex --model kimi-k2.6
codex --model glm-5.1

Codex CLI usa Authorization: Bearer y los formatos de OpenAI /chat/completions + /responses — ambos están soportados.

6. Gemini CLI

El Gemini CLI de Google envía la key vía x-goog-api-key. El proxy acepta ese header de forma transparente.

Configurar entorno

shell

export GEMINI_BASE_URL=https://zenn.engineering/api/v1/gemini
export GEMINI_API_KEY=ck_YOUR_API_KEY

Ejecutar

terminal

gemini --model gemini-3.1-pro-preview
gemini --model gemini-3-flash-preview

7. Cursor IDE

En Cursor → Settings → Models → "Custom OpenAI Model":

Campo	Valor
Override OpenAI Base URL	https://zenn.engineering/api/v1/codex
OpenAI API Key	ck_YOUR_API_KEY
Add custom models	gpt-5.5, gpt-5.5-pro, gpt-5.5-instant, gpt-5.4, gpt-5.3-codex, deepseek-v4-pro, kimi-k2.6, glm-5.1

Haz clic en Verify después de guardar — Cursor llamará /models en la base URL para confirmar que la key funciona.

8. API Directa (cURL)

Tres formatos de protocolo, una sola key. Elige el que ya hable tu cliente.

Compatible con Anthropic — /v1/messages

cURL · Claude

curl -X POST https://zenn.engineering/api/v1/messages \
  -H "x-api-key: ck_YOUR_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "claude-sonnet-4-6",
    "max_tokens": 1024,
    "messages": [{"role": "user", "content": "Hello, Claude"}]
  }'

Compatible con OpenAI — /v1/codex/chat/completions

cURL · GPT-5.5

curl -X POST https://zenn.engineering/api/v1/codex/chat/completions \
  -H "Authorization: Bearer ck_YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-5.5",
    "messages": [{"role": "user", "content": "Hello, GPT-5.5"}],
    "stream": true
  }'

Gemini — /v1/gemini/chat/completions

cURL · Gemini

curl -X POST https://zenn.engineering/api/v1/gemini/chat/completions \
  -H "Authorization: Bearer ck_YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gemini-3.1-pro-preview",
    "messages": [{"role": "user", "content": "Hello, Gemini"}]
  }'

9. Generación de imágenes

gpt-image-2 es el único modelo de imagen actualmente ruteable a través de la API. Los niveles de resolución (1K / 2K / 4K) se cobran a un precio plano — ver Modelos para detalles. Otros modelos de imagen, video y audio aparecen como Próximamente.

Endpoint

POST https://zenn.engineering/api/v1/images/generations
GET  https://zenn.engineering/api/v1/images/generations  (list models)

Generar una imagen

cURL · gpt-image-2

curl -X POST https://zenn.engineering/api/v1/images/generations \
  -H "Authorization: Bearer ck_YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-image-2",
    "prompt": "A cinematic photo of a small red apple on a marble countertop",
    "n": 1
  }'

Comportamiento asíncrono

DocsPage.imageGen.asyncBody

En el chat del navegador

Abre /chat, elige "GPT Image 2 — Image Generation" en el selector de modelos, envía un prompt y la imagen se renderiza inline. El servidor hace polling upstream por ti y cobra 6 créditos ($0.06) por imagen.

10. Modelos y precios

Facturación basada en créditos (1.000.000 créditos = $1,00). Los precios de LLM son el precio de lista oficial del proveedor por millón de tokens; las imágenes se facturan por generación. Los modelos etiquetados Próximamente están listados pero la API los rechaza hasta su activación. Cada modelo se factura al precio de lista oficial — el valor proviene del multiplicador de créditos al recargar (Pro 1×, Max 4×, Enterprise 6×). Consulta la sección 12 para los detalles de los planes.

Claude (Anthropic)

ID del modelo	Entrada / MTok	Salida / MTok	Lectura caché	Estado
claude-opus-4-7	$15.00	$75.00	$1.50	Activo
claude-opus-4-6	$15.00	$75.00	$1.50	Activo
claude-sonnet-4-6	$3.00	$15.00	$0.30	Activo
claude-haiku-4-5	$1.00	$5.00	$0.10	Activo

OpenAI / GPT

ID del modelo	Entrada / MTok	Salida / MTok	Lectura caché	Estado
gpt-5.5	$5.00	$30.00	$0.50	Activo
gpt-5.5-instant	$5.00	$30.00	$0.50	Activo
gpt-5.5-pro	$30.00	$180.00	$30.00	Activo
gpt-5.4	$5.00	$22.50	$0.50	Activo
gpt-5.3-codex	$1.75	$14.00	$0.17	Activo
gpt-5.2	$1.75	$14.00	$0.17	Activo

Gemini (Google)

ID del modelo	Entrada / MTok	Salida / MTok	Lectura caché	Estado
gemini-3.1-pro-preview	$4.00	$18.00	$0.40	Activo
gemini-3-pro-preview	$4.00	$18.00	$0.40	Activo
gemini-3-flash-preview	$0.50	$3.00	$0.05	Activo

DeepSeek / Moonshot / Zhipu

ID del modelo	Entrada / MTok	Salida / MTok	Lectura caché	Estado
deepseek-v4-pro	$1.74	$3.48	$0.01	Activo
deepseek-v4-flash	$0.14	$0.28	$0.0028	Activo
kimi-k2.6	$0.95	$4.00	$0.16	Activo
glm-5.1	$1.40	$4.40	$0.26	Activo

Imagen (activo)

ID del modelo	Créditos / imagen	Precio / imagen	Estado
gpt-image-2	60000	$0.06	Activo

Todos los modelos de imagen, video y audio se consumen al precio de lista oficial. Otros modelos de imagen (familia Nano Banana, Gemini 3 Pro Image, Seedream) están listados en el catálogo pero actualmente como Próximamente — la API los rechaza hasta que se habiliten. Ver /models para el catálogo completo.

11. Autenticación

Todas las API keys usan el prefijo ck_. El proxy acepta todos los formatos estándar de header de los SDK para que los clientes funcionen sin modificación.

Header	Formato	Usado por
x-api-key	ck_...	Claude Code, Anthropic SDK
Authorization	Bearer ck_...	OpenCode, Codex CLI, OpenAI SDK, cURL
anthropic-api-key	ck_...	Header alterno de Anthropic
x-goog-api-key	ck_...	Gemini CLI

Headers reenviados

anthropic-version (por defecto 2023-06-01) y anthropic-beta pasan a través. Streaming SSE totalmente soportado.

12. Planes

Recarga única — sin suscripción. Cada recarga fija un multiplicador de créditos (Pro 1×, Max 4×, Enterprise 6×) — tus créditos mantienen ese valor de multiplicador hasta gastarse. Las recargas siguientes pueden ser de cualquier nivel.

Pro

$10 · 10,000,000 créditos

Precio estándar. Pago por uso.

· Todo LLM de frontera al precio de lista oficial
· API compatible con OpenAI / Anthropic / Gemini
· Límites de gasto por key, analítica en tiempo real

Max

$100 · 400,000,000 créditos

4× créditos — $100 compran $400 de uso al precio de lista.

· Todo lo de Pro
· 4× créditos por dólar en el momento de la recarga
· Mismo precio de lista en cada modelo
· Cola prioritaria + ruteo más rápido

Enterprise

$1,000 · 6,000,000,000 créditos

6× créditos — $1,000 compran $6,000 de uso + canal prioritario Anthropic Max.

· Todo lo de Max
· 6× créditos por dólar en el momento de la recarga
· Mismo precio de lista en cada modelo
· Canal prioritario Anthropic Max
· Soporte dedicado, facturación amigable para auditorías

Una regla de precios, todos los modelos

· Cada modelo de LLM, imagen, video y audio se consume al precio de lista oficial mostrado en /models.
· El valor de Max ($100 → 4×) y Enterprise ($1,000 → 6×) viene de los créditos extra otorgados al recargar, no de niveles de descuento por modelo.
· Sin elegibilidad por bucket, sin letra chica por modelo — tus créditos funcionan igual en Claude Opus, GPT-5.5 y Gemini Flash.

Los multiplicadores aplican por recarga. Tus créditos Max existentes mantienen su valor 4× hasta que los gastes — recarga Pro después y esos $10 otorgan 20M créditos a 1×. Ver /pricing para el desglose completo.

13. Rate limits y errores

Rate limits por usuario

Endpoint	Solicitudes / hora
/v1/messages, /v1/chat/completions, /v1/gemini	1,000
/v1/images/generations	500
/v1/responses, /v1/codex/*	1,000

El estado del rate limit se devuelve en los headers de la respuesta: x-ratelimit-limit, x-ratelimit-remaining, x-ratelimit-reset.

Códigos de error

Estado	Significado
401	API key faltante o inválida
402	Créditos insuficientes — recarga en /checkout
403	El nivel no desbloquea el modelo solicitado (ej. Opus 4.7)
429	Rate limit por usuario alcanzado
503	El modelo está listado pero como Próximamente
504	La generación de imagen agotó el tiempo (reintentar)

14. Próximamente

Listados públicamente pero la API los rechaza hasta que el margen bajo el modelo de multiplicador de créditos se estabilice:

Imagen (más)

Familia Nano Banana, Gemini 3 Pro Image, Seedream, GPT-4o Image, Imagen.

Video

Veo 3.1, Kling 3.0, Seedance 2.0, HappyHorse 1.0, MiniMax Hailuo, Vidu Q3, WAN 2.6.

Audio

Fish Audio TTS, Voice Clone, ASR.

Ver el listado completo en /models. Las entradas Próximamente devuelven HTTP 503 desde la API; llamarlas hoy es un no-op que no consume créditos.

¿Listo para empezar?

Una sola key funciona en Claude Code, OpenCode, Codex CLI, Gemini CLI y Cursor. Recarga créditos y crea tu API key.

Ver planes Gestionar API Keys

Documentación

Referencia de API y configuración

Tabla de contenidos

1. Primeros pasos

1. Obtén una API key

Elige un plan en /pricing, luego crea una key en /manage-api-keys.

2. Configura la base URL

Apunta tu herramienta a https://zenn.engineering/api/v1.

3. Construye

Funciona con Claude Code, OpenCode, Codex CLI, Gemini CLI, Cursor y cualquier cliente compatible con OpenAI/Anthropic.

2. Base URLs

Una key, tres base URLs compatibles por protocolo (Anthropic / OpenAI / Gemini), más un endpoint de generación de imágenes.

Superficie	Base URL	Usar con
Compatible con Anthropic	https://zenn.engineering/api/v1	Claude Code, Anthropic SDK, OpenCode (proveedor anthropic)
Compatible con OpenAI (Codex)	https://zenn.engineering/api/v1/codex	Codex CLI, OpenAI SDK, Cursor
Compatible con Gemini	https://zenn.engineering/api/v1/gemini	Gemini CLI, Google AI SDK
Generación de imágenes	https://zenn.engineering/api/v1/images/generations	gpt-image-2 (payload compatible con OpenAI)

3. Claude Code

El CLI oficial de Anthropic para Claude. Configura dos variables de entorno y funciona como reemplazo drop-in.

Paso 1 — Configurar entorno

Agrega a tu perfil de shell (~/.zshrc o ~/.bashrc):

shell

export ANTHROPIC_BASE_URL=https://zenn.engineering/api/v1
export ANTHROPIC_API_KEY=ck_YOUR_API_KEY

Paso 2 — Reiniciar y ejecutar

terminal

# Default model (Sonnet 4.6)
claude

# Pick a different model
claude --model claude-opus-4-7
claude --model claude-haiku-4-5

Cómo funciona

4. OpenCode

Agente de código IA multi-proveedor. Una sola configuración JSON te da Claude, GPT-5 y Gemini con una sola key.

Paso 1 — Instalar

terminal

npm i -g opencode-ai

Paso 2 — Crear configuración

Edita ~/.config/opencode/opencode.json:

opencode.json

{
  "$schema": "https://opencode.ai/config.json",
  "provider": {
    "anthropic": {
      "options": {
        "baseURL": "https://zenn.engineering/api/v1",
        "apiKey": "ck_YOUR_API_KEY"
      },
      "models": {
        "claude-opus-4-7": { "name": "Claude Opus 4.7" },
        "claude-sonnet-4-6": { "name": "Claude Sonnet 4.6" },
        "claude-haiku-4-5": { "name": "Claude Haiku 4.5" }
      }
    },
    "zenn-codex": {
      "npm": "@ai-sdk/openai-compatible",
      "name": "Zenn Codex",
      "options": {
        "baseURL": "https://zenn.engineering/api/v1/codex",
        "apiKey": "ck_YOUR_API_KEY"
      },
      "models": {
        "gpt-5.5": { "name": "GPT-5.5" },
        "gpt-5.5-pro": { "name": "GPT-5.5 Pro" },
        "gpt-5.5-instant": { "name": "GPT-5.5 Instant" },
        "gpt-5.4": { "name": "GPT-5.4" },
        "gpt-5.3-codex": { "name": "GPT-5.3 Codex" }
      }
    },
    "zenn-gemini": {
      "npm": "@ai-sdk/openai-compatible",
      "name": "Zenn Gemini",
      "options": {
        "baseURL": "https://zenn.engineering/api/v1/gemini",
        "apiKey": "ck_YOUR_API_KEY"
      },
      "models": {
        "gemini-3.1-pro-preview": { "name": "Gemini 3.1 Pro" },
        "gemini-3-pro-preview": { "name": "Gemini 3 Pro" },
        "gemini-3-flash-preview": { "name": "Gemini 3 Flash" }
      }
    },
    "zenn-chinese": {
      "npm": "@ai-sdk/openai-compatible",
      "name": "Zenn Chinese (DeepSeek / Moonshot / Zhipu)",
      "options": {
        "baseURL": "https://zenn.engineering/api/v1/codex",
        "apiKey": "ck_YOUR_API_KEY"
      },
      "models": {
        "deepseek-v4-pro": { "name": "DeepSeek V4 Pro" },
        "deepseek-v4-flash": { "name": "DeepSeek V4 Flash" },
        "kimi-k2.6": { "name": "Kimi K2.6" },
        "glm-5.1": { "name": "GLM-5.1" }
      }
    }
  }
}

Paso 3 — Ejecutar

terminal

opencode

5. Codex CLI

El CLI oficial de OpenAI para la familia GPT-5 / Codex. Configura dos variables de entorno y apunta a nuestra base URL de Codex.

Configurar entorno

shell

export OPENAI_BASE_URL=https://zenn.engineering/api/v1/codex
export OPENAI_API_KEY=ck_YOUR_API_KEY

Ejecutar

terminal

# Default
codex

# Pick a model
codex --model gpt-5.5
codex --model gpt-5.5-pro
codex --model gpt-5.5-instant
codex --model gpt-5.3-codex

# Chinese coding models (via OpenAI-compatible /v1/codex)
codex --model deepseek-v4-pro
codex --model kimi-k2.6
codex --model glm-5.1

Codex CLI usa Authorization: Bearer y los formatos de OpenAI /chat/completions + /responses — ambos están soportados.

6. Gemini CLI

El Gemini CLI de Google envía la key vía x-goog-api-key. El proxy acepta ese header de forma transparente.

Configurar entorno

shell

export GEMINI_BASE_URL=https://zenn.engineering/api/v1/gemini
export GEMINI_API_KEY=ck_YOUR_API_KEY

Ejecutar

terminal

gemini --model gemini-3.1-pro-preview
gemini --model gemini-3-flash-preview

7. Cursor IDE

En Cursor → Settings → Models → "Custom OpenAI Model":

Campo	Valor
Override OpenAI Base URL	https://zenn.engineering/api/v1/codex
OpenAI API Key	ck_YOUR_API_KEY
Add custom models	gpt-5.5, gpt-5.5-pro, gpt-5.5-instant, gpt-5.4, gpt-5.3-codex, deepseek-v4-pro, kimi-k2.6, glm-5.1

Haz clic en Verify después de guardar — Cursor llamará /models en la base URL para confirmar que la key funciona.

8. API Directa (cURL)

Tres formatos de protocolo, una sola key. Elige el que ya hable tu cliente.

Compatible con Anthropic — /v1/messages

cURL · Claude

curl -X POST https://zenn.engineering/api/v1/messages \
  -H "x-api-key: ck_YOUR_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "claude-sonnet-4-6",
    "max_tokens": 1024,
    "messages": [{"role": "user", "content": "Hello, Claude"}]
  }'

Compatible con OpenAI — /v1/codex/chat/completions

cURL · GPT-5.5

curl -X POST https://zenn.engineering/api/v1/codex/chat/completions \
  -H "Authorization: Bearer ck_YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-5.5",
    "messages": [{"role": "user", "content": "Hello, GPT-5.5"}],
    "stream": true
  }'

Gemini — /v1/gemini/chat/completions

cURL · Gemini

curl -X POST https://zenn.engineering/api/v1/gemini/chat/completions \
  -H "Authorization: Bearer ck_YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gemini-3.1-pro-preview",
    "messages": [{"role": "user", "content": "Hello, Gemini"}]
  }'

9. Generación de imágenes

Endpoint

POST https://zenn.engineering/api/v1/images/generations
GET  https://zenn.engineering/api/v1/images/generations  (list models)

Generar una imagen

cURL · gpt-image-2

curl -X POST https://zenn.engineering/api/v1/images/generations \
  -H "Authorization: Bearer ck_YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-image-2",
    "prompt": "A cinematic photo of a small red apple on a marble countertop",
    "n": 1
  }'

Comportamiento asíncrono

DocsPage.imageGen.asyncBody

En el chat del navegador

10. Modelos y precios

Claude (Anthropic)

ID del modelo	Entrada / MTok	Salida / MTok	Lectura caché	Estado
claude-opus-4-7	$15.00	$75.00	$1.50	Activo
claude-opus-4-6	$15.00	$75.00	$1.50	Activo
claude-sonnet-4-6	$3.00	$15.00	$0.30	Activo
claude-haiku-4-5	$1.00	$5.00	$0.10	Activo

OpenAI / GPT

ID del modelo	Entrada / MTok	Salida / MTok	Lectura caché	Estado
gpt-5.5	$5.00	$30.00	$0.50	Activo
gpt-5.5-instant	$5.00	$30.00	$0.50	Activo
gpt-5.5-pro	$30.00	$180.00	$30.00	Activo
gpt-5.4	$5.00	$22.50	$0.50	Activo
gpt-5.3-codex	$1.75	$14.00	$0.17	Activo
gpt-5.2	$1.75	$14.00	$0.17	Activo

Gemini (Google)

ID del modelo	Entrada / MTok	Salida / MTok	Lectura caché	Estado
gemini-3.1-pro-preview	$4.00	$18.00	$0.40	Activo
gemini-3-pro-preview	$4.00	$18.00	$0.40	Activo
gemini-3-flash-preview	$0.50	$3.00	$0.05	Activo

DeepSeek / Moonshot / Zhipu

ID del modelo	Entrada / MTok	Salida / MTok	Lectura caché	Estado
deepseek-v4-pro	$1.74	$3.48	$0.01	Activo
deepseek-v4-flash	$0.14	$0.28	$0.0028	Activo
kimi-k2.6	$0.95	$4.00	$0.16	Activo
glm-5.1	$1.40	$4.40	$0.26	Activo

Imagen (activo)

ID del modelo	Créditos / imagen	Precio / imagen	Estado
gpt-image-2	60000	$0.06	Activo

11. Autenticación

Todas las API keys usan el prefijo ck_. El proxy acepta todos los formatos estándar de header de los SDK para que los clientes funcionen sin modificación.

Header	Formato	Usado por
x-api-key	ck_...	Claude Code, Anthropic SDK
Authorization	Bearer ck_...	OpenCode, Codex CLI, OpenAI SDK, cURL
anthropic-api-key	ck_...	Header alterno de Anthropic
x-goog-api-key	ck_...	Gemini CLI

Headers reenviados

anthropic-version (por defecto 2023-06-01) y anthropic-beta pasan a través. Streaming SSE totalmente soportado.

12. Planes

Pro

$10 · 10,000,000 créditos

Precio estándar. Pago por uso.

· Todo LLM de frontera al precio de lista oficial
· API compatible con OpenAI / Anthropic / Gemini
· Límites de gasto por key, analítica en tiempo real

Max

$100 · 400,000,000 créditos

4× créditos — $100 compran $400 de uso al precio de lista.

· Todo lo de Pro
· 4× créditos por dólar en el momento de la recarga
· Mismo precio de lista en cada modelo
· Cola prioritaria + ruteo más rápido

Enterprise

$1,000 · 6,000,000,000 créditos

6× créditos — $1,000 compran $6,000 de uso + canal prioritario Anthropic Max.

· Todo lo de Max
· 6× créditos por dólar en el momento de la recarga
· Mismo precio de lista en cada modelo
· Canal prioritario Anthropic Max
· Soporte dedicado, facturación amigable para auditorías

Una regla de precios, todos los modelos

· Cada modelo de LLM, imagen, video y audio se consume al precio de lista oficial mostrado en /models.
· El valor de Max ($100 → 4×) y Enterprise ($1,000 → 6×) viene de los créditos extra otorgados al recargar, no de niveles de descuento por modelo.
· Sin elegibilidad por bucket, sin letra chica por modelo — tus créditos funcionan igual en Claude Opus, GPT-5.5 y Gemini Flash.

13. Rate limits y errores

Rate limits por usuario

Endpoint	Solicitudes / hora
/v1/messages, /v1/chat/completions, /v1/gemini	1,000
/v1/images/generations	500
/v1/responses, /v1/codex/*	1,000

El estado del rate limit se devuelve en los headers de la respuesta: x-ratelimit-limit, x-ratelimit-remaining, x-ratelimit-reset.

Códigos de error

Estado	Significado
401	API key faltante o inválida
402	Créditos insuficientes — recarga en /checkout
403	El nivel no desbloquea el modelo solicitado (ej. Opus 4.7)
429	Rate limit por usuario alcanzado
503	El modelo está listado pero como Próximamente
504	La generación de imagen agotó el tiempo (reintentar)

14. Próximamente

Listados públicamente pero la API los rechaza hasta que el margen bajo el modelo de multiplicador de créditos se estabilice:

Imagen (más)

Familia Nano Banana, Gemini 3 Pro Image, Seedream, GPT-4o Image, Imagen.

Video

Veo 3.1, Kling 3.0, Seedance 2.0, HappyHorse 1.0, MiniMax Hailuo, Vidu Q3, WAN 2.6.

Audio

Fish Audio TTS, Voice Clone, ASR.

Ver el listado completo en /models. Las entradas Próximamente devuelven HTTP 503 desde la API; llamarlas hoy es un no-op que no consume créditos.

¿Listo para empezar?

Una sola key funciona en Claude Code, OpenCode, Codex CLI, Gemini CLI y Cursor. Recarga créditos y crea tu API key.

Ver planes Gestionar API Keys