Puerto Jiménez, Costa Rica
info@gexpsoftware.com
© 2026 Marcelo Retana
Cada vez que sale una herramienta de IA nueva, los devs saltan de barco. El problema no es la herramienta — es nunca profundizar lo suficiente con ninguna. Acá va una comparación honesta y por qué dominar gana siempre.
La semana pasada respondí un tweet: "¿Codex vs Claude Code?"
Mi respuesta: "Algunos devs están saltando de una herramienta a otra sin siquiera dominar una. Quedate con la que te da resultados."
Las respuestas se dividieron. La mitad estuvo de acuerdo. La otra mitad quería una comparación real. Así que acá van las dos cosas — la comparación que pidieron, y el argumento de por qué casi no importa si seguís cambiando cada dos semanas.
Este es el ciclo que veo constantemente:
El problema no es Codex. No es Claude Code. Es el hábito de nunca profundizar lo suficiente con ninguna herramienta como para realmente ser bueno usándola.
He visto desarrolladores saltar entre Cursor, Copilot, Claude Code, Codex, Aider y Windsurf — todo en tres meses. Nunca configuraron ninguna. Nunca crearon comandos custom, nunca configuraron memoria de proyecto, nunca aprendieron los atajos de teclado. Y después se quejan de que "las herramientas de IA para código están sobrevaloradas."
No. Simplemente nunca te quedaste lo suficiente como para pasar de la fase tutorial.
Dicho eso — las herramientas sí son genuinamente diferentes, y las diferencias importan. Esto es lo que encontré después de usar Claude Code diariamente por más de un año y probar Codex extensivamente.
Open source (Apache 2.0). Originalmente escrito en TypeScript, completamente reescrito en Rust a mediados de 2025. TUI de pantalla completa con una interfaz de terminal pulida.
Donde brilla:
codex cloud te permite lanzar tareas asincrónicamente a la nube. Delegás trabajo, volvés después. Claude Code no tiene nada equivalente/review — Code review dedicado que lee un diff y da hallazgos priorizados. Integrado, no un hack de promptAGENTS.md — Configuración a nivel de repositorio, similar en concepto a CLAUDE.mdModelo: GPT-5.3-Codex (construido específicamente para código) con toda la familia de variantes GPT-5.
Código cerrado. Construido sobre Node.js. Estilo de pair-programming conversacional — menos "ejecutá esta tarea" y más "trabajemos esto juntos."
Donde brilla:
/clear, /compact, gestión de sesiones con TASKS.md. Las herramientas para manejar sesiones largas son más madurasModelo: Claude Opus 4.6 / Sonnet 4.6 (configurable por tarea).
| Aspecto | Codex CLI | Claude Code |
|---|---|---|
| Licencia | Apache 2.0 (open source) | Propietario |
| Lenguaje | Rust | Node.js |
| Tareas en la nube | Sí | No |
| Code review | /review integrado | Basado en prompts |
| Subagentes | Multi-agente experimental | Maduro, automático |
| Memoria de proyecto | AGENTS.md | CLAUDE.md + skills + hooks |
| Sandbox | Nativo (3 niveles) | Docker / nivel de sistema |
| Modo plan | No | Sí |
| Resume de sesión | codex resume / codex fork | /resume con IDs de sesión |
| Multi-paso complejo | Bueno | Más fuerte |
| Velocidad (tokens/seg) | Output más rápido | Más lento pero más deliberado |
| Soporte MCP | Sí | Sí |
| Precio | ChatGPT Plus ($20/mes) | Claude Pro ($20/mes) / Max ($100-200/mes) |
Siendo honesto: Codex tiene fortalezas reales. Las tareas en la nube son genuinamente útiles para trabajo asíncrono. El modelo open source significa que la comunidad impulsa features rápido. La reescritura en Rust lo hizo ágil. /review es algo que me gustaría que Claude Code tuviera integrado.
Pero para mi flujo de trabajo — shipping de proyectos full-stack desde arquitectura hasta deployment — Claude Code gana en las tareas que realmente toman tiempo. El sistema de subagentes, el modo plan, y la consistencia en refactors complejos son lo que me ahorra horas, no milisegundos de output de tokens más rápido.
Esto es de lo que nadie habla en estas comparaciones: las ganancias reales de productividad vienen de la configuración, no de la capacidad.
Las dos herramientas son lo suficientemente poderosas para multiplicar tu productividad x10. Pero solo si invertís en aprenderlas. Eso significa:
Llevo cientos de horas construyendo mi configuración de Claude Code. Comandos custom, 17 skills reutilizables, templates de proyecto, flujos de gestión de sesiones. Esa inversión se compone todos los días.
Cuando cambiás de herramienta, reseteás ese interés compuesto a cero.
Escribí sobre esto en detalle en Cómo Multipliqué x10 Mi Velocidad de Código con Claude Code. La velocidad no viene de que Claude sea más rápido que Codex. Viene de que Claude conoce mis convenciones, mis reglas de identidad git, mis estructuras de proyecto, y mis patrones de código — porque me tomé el tiempo de enseñarle.
He entregado más de 50 proyectos con Claude Code. Mi configuración incluye:
Eso no es algo que reconstruí de cero. Son cientos de horas de iteración, refinamiento y detección de patrones. Cada vez que Claude sugiere una nueva automatización basada en mis hábitos, el sistema se vuelve un poco mejor.
Cambiarme a Codex significaría reconstruir todo eso en formato AGENTS.md. Diferente sintaxis, diferentes capacidades, diferente modelo mental. ¿Para qué? ¿Output de tokens más rápido?
La herramienta que te da resultados es la que invertiste en dominar. Para mí, esa es Claude Code. Para alguien más, podría ser Codex. La respuesta incorrecta es cambiar cada dos semanas y no dominar ninguna.
No estoy diciendo que nunca debés cambiar. Hay razones legítimas:
Lo que no es buena razón:
Los benchmarks no entregan tu proyecto. La configuración y la memoria muscular sí.
Sí, y algunos desarrolladores lo hacen. Codex para tareas async rápidas vía codex cloud, Claude Code para trabajo complejo multi-paso. Pero mantener configuración para ambas herramientas es doble la inversión. La mayoría de desarrolladores están mejor servidos profundizando en una.
La velocidad de output de tokens es más rápida. Pero la velocidad para completar tareas complejas depende más de la calidad de razonamiento, gestión de contexto, y qué tan bien configuraste la herramienta. Una sesión de Claude Code bien configurada que clava un refactor al primer intento es más rápida que una respuesta rápida de Codex que necesita tres correcciones.
Cualquiera de las dos te va a servir bien. Si el open source te importa, o ya estás pagando ChatGPT Plus, Codex es un punto de partida natural. Si querés opciones de configuración más profundas, un sistema de subagentes maduro, y modo plan para proyectos complejos, Claude Code es más fuerte ahí. Elegí una, comprometete a aprenderla por al menos 3 meses antes de evaluar.
No directamente. Los conceptos son similares — ambos son archivos markdown que le dan contexto a la IA sobre tu proyecto — pero la sintaxis, features y capacidades difieren. Tendrías que reescribir tu configuración, no copiar y pegar.
Categoría diferente. Cursor y Copilot son asistentes integrados en el IDE — funcionan dentro de tu editor. Codex y Claude Code son agentes nativos de terminal — funcionan junto a tu editor. Muchos desarrolladores usan ambos: un asistente de IDE para completions inline y un agente de terminal para tareas más grandes.
¿Querés ver la configuración que hace que Claude Code funcione a este nivel? Revisá awesome-claude-code — open source, probado en más de 50 proyectos.
¿Estás construyendo algo y querés hablar sobre tu flujo de trabajo con IA? Hablemos.