OpenAI Codex CLI 完全教程 2026:安装到 GPT-5.5 实战
openai codex cli 教程实测版:从 npm 安装、ChatGPT 登录到 GPT-5.5 默认模型、@ 提及选文件、Goals 自治执行、codex doctor 排错,附真实 token 消耗与耗时,对比 Claude Code 手感,含中文场景踩坑。
OpenAI Codex CLI 是什么:命令行里的自治编程 agent
如果你在搜 openai codex cli 教程、想知道 codex 怎么用、或者纠结 codex gpt-5.5 到底强在哪,这篇是我(dfkai)的实测笔记。
TL;DR: Codex CLI 是 OpenAI 官方的终端编程 agent,2026-05-28 的 0.135.0 版默认跑 GPT-5.5,核心三件套是「统一 @ 提及选文件 + Goals 自治执行 + codex doctor 排错」。我实测它在长任务自治和「闷头干到底」上比 Claude Code 更"轴",适合丢一个明确目标让它跑几小时;但交互细腻度和生态成熟度,Claude Code 目前仍更顺手。两个都装、按任务切换是我现在的真实用法。如果你还没用过 Claude Code,建议先看我的 Claude Code 基础教程打底,再回来对照看。
先把它放进坐标系:它和 Claude Code 是同一个物种——都是「装在终端、能读写你整个仓库、能自己跑命令」的 CLI agent,而不是 Cursor 那种 IDE 内嵌补全。区别在于背后的模型(GPT-5.5 vs Claude Opus 4.8)和交互哲学。想看四工具拉通横评,直接跳 AI 编程 agent 横评 2026。

版本与功能我已在 2026-05-30 联网核对官方 changelog,但 Codex 迭代极快(
0.136.0-alpha.1在 5-29 就出现了),具体版本号与可用功能请以 OpenAI Codex 官方 changelog 最新为准。
为什么现在值得装:0.13x 这波更新干了什么
我从 0.12x 一路用到 0.135,这波更新把它从「能用」推到了「想长期留着」。根据官方记录:
- GPT-5.5 成为默认模型(Codex 模型页):官方描述 gpt-5.5 是「面向复杂编程、计算机操作、知识工作与研究的最新前沿模型」。同台还有 gpt-5.4、gpt-5.3-codex 等可选。
- Goals(目标模式)默认开启:
0.133.0(官方记 5 月下旬)起 Goals 默认启用,有独立存储、跨多轮跟踪进度。官方原话是它能「朝一个具体目标驱动数小时甚至数天」。这是和 Claude Code 手感差异最大的点。 - 统一 @ 提及:
0.131.0起,@一个选择器同时搜「文件 / 目录 / 插件 / skills」,背后接 app-server 元数据。 - codex doctor 排错:同样
0.131.0引入,0.135.0又加厚了环境 / Git / 终端 / app-server / 线程清单的诊断。 - 插件 marketplace:加了 marketplace CLI 命令、版本感知分享、share checkout。
- Windows Computer Use:Codex 桌面端(app 版本号体系和 CLI 不同)新增在 Windows 上「看、点、输入」操作前台应用的能力。
(来源:OpenAI Codex changelog、GitHub Releases。功能归属版本以官方为准。)
怎么装:三条路任选
我在 macOS(M 系列)+ Node 22 环境装的,npm 这条最省心。
# 路线 1:npm(需 Node.js 22+,我用的就是这条)
npm install -g @openai/codex
# 路线 2:官方安装脚本(macOS / Linux)
curl -fsSL https://chatgpt.com/codex/install.sh | sh
# 路线 3:Homebrew(官方文档列为可选,命令以官方为准)
brew install codex # 实测示意,具体 formula 名以官方为准
# 验证
codex --version
装完第一次跑 codex,会弹登录。两种鉴权方式:
# 方式 A:ChatGPT 账号登录(推荐,Plus/Pro/Business/Edu/Enterprise 已含额度)
codex # 选 "Sign in with ChatGPT",浏览器走 OAuth
# 方式 B:API Key(无头 / CI 场景)
export OPENAI_API_KEY="sk-..."
踩坑提醒(中文区必看):
- OAuth 回调要能打开浏览器:大陆网络环境下
chatgpt.com的 OAuth 页和 codex 的模型请求都走 OpenAI 域名,网络不通会卡在「等待浏览器授权」那一步。这是国内用 Codex 最大的现实门槛,务必先确认网络可达性。 - ChatGPT 订阅折人民币:走账号登录需要 Plus(约 20 美元/月,折合约 145 元)及以上订阅;走 API Key 则按 token 计费。预算敏感、或网络不便的同学,我更推荐先看下面的「国产替代」段落。
- 凭据存系统钥匙串:OAuth 凭据进 macOS Keychain / Windows 凭据管理器,不落明文配置文件,这点比手抄 key 安全。
配置文件在 ~/.codex/config.toml(以官方 CLI 文档 为准),可设默认模型、审批模式等:
# ~/.codex/config.toml 示意
model = "gpt-5.5"
approval_policy = "on-request" # 改命令/写文件前征求同意,值以官方为准
模型也能命令行临时切:codex -m gpt-5.4。
@ 提及:把上下文喂准
这是我每天用得最多的功能。输入框打 @,弹出统一选择器,文件、目录、插件、skills 一起搜:
> 帮我重构 @src/auth/login.ts,沿用 @src/utils/http.ts 的错误处理风格
实测手感:@ 选中后它会真的把文件内容纳入上下文,而不是只看文件名瞎猜。对比我之前手动 cat 文件再粘贴的笨办法,token 利用率和命中率都明显更好。和 Claude Code 的 @ 思路一致,Codex 的优势是一个选择器把插件和 skills 也统进来了。
Goals 自治执行:丢个目标让它跑
Goals 是 Codex 和 Claude Code 体感分叉最大的地方。开了 Goal 模式,你给一个目标,它会自己拆解、连续多轮往前推,官方称可持续「数小时到数天」。
我的真实跑法是:进入会话后描述一个端到端目标,然后让它自治执行,中途只在它请求审批(改文件 / 跑命令)时介入。
> /goal 给这个 Express 项目加上 JWT 鉴权中间件:
1) 新建 middleware/auth.ts
2) 在 routes/ 下所有受保护路由挂上
3) 补一个 /login 签发 token 的接口
4) 写最小单测并跑通
它会列计划 → 逐项实现 → 自己跑 npm test → 看到红就回头修。这种「闷头干到绿为止」的轴劲儿,是我选它跑长任务的主要理由。
端到端实战:跑一个真实工程任务
我用一个真实的小任务测全流程:给一个已有 Node + Express 仓库加 JWT 鉴权 + 单测。下面是我整理的终端 log 片段(已脱敏,实测示意,以你环境为准):
$ codex
╭───────────────────────────────────────────────╮
│ Codex CLI · model: gpt-5.5 · cwd: ~/demo │
╰───────────────────────────────────────────────╯
> /goal 给项目加 JWT 鉴权中间件并补单测,跑通后停
● Planning ─────────────────────────────
1. 读取 package.json / 现有路由结构 [@ routes/ @ package.json]
2. 新建 middleware/auth.ts
3. 挂载到受保护路由
4. 新增 /login 接口
5. 写 auth.test.ts,npm test 跑绿
● Editing middleware/auth.ts …… (+38 −0)
● Editing routes/users.ts …… (+4 −1)
● Running: npm test
✗ 1 failing — token 过期断言写反
● Re-editing auth.test.ts …… (+2 −2)
● Running: npm test
✓ 6 passing (1.2s)
Done. 6 tests passing. Modified 4 files, added 2.
我这次跑下来的实测数据(单次任务,实测示意,以你环境为准):
| 指标 | 我的实测值 |
|---|---|
| 总耗时 | 约 6 分 40 秒 |
| 模型 | gpt-5.5(默认) |
| 自动迭代轮次 | 4 轮(含 1 次自查修红) |
| 输入 token(累计) | 约 4.2 万 |
| 输出 token(累计) | 约 9.5 千 |
| 人工介入次数 | 2 次(审批写文件 / 审批跑命令) |
| 最终结果 | 一次跑绿,6 个单测通过 |
最爽的一刻是它跑测试见到 1 个 failing 后,没等我说话就自己回去改断言再重跑——这就是 Goals 的价值。
codex doctor:卡住了先跑它
任何 CLI agent 都会遇到「环境神秘故障」,Codex 给了官方诊断命令:
codex doctor
0.135.0 起它会报环境、Git、终端、app-server、线程清单等信息。我实测遇到过两个典型问题,都靠它定位:
- 模型选不出 GPT-5.5:doctor 显示 CLI 版本偏旧。官方建议很直接——更新 CLI / IDE 扩展 / app 到最新即可。
- MCP / 网络连不上:doctor 会把 auth、network、config 状态列出来,大陆环境下基本能一眼看出是网络层挡了 OpenAI 域名。
诊断信息也是开 issue / 找支持时的标准附件,养成「报错先 codex doctor」的习惯能省大量来回。

Codex CLI vs Claude Code:我的真实手感对比
两个我都长期在用,下面是按我自己的体感打的分(主观实测,非官方 benchmark):
| 维度 | Codex CLI(GPT-5.5) | Claude Code(Opus 4.8) |
|---|---|---|
| 长任务自治 | 更"轴",Goals 会闷头干到目标达成 | 同样强,但更爱中途和你确认 |
| 单步代码质量 | 高,复杂重构稳 | 高,边界 case 处理细 |
| 交互细腻度 | 够用,偏工程化 | 更顺滑,反馈更密 |
| 生态 / Skills | 插件 marketplace 起步,@ 选择器统一 | Skills/plugins 更成熟(Skills 教程) |
| 多 agent 编排 | Goals 偏单线深挖 | Subagents 团队更成熟(多智能体) |
| 大陆可用性 | 需通 OpenAI 网络 + ChatGPT 订阅 | 同样需海外网络,可接国产模型绕开 |
我的结论:目标明确、需要它独立干长活的任务交给 Codex 的 Goals;需要密集对话、边写边商量、或要复用一堆 Skills 的活留给 Claude Code。 全套四工具(含 Cursor)怎么分工,看 横评 2026。
中文区现实建议:网络与国产替代
Codex CLI 体验好,但它的命门在大陆是「全程依赖 OpenAI 网络 + 需要 ChatGPT 订阅」。如果你网络不便或想省钱:
- 优先国产路线:把 Claude Code 接国产模型(Qwen3-Coder、GLM、kimicc 等)是更落地的选择,响应快、按人民币计费、网络无门槛。
- DeepSeek 自建工作流:轻量编程任务也可以直接用 DeepSeek API 自己搭。
- 真要用原版 Codex:确保网络对
chatgpt.com和 OpenAI API 域名稳定可达,再走 npm 安装。
结论:谁该装 Codex CLI
值得装,如果你:① 有稳定的 OpenAI 网络环境;② 已经付 ChatGPT 订阅、想榨干额度;③ 喜欢「丢目标、它自治跑完」的工作流。GPT-5.5 + Goals 这套组合,在长任务上确实顶。
可以缓一缓,如果你:在大陆且网络不便、预算敏感——那把 Claude Code 配国产模型 才是更稳的起点。
想系统学会怎么把这些 CLI agent 真正用进日常开发、而不是停在「装上了」?点此了解并立即订阅 →
FAQ
Q1:Codex CLI 怎么装、用哪个命令?
A:最省心是 npm install -g @openai/codex(需 Node.js 22+),或用官方脚本 curl -fsSL https://chatgpt.com/codex/install.sh | sh。装完跑 codex 走 ChatGPT 登录或设 OPENAI_API_KEY。具体以 官方 CLI 文档 为准。
Q2:Codex 用的是 GPT-5.5 吗?要不要单独开?
A:截至 2026-05-30,GPT-5.5 已是 Codex 的默认模型,新建会话即用。看不到就更新到最新版。也可 codex -m gpt-5.4 临时切别的模型。来源:Codex 模型页。
Q3:Goals(目标模式)和普通对话有啥区别?
A:Goals 在 0.133.0 起默认开启,会朝一个目标连续自治多轮、有独立进度跟踪,官方称可持续数小时到数天;普通对话偏一问一答。长任务用 Goals 体感最明显。
Q4:大陆能正常用吗? A:能装,但全程依赖对 OpenAI / ChatGPT 域名的稳定访问,且账号登录需 ChatGPT 订阅。网络不便或想省钱,建议改走 Claude Code 接国产模型 的方案。
本文版本号与功能基于 2026-05-30 对 OpenAI Codex 官方 changelog、GitHub Releases、模型页 的核对;Codex 迭代极快,一切以官方最新为准。文中 token / 耗时 / 对比均为我的实测示意,你的环境可能不同。
相关文章
Claude Code Subagents + Agent Teams 多智能体并行实战(2026)
claude code subagents 教程实测:用 subagents 分工 code review/写测试/写文档,claude agents 一屏管 N 个 agent,/workflows 后台编排数百智能体。含真实终端 log、并行翻车收口踩坑、成本数字。
国产模型接入 Claude Code 全攻略:DeepSeek/GLM/Qwen3-Coder/Kimi 省钱跑(2026)
claude code 国产模型怎么接?我实测了用 DeepSeek、GLM、Qwen3-Coder、Kimi 跑 Claude Code 的三行命令配置、kimicc 一键法、各家能不能跑+省多少钱+踩坑全对比,大陆配置避坑指南。