はじめに
「Claude CodeやGemini CLIみたいなAIエージェントを、OpenAIのモデルで使いたい…」
「ターミナルで動くAIエージェントの中で、OpenAIが出しているものって何?」
そんな疑問を持つエンジニアに向けて、OpenAI Codex CLIの全貌を徹底解説します。
OpenAIが2025年4月に公開したCodex CLIは、2026年3月時点でバージョンv0.117.0に達し、単なるコード補完ツールから本格的なターミナル型AIエージェントへと進化しました。特にTerminal-Bench 2.0(ターミナル作業能力のベンチマーク)で**77.3%**というスコアは、同カテゴリのツールの中で最高水準です。
本記事では、2026年3月時点の最新情報をもとに、Codex CLIの全体像から実践的な活用方法まで徹底解説します。
この記事で分かること
- Codex CLIとは何か(Claude Code・Gemini CLIとの違い)
- できること・主な機能
- メリット・デメリットの詳細分析
- 承認モード(Approval Policy)とサンドボックスの使い方
- AGENTS.mdによるプロジェクト設定
- 料金体系と使い分け
- インストール手順(Windows/Mac/Linux対応)
- 実践的な活用シーン
こんな人におすすめ
- OpenAIのモデル(GPT-5系)でターミナルAIエージェントを使いたい開発者
- CI/CDパイプラインにAIエージェントを組み込みたいエンジニア
- 完全自動化に安全なサンドボックスを使いたい人
- Claude CodeやGemini CLIとの比較で選択肢を広げたい人
- オープンソースのAIエージェントをカスタマイズして使いたい人
Codex CLIとは
基本概念
Codex CLIは、OpenAIが開発・オープンソース公開しているコマンドライン型のAIエージェントです。
■ターミナルネイティブ
└→ コマンドラインから直接OpenAIモデルとやり取り
└→ エディタとシームレスに統合
■ローカルファイルアクセス
└→ プロジェクトファイルを直接読み書き
└→ ディレクトリ全体を丸ごと解析
■エージェント機能
└→ ファイル編集・シェル実行・Git操作を自律実行
└→ 複数ステップのタスクを自動的に処理GitHubリポジトリはApache-2.0ライセンスで公開されており、誰でもソースコードを確認・改変・貢献できます。
他のAIエージェントとの違い
| 機能 | ブラウザ版ChatGPT | Codex CLI |
|---|---|---|
| ファイル保存 | ダウンロード操作が必要 | 直接上書き・新規作成 |
| コマンド実行 | 不可能 | コンパイル、テスト、Git操作 |
| ファイル数 | 数個〜十数個が限界 | 大量ファイルを一括スキャン |
| 外部連携 | コピペのみ | DB、API、OSツールと直結 |
| 自動化 | 手動対話のみ | スクリプトによる完全自動化 |
| サンドボックス | なし | OSネイティブサンドボックスで安全隔離 |
2026年3月時点の最新バージョン
| バージョン | リリース日 | 主な内容 |
|---|---|---|
| v0.117.0(最新安定版) | 2026/03/26 | プラグインのファーストクラス化、マルチエージェントv2、/titleコマンド追加 |
| v0.116.0 | 2026/03/19 | ChatGPTデバイスコードサインイン、userpromptsubmitフック、プラグインリモート同期 |
| gpt-5.3-codex統合 | 2026/02/05 | 100万トークンコンテキスト、Terminal-Bench 2.0で77.3% |
| codex-1 / codex-mini-latest | 2025/05/16 | SWE-bench Verified 72.1%のcodex-1、200Kコンテキストのcodex-mini-latest |
| 初版リリース | 2025/04/16 | Codex CLI公開(Apache-2.0、オープンソース化) |
Codex CLIでできること
1. ファイル操作(作成・編集・削除)
ローカルファイルを直接操作できます。
# Codex CLIを起動
codex
# 指示例(プロンプトで入力)
> main.py のバグを修正して保存して
> 新しいファイル utils.ts を作成して、日付フォーマット関数を実装して
> src/ フォルダ内の全 .ts ファイルにエラーハンドリングを追加して2. コードの理解と分析
プロジェクト全体を読み込み、深い分析が可能です。
> このプロジェクト全体のアーキテクチャを分析して、セキュリティ上の問題点を指摘して
> src/components/ フォルダの全コンポーネントを確認して、重複している処理をリストアップしてgpt-5.3-codexモデル使用時は100万トークンのコンテキストに対応しており、大規模なコードベースを丸ごと保持したまま会話できます。
3. シェルコマンドの実行
> テストを実行して、失敗したケースがあれば原因を分析して修正して
> npm run build してエラーがあれば解決して
> git log を確認して、今週のコミット内容をまとめて4. Git操作の自動化
> 今の変更を feature/fix-bug ブランチにコミットしてプッシュして
> git の差分を確認して、適切なコミットメッセージを作成してコミットまで完了させて5. Web検索との連携
デフォルトで有効化されており、最新情報をリアルタイムに取得しながらコードを生成できます。
# 最新ライブラリ情報を調べながらコードを書く
> React 19 の新しいフック useOptimistic を使った実装例を見せて
# セキュリティアドバイザリを参照しながら修正
> この依存パッケージに既知の脆弱性がないか確認して6. 大規模ドキュメント・コードの一括処理
> content/ フォルダ内の全記事をスキャンして、古いAPIの呼び出し箇所を
> 新しいバージョンに一括置換して保存して主要機能の詳細
承認モード(Approval Policy)【安全のために重要】
Codex CLIの最大の特徴が細かく制御できる承認ポリシーです。--approval-policy フラグまたは config.toml で設定します。
# デフォルト(on-request): ワークスペース外の操作のみ承認を求める
codex
# 読み取り専用: 状態変更・破壊的操作は全て承認
codex --approval-policy untrusted
# 完全無効: 全ての承認プロンプトをスキップ(サンドボックスは有効)
codex --approval-policy never
# 危険モード: サンドボックス・承認を完全無効化(隔離環境専用)
codex --dangerously-bypass-approvals-and-sandbox| モード | 動作 | 推奨ケース |
|---|---|---|
| on-request(デフォルト) | ワークスペース外のファイル編集・ネットワークアクセス時のみ確認 | 通常の開発作業 |
| untrusted | 読み取り専用は自動実行、変更・破壊的操作は全て確認 | 初めてのプロジェクト |
| never | 全ての承認プロンプトをスキップ(サンドボックスは維持) | CI/CD環境 |
| dangerously-bypass | 全制限を解除 | 完全隔離された環境のみ |
最初は on-request(デフォルト)で使うことを強く推奨します。
サンドボックス実行【Codex CLI独自の安全機能】
Codex CLIはOSネイティブの機能でコマンド実行を隔離します。macOS/Linux/WSL/Windows Nativeで実装が異なります。
■ read-only(読み取り専用)
└→ ファイル閲覧のみ。編集・コマンド実行は承認必要
■ workspace-write(デフォルト)
└→ ワークスペース内のファイル読み書き・通常コマンドは自動許可
└→ ネットワークアクセスやワークスペース外への変更は制限
■ danger-full-access
└→ ファイルシステム・ネットワーク境界を完全解除Claude CodeやGemini CLIにはないサンドボックス機能により、--approval-policy never と組み合わせても安全な完全自動化が実現できます。
AGENTS.md(プロジェクト設定ファイル)【Claude CodeのCLAUDE.mdに相当】
Codexが起動時に自動読み込みするMarkdown形式の指示ファイルです。
# プロジェクト概要
このプロジェクトはNext.js + TypeScriptで構築したブログシステムです。
# コーディング規約
- すべてのやり取りは日本語で行うこと
- コメントはコードの右側に記述すること
- TypeScript strict モードを厳守すること
- 不要なboilerplateコードは書かないこと
# 開発コマンド
- ビルド: npm run build
- テスト: npm test
- Lint: npm run lint
# セキュリティポリシー
- .envファイルは絶対に読み取らないこと
- node_modules は絶対に編集しないこと
- 本番環境のDBに接続するコマンドは実行しないこと読み込み順序(優先度が高い順):
| ファイルパス | 役割 |
|---|---|
~/.codex/AGENTS.override.md | グローバル上書き(最高優先) |
~/.codex/AGENTS.md | グローバルデフォルト |
Gitルート〜現在のディレクトリの各階層の AGENTS.md | プロジェクト・フォルダ設定 |
AGENTS.mdのポイント:
- 禁止事項の明記が特に効果的(full-autoモードでの暴走防止)
- 正確なビルド・テストコマンドを記述しておくと精度が上がる
- セキュリティポリシーを明記することで機密情報の漏洩を防止
config.toml(設定ファイル)
AGENTS.mdがプロンプトの指示なら、config.tomlはCLI自体の動作設定です。
# ~/.codex/config.toml(ユーザーレベル)
model = "gpt-5.4" # デフォルトモデル
sandbox_mode = "workspace-write" # サンドボックスモード
approval_policy = "on-request" # 承認ポリシー
[features]
multi_agent = true # マルチエージェントv2を有効化
web_search = true # Web検索を有効化MCP(Model Context Protocol)連携【拡張性が魅力】
MCP対応により、外部ツールとの連携を自由に追加できます。
# ~/.codex/config.toml でMCPサーバーを設定
[mcp_servers.github]
command = "npx"
args = ["-y", "@modelcontextprotocol/server-github"]
enabled = true
[mcp_servers.postgres]
command = "npx"
args = ["-y", "@modelcontextprotocol/server-postgres"]
enabled = true設定後は /mcp コマンドで接続済みツールを確認できます。GitHubのIssue読み書きやPostgreSQLへの問い合わせを、Codexに自然言語で指示できるようになります。
マルチエージェントv2【v0.117.0〜】
v0.117.0で追加された機能で、複数のサブエージェントを並列実行できます。
> /agent
# パスベースでサブエージェントを管理
# /root/agent_a でフロントエンド担当
# /root/agent_b でバックエンド担当
# → 両エージェントが並列で作業し、構造化メッセージで通信大規模なリファクタリングや複数モジュールの同時実装に威力を発揮します。
スラッシュコマンド
| コマンド | 機能 |
|---|---|
/model | アクティブモデルをセッション中に変更 |
/fast | 高速モードの切り替え |
/plan | プランモード(実行計画を先に提示) |
/permissions | 承認要件をその場で調整 |
/status | セッション設定とトークン使用量を表示 |
/diff | Gitの差分を表示 |
/new | 同一セッション内で新規会話を開始 |
/fork | 現在の会話をフォークして別スレッドを作成 |
/agent | マルチエージェントのスレッドを切り替え |
/mcp | 設定済みMCPツールを一覧表示 |
/plugins | プラグインの一覧・インストール |
/review | コードレビューワークフローを起動 |
/compact | コンテキストを圧縮 |
/clear | ターミナルをクリアして新規チャット開始 |
/quit | セッション終了 |
会話の再開
# ローカル保存されたセッションを復元(長時間タスクに便利)
codex resume前回の作業状態をそのまま引き継いで続きから始められます。
使用モデル
| モデル | 特徴 | コンテキスト | 用途 |
|---|---|---|---|
| gpt-5.4(デフォルト) | フラッグシップ、高精度 | 未公開 | 複雑な推論・設計 |
| gpt-5.4-mini | 高速・低コスト版 | 未公開 | 日常的なコーディング |
| gpt-5.3-codex | コーディング特化 | 100万トークン | 大規模コードベース解析 |
Terminal-Bench 2.0(ターミナル作業能力): gpt-5.3-codex で 77.3%
※OpenAIはSWE-bench Verifiedにトレーニングデータ汚染が発見されたとして報告を停止。現在はSWE-bench Pro(56.8%)とTerminal-Bench 2.0が実質的な比較指標となっています。
/model コマンドでセッション中にいつでもモデルを切り替えられます。タスクの複雑さに応じてgpt-5.4とgpt-5.4-miniを使い分けることでコストを最適化できます。
料金体系
前提:APIキーが必須
Codex CLIを使うにはOpenAI APIキーまたはChatGPTのサブスクリプションが必要です。完全無料枠はありません。
ChatGPTサブスクリプション経由
| プラン | 月額 | 5時間あたりの利用枠 |
|---|---|---|
| Plus | $20 | 30〜150メッセージ |
| Pro | $200 | 300〜1,500メッセージ(6倍) |
| Business | $30/ユーザー | 組織向けワークスペース付き |
APIキー(従量課金)
| モデル | 入力 | 出力 |
|---|---|---|
| codex-mini-latest | $1.50 / 100万トークン | $6.00 / 100万トークン |
| gpt-5.4(汎用) | $1.25 / 100万トークン | $10.00 / 100万トークン |
⚠️ APIキー従量課金の注意点
└→ 使用量が増えると青天井になる
└→ プロジェクトごとに予算上限を設定することを推奨
└→ gpt-5.4-mini(低コストモデル)を日常タスクに使うことでコスト削減可能コスト最適化の考え方
gpt-5.4-mini を使う場面:
✅ 単純なファイル編集・コメント追加
✅ ドキュメント生成
✅ 簡単なリファクタリング
gpt-5.4 を使う場面:
✅ 複雑なアーキテクチャ設計
✅ 難易度の高いバグ修正
✅ セキュリティ審査
gpt-5.3-codex を使う場面:
✅ 大規模コードベース(数万行)の全体分析
✅ モノレポの依存関係解析インストール手順
前提条件
- Node.js 22以上
- OpenAI APIキー または ChatGPT Plus以上のアカウント
Step 1: Node.jsのインストール確認
# バージョン確認
node -v
# v22.x.x 以上が表示されればOKバージョンが表示されない場合は、Node.js公式サイトからLTS版をインストールしてください。
Step 2: Codex CLIのインストール
npm install -g @openai/codexStep 3: APIキーの設定
OpenAI APIキーを使う場合(推奨):
# Mac / Linux
export OPENAI_API_KEY="sk-..."
# または .bashrc / .zshrc に追記して永続化
# Windows (PowerShell)
[System.Environment]::SetEnvironmentVariable("OPENAI_API_KEY", "sk-...", "User")ChatGPTアカウントを使う場合:
# 起動時にブラウザが開き、ChatGPTアカウントでログイン
codex
# → デバイスコードサインイン(v0.116.0〜)Step 4: 初回起動と動作確認
# 起動
codex
# 動作確認
> このディレクトリの構造を教えてこれだけで準備完了です。
Windowsネイティブでの使用(実験的)
Windowsでのネイティブ実行は実験的サポートです。WSL(Windows Subsystem for Linux)の使用を強く推奨します。
# WSL(Ubuntu等)内で実行
npm install -g @openai/codex
export OPENAI_API_KEY="sk-..."
codexメリット
1. ターミナル作業能力が最高水準
Terminal-Bench 2.0(ターミナル操作・シェルスクリプトの実行能力評価)で**77.3%**という業界最高水準のスコアを達成しています。
Terminal-Bench 2.0 比較:
Codex CLI (gpt-5.3-codex): 77.3% ← 最高
Claude Code (Opus 4.6): 65.4%シェル操作・コマンドライン作業が得意なのが最大の強みです。
2. サンドボックス実行による安全な完全自動化
Codex CLI:
✅ OSネイティブのサンドボックスでコマンド実行を隔離
✅ approval-policy=never でも安全な自動化が可能
✅ CI/CDパイプラインへの組み込みに最適
Claude Code・Gemini CLI:
❌ サンドボックス機能なし3. モデルを柔軟に使い分けられる
gpt-5.4-mini: 低コストの日常タスク用
gpt-5.4: 高精度の複雑タスク用
gpt-5.3-codex: 100万トークンの大規模解析用
→ タスクに応じてコストと品質を最適化できる4. Apache-2.0のオープンソース
✅ ソースコードを完全に確認・改変可能
✅ 社内環境への組み込みが容易
✅ コミュニティによる機能拡張が活発
✅ ベンダーロックインのリスクが低い5. 高速処理(Cerebras統合)
Cerebras社との統合により、1,000トークン/秒超の高速推論が可能です(Claude Codeの約200トークン/秒と比較して5倍以上)。大量のファイルを素早く処理する際に特に有効です。
6. ChatGPT統合による統一体験
ChatGPT Web UI
↓ 同一アカウント
ChatGPT iOSアプリ
↓ 同一アカウント
VS Code拡張機能
↓ 同一アカウント
Codex CLI
→ どこでも同じ会話履歴にアクセス可能7. マルチエージェントによる並列タスク実行
v0.117.0から本格化したマルチエージェントv2により、複数のサブエージェントが並列で作業できます。大規模なリファクタリングや複数モジュールの同時実装の効率が大幅に向上します。
デメリット・注意点
1. 完全無料枠がない
Codex CLI: APIキー or ChatGPT Plus($20/月〜)が必須
Gemini CLI: Googleアカウントのみで0円から始められる
→ まず試してみたいだけの場合はGemini CLIの方が手軽2. ターミナル操作が必須
GUIに慣れている方には学習コストがあります。
基本操作の習得: 1〜2時間
日常的な使いこなし: 1週間程度3. Windowsネイティブのサポートが実験的
公式にはWSL経由の使用が推奨されており、Windowsネイティブでの動作は完全保証されていません。Windows環境で本格的に使う場合はWSLの導入が必要です。
4. コスト管理が必要
APIキー利用の場合、使用量に上限がないため予算管理が必要です。
⚠️ リスクケース:
- gpt-5.4で大規模コードベースを何時間も分析する
- マルチエージェントを多数起動する
✅ 対策:
- OpenAIダッシュボードで予算上限(Usage Limits)を設定
- 日常タスクはgpt-5.4-miniで処理する
- gpt-5.3-codexは大規模解析の時だけ使う5. ChatGPT・Claude Codeほど日本語コミュニティが充実していない
日本語の情報や事例がまだ少ないため、問題が発生した際に日本語で解決策を探しにくい場面があります。
実践的な活用シーン
シーン1: CI/CDパイプラインへの組み込み
Codex CLIの最も得意な活用法です。
# GitHub Actions での使用例
- name: Codex でコードレビュー
run: |
codex --approval-policy never \
"このPRの変更をレビューして、セキュリティ上の問題を報告して"サンドボックス付きで完全自動化できるため、CI/CD環境への組み込みが安全です。
シーン2: 大規模コードベースの一括分析
# gpt-5.3-codexモデルで100万トークンを活用
codex
> /model gpt-5.3-codex
> このモノレポ全体を解析して、循環依存のあるモジュールを
> すべてリストアップして、解消の優先順位を提案してシーン3: ターミナル作業の高度な自動化
> システムのログを解析して、過去24時間のエラーパターンを
> カテゴリ別に集計し、緊急度の高い問題から優先順位をつけてレポートを作成して
> 本番サーバーのデプロイ前チェックリストを実行して、
> 問題があれば詳細を報告して(実際のデプロイはしないこと)Terminal-Bench 2.0スコア77.3%の実力が発揮される領域です。
シーン4: 夜間バッチ処理の自動化
# 夜間に安全な完全自動モードで実行(サンドボックスは有効)
codex --approval-policy never \
"todayリリース候補のブランチをテストして、問題があればissueを作成して"シーン5: 社内ツールへのカスタム組み込み
Apache-2.0ライセンスのため、社内ツールへの改造・組み込みが自由です。
# 独自のワークフローをAGENTS.mdで定義
# 社内のコーディング規約・セキュリティポリシーを強制適用
# 社内MCPサーバーと連携してDBや社内APIにアクセスまとめ
Codex CLIは、2026年3月時点でClaude Code・Gemini CLIと並ぶ主要なターミナル型AIエージェントです。
主要なポイント:
✅ メリット
- ターミナル作業能力(Terminal-Bench)が業界最高水準(77.3%)
- サンドボックスによる安全な完全自動化が可能
- CI/CDパイプラインへの組み込みに最適な設計
- Apache-2.0オープンソースで社内カスタマイズが自由
- gpt-5.3-codexの100万トークンで大規模コードベースに対応
- Cerebras統合で1,000トークン/秒超の高速処理
⚠️ デメリット・注意点
- 完全無料枠はなし(APIキー or ChatGPT Plus必須)
- WindowsネイティブはWSL推奨
- 日本語コミュニティがまだ発展途上
- APIキー利用時は予算管理が必要
🎯 こんな方に特におすすめ
- CI/CDパイプラインにAIエージェントを安全に組み込みたい方
- シェル操作・ターミナル作業を高度に自動化したい方
- Apache-2.0ライセンスで社内ツールにカスタム組み込みしたい方
- gpt-5系モデルでターミナルエージェントを使いたい方
次のステップ:
まずは npm install -g @openai/codex でインストールして、簡単なファイル操作からお試しください。APIキーのコスト管理に注意しながら、日常的な開発タスクで効果を体感してみてください。
関連記事:
- Claude Code完全ガイド|ターミナルで動くAIコーディングアシスタントの全貌

- Gemini CLI完全ガイド|ターミナルで動くGoogleのAIエージェントの全貌

- Claude Code vs Gemini CLI vs Codex CLI|できること・できないことを徹底比較【2026年3月版】

タグ: #CodexCLI #Codex #OpenAI #AI #コーディング #開発効率化 #ターミナル #エージェント
コメント