OpenAI Codex CLI完全ガイド｜ターミナルで動くOpenAIのAIエージェントの全貌【2026年3月最新】

はじめに
この記事で分かること
こんな人におすすめ
Codex CLIとは
Codex CLIでできること
主要機能の詳細
使用モデル
料金体系
インストール手順
メリット
デメリット・注意点
実践的な活用シーン
まとめ

はじめに

「Claude CodeやGemini CLIみたいなAIエージェントを、OpenAIのモデルで使いたい…」

「ターミナルで動くAIエージェントの中で、OpenAIが出しているものって何？」

そんな疑問を持つエンジニアに向けて、OpenAI Codex CLIの全貌を徹底解説します。

OpenAIが2025年4月に公開したCodex CLIは、2026年3月時点でバージョンv0.117.0に達し、単なるコード補完ツールから本格的なターミナル型AIエージェントへと進化しました。特にTerminal-Bench 2.0（ターミナル作業能力のベンチマーク）で**77.3%**というスコアは、同カテゴリのツールの中で最高水準です。

本記事では、2026年3月時点の最新情報をもとに、Codex CLIの全体像から実践的な活用方法まで徹底解説します。

この記事で分かること

Codex CLIとは何か（Claude Code・Gemini CLIとの違い）
できること・主な機能
メリット・デメリットの詳細分析
承認モード（Approval Policy）とサンドボックスの使い方
AGENTS.mdによるプロジェクト設定
料金体系と使い分け
インストール手順（Windows/Mac/Linux対応）
実践的な活用シーン

こんな人におすすめ

OpenAIのモデル（GPT-5系）でターミナルAIエージェントを使いたい開発者
CI/CDパイプラインにAIエージェントを組み込みたいエンジニア
完全自動化に安全なサンドボックスを使いたい人
Claude CodeやGemini CLIとの比較で選択肢を広げたい人
オープンソースのAIエージェントをカスタマイズして使いたい人

Codex CLIとは

基本概念

Codex CLIは、OpenAIが開発・オープンソース公開しているコマンドライン型のAIエージェントです。

■ターミナルネイティブ
└→ コマンドラインから直接OpenAIモデルとやり取り
└→ エディタとシームレスに統合

■ローカルファイルアクセス
└→ プロジェクトファイルを直接読み書き
└→ ディレクトリ全体を丸ごと解析

■エージェント機能
└→ ファイル編集・シェル実行・Git操作を自律実行
└→ 複数ステップのタスクを自動的に処理

GitHubリポジトリはApache-2.0ライセンスで公開されており、誰でもソースコードを確認・改変・貢献できます。

他のAIエージェントとの違い

機能	ブラウザ版ChatGPT	Codex CLI
ファイル保存	ダウンロード操作が必要	直接上書き・新規作成
コマンド実行	不可能	コンパイル、テスト、Git操作
ファイル数	数個〜十数個が限界	大量ファイルを一括スキャン
外部連携	コピペのみ	DB、API、OSツールと直結
自動化	手動対話のみ	スクリプトによる完全自動化
サンドボックス	なし	OSネイティブサンドボックスで安全隔離

2026年3月時点の最新バージョン

バージョン	リリース日	主な内容
v0.117.0（最新安定版）	2026/03/26	プラグインのファーストクラス化、マルチエージェントv2、`/title`コマンド追加
v0.116.0	2026/03/19	ChatGPTデバイスコードサインイン、`userpromptsubmit`フック、プラグインリモート同期
gpt-5.3-codex統合	2026/02/05	100万トークンコンテキスト、Terminal-Bench 2.0で77.3%
codex-1 / codex-mini-latest	2025/05/16	SWE-bench Verified 72.1%のcodex-1、200Kコンテキストのcodex-mini-latest
初版リリース	2025/04/16	Codex CLI公開（Apache-2.0、オープンソース化）

Codex CLIでできること

1. ファイル操作（作成・編集・削除）

ローカルファイルを直接操作できます。

# Codex CLIを起動
codex

# 指示例（プロンプトで入力）
> main.py のバグを修正して保存して

> 新しいファイル utils.ts を作成して、日付フォーマット関数を実装して

> src/ フォルダ内の全 .ts ファイルにエラーハンドリングを追加して

2. コードの理解と分析

プロジェクト全体を読み込み、深い分析が可能です。

> このプロジェクト全体のアーキテクチャを分析して、セキュリティ上の問題点を指摘して

> src/components/ フォルダの全コンポーネントを確認して、重複している処理をリストアップして

gpt-5.3-codexモデル使用時は100万トークンのコンテキストに対応しており、大規模なコードベースを丸ごと保持したまま会話できます。

3. シェルコマンドの実行

> テストを実行して、失敗したケースがあれば原因を分析して修正して

> npm run build してエラーがあれば解決して

> git log を確認して、今週のコミット内容をまとめて

4. Git操作の自動化

> 今の変更を feature/fix-bug ブランチにコミットしてプッシュして

> git の差分を確認して、適切なコミットメッセージを作成してコミットまで完了させて

5. Web検索との連携

デフォルトで有効化されており、最新情報をリアルタイムに取得しながらコードを生成できます。

# 最新ライブラリ情報を調べながらコードを書く
> React 19 の新しいフック useOptimistic を使った実装例を見せて

# セキュリティアドバイザリを参照しながら修正
> この依存パッケージに既知の脆弱性がないか確認して

6. 大規模ドキュメント・コードの一括処理

> content/ フォルダ内の全記事をスキャンして、古いAPIの呼び出し箇所を
> 新しいバージョンに一括置換して保存して

主要機能の詳細

承認モード（Approval Policy）【安全のために重要】

Codex CLIの最大の特徴が細かく制御できる承認ポリシーです。--approval-policy フラグまたは config.toml で設定します。

# デフォルト（on-request）: ワークスペース外の操作のみ承認を求める
codex

# 読み取り専用: 状態変更・破壊的操作は全て承認
codex --approval-policy untrusted

# 完全無効: 全ての承認プロンプトをスキップ（サンドボックスは有効）
codex --approval-policy never

# 危険モード: サンドボックス・承認を完全無効化（隔離環境専用）
codex --dangerously-bypass-approvals-and-sandbox

モード	動作	推奨ケース
on-request（デフォルト）	ワークスペース外のファイル編集・ネットワークアクセス時のみ確認	通常の開発作業
untrusted	読み取り専用は自動実行、変更・破壊的操作は全て確認	初めてのプロジェクト
never	全ての承認プロンプトをスキップ（サンドボックスは維持）	CI/CD環境
dangerously-bypass	全制限を解除	完全隔離された環境のみ

最初は on-request（デフォルト）で使うことを強く推奨します。

サンドボックス実行【Codex CLI独自の安全機能】

Codex CLIはOSネイティブの機能でコマンド実行を隔離します。macOS/Linux/WSL/Windows Nativeで実装が異なります。

■ read-only（読み取り専用）
└→ ファイル閲覧のみ。編集・コマンド実行は承認必要

■ workspace-write（デフォルト）
└→ ワークスペース内のファイル読み書き・通常コマンドは自動許可
└→ ネットワークアクセスやワークスペース外への変更は制限

■ danger-full-access
└→ ファイルシステム・ネットワーク境界を完全解除

Claude CodeやGemini CLIにはないサンドボックス機能により、--approval-policy never と組み合わせても安全な完全自動化が実現できます。

AGENTS.md（プロジェクト設定ファイル）【Claude CodeのCLAUDE.mdに相当】

Codexが起動時に自動読み込みするMarkdown形式の指示ファイルです。

# プロジェクト概要
このプロジェクトはNext.js + TypeScriptで構築したブログシステムです。

# コーディング規約
- すべてのやり取りは日本語で行うこと
- コメントはコードの右側に記述すること
- TypeScript strict モードを厳守すること
- 不要なboilerplateコードは書かないこと

# 開発コマンド
- ビルド: npm run build
- テスト: npm test
- Lint: npm run lint

# セキュリティポリシー
- .envファイルは絶対に読み取らないこと
- node_modules は絶対に編集しないこと
- 本番環境のDBに接続するコマンドは実行しないこと

読み込み順序（優先度が高い順）：

ファイルパス	役割
`~/.codex/AGENTS.override.md`	グローバル上書き（最高優先）
`~/.codex/AGENTS.md`	グローバルデフォルト
Gitルート〜現在のディレクトリの各階層の `AGENTS.md`	プロジェクト・フォルダ設定

AGENTS.mdのポイント:

禁止事項の明記が特に効果的（full-autoモードでの暴走防止）
正確なビルド・テストコマンドを記述しておくと精度が上がる
セキュリティポリシーを明記することで機密情報の漏洩を防止

config.toml（設定ファイル）

AGENTS.mdがプロンプトの指示なら、config.tomlはCLI自体の動作設定です。

# ~/.codex/config.toml（ユーザーレベル）
model = "gpt-5.4"                    # デフォルトモデル
sandbox_mode = "workspace-write"      # サンドボックスモード
approval_policy = "on-request"        # 承認ポリシー

[features]
multi_agent = true                    # マルチエージェントv2を有効化
web_search = true                     # Web検索を有効化

MCP（Model Context Protocol）連携【拡張性が魅力】

MCP対応により、外部ツールとの連携を自由に追加できます。

# ~/.codex/config.toml でMCPサーバーを設定
[mcp_servers.github]
command = "npx"
args = ["-y", "@modelcontextprotocol/server-github"]
enabled = true

[mcp_servers.postgres]
command = "npx"
args = ["-y", "@modelcontextprotocol/server-postgres"]
enabled = true

設定後は /mcp コマンドで接続済みツールを確認できます。GitHubのIssue読み書きやPostgreSQLへの問い合わせを、Codexに自然言語で指示できるようになります。

マルチエージェントv2【v0.117.0〜】

v0.117.0で追加された機能で、複数のサブエージェントを並列実行できます。

> /agent
# パスベースでサブエージェントを管理
# /root/agent_a でフロントエンド担当
# /root/agent_b でバックエンド担当
# → 両エージェントが並列で作業し、構造化メッセージで通信

大規模なリファクタリングや複数モジュールの同時実装に威力を発揮します。

スラッシュコマンド

コマンド	機能
`/model`	アクティブモデルをセッション中に変更
`/fast`	高速モードの切り替え
`/plan`	プランモード（実行計画を先に提示）
`/permissions`	承認要件をその場で調整
`/status`	セッション設定とトークン使用量を表示
`/diff`	Gitの差分を表示
`/new`	同一セッション内で新規会話を開始
`/fork`	現在の会話をフォークして別スレッドを作成
`/agent`	マルチエージェントのスレッドを切り替え
`/mcp`	設定済みMCPツールを一覧表示
`/plugins`	プラグインの一覧・インストール
`/review`	コードレビューワークフローを起動
`/compact`	コンテキストを圧縮
`/clear`	ターミナルをクリアして新規チャット開始
`/quit`	セッション終了

会話の再開

# ローカル保存されたセッションを復元（長時間タスクに便利）
codex resume

前回の作業状態をそのまま引き継いで続きから始められます。

使用モデル

モデル	特徴	コンテキスト	用途
gpt-5.4（デフォルト）	フラッグシップ、高精度	未公開	複雑な推論・設計
gpt-5.4-mini	高速・低コスト版	未公開	日常的なコーディング
gpt-5.3-codex	コーディング特化	100万トークン	大規模コードベース解析

Terminal-Bench 2.0（ターミナル作業能力）: gpt-5.3-codex で 77.3%

※OpenAIはSWE-bench Verifiedにトレーニングデータ汚染が発見されたとして報告を停止。現在はSWE-bench Pro（56.8%）とTerminal-Bench 2.0が実質的な比較指標となっています。

/model コマンドでセッション中にいつでもモデルを切り替えられます。タスクの複雑さに応じてgpt-5.4とgpt-5.4-miniを使い分けることでコストを最適化できます。

料金体系

前提：APIキーが必須

Codex CLIを使うにはOpenAI APIキーまたはChatGPTのサブスクリプションが必要です。完全無料枠はありません。

ChatGPTサブスクリプション経由

プラン	月額	5時間あたりの利用枠
Plus	$20	30〜150メッセージ
Pro	$200	300〜1,500メッセージ（6倍）
Business	$30/ユーザー	組織向けワークスペース付き

APIキー（従量課金）

モデル	入力	出力
codex-mini-latest	$1.50 / 100万トークン	$6.00 / 100万トークン
gpt-5.4（汎用）	$1.25 / 100万トークン	$10.00 / 100万トークン

⚠️ APIキー従量課金の注意点
└→ 使用量が増えると青天井になる
└→ プロジェクトごとに予算上限を設定することを推奨
└→ gpt-5.4-mini（低コストモデル）を日常タスクに使うことでコスト削減可能

コスト最適化の考え方

gpt-5.4-mini を使う場面:
✅ 単純なファイル編集・コメント追加
✅ ドキュメント生成
✅ 簡単なリファクタリング

gpt-5.4 を使う場面:
✅ 複雑なアーキテクチャ設計
✅ 難易度の高いバグ修正
✅ セキュリティ審査

gpt-5.3-codex を使う場面:
✅ 大規模コードベース（数万行）の全体分析
✅ モノレポの依存関係解析

インストール手順

前提条件

Node.js 22以上
OpenAI APIキーまたは ChatGPT Plus以上のアカウント

Step 1: Node.jsのインストール確認

# バージョン確認
node -v
# v22.x.x 以上が表示されればOK

バージョンが表示されない場合は、Node.js公式サイトからLTS版をインストールしてください。

Step 2: Codex CLIのインストール

npm install -g @openai/codex

Step 3: APIキーの設定

OpenAI APIキーを使う場合（推奨）：

# Mac / Linux
export OPENAI_API_KEY="sk-..."
# または .bashrc / .zshrc に追記して永続化

# Windows (PowerShell)
[System.Environment]::SetEnvironmentVariable("OPENAI_API_KEY", "sk-...", "User")

ChatGPTアカウントを使う場合：

# 起動時にブラウザが開き、ChatGPTアカウントでログイン
codex
# → デバイスコードサインイン（v0.116.0〜）

Step 4: 初回起動と動作確認

# 起動
codex

# 動作確認
> このディレクトリの構造を教えて

これだけで準備完了です。

Windowsネイティブでの使用（実験的）

Windowsでのネイティブ実行は実験的サポートです。WSL（Windows Subsystem for Linux）の使用を強く推奨します。

# WSL（Ubuntu等）内で実行
npm install -g @openai/codex
export OPENAI_API_KEY="sk-..."
codex

メリット

1. ターミナル作業能力が最高水準

Terminal-Bench 2.0（ターミナル操作・シェルスクリプトの実行能力評価）で**77.3%**という業界最高水準のスコアを達成しています。

Terminal-Bench 2.0 比較:
Codex CLI (gpt-5.3-codex): 77.3%  ← 最高
Claude Code (Opus 4.6):    65.4%

シェル操作・コマンドライン作業が得意なのが最大の強みです。

2. サンドボックス実行による安全な完全自動化

Codex CLI:
✅ OSネイティブのサンドボックスでコマンド実行を隔離
✅ approval-policy=never でも安全な自動化が可能
✅ CI/CDパイプラインへの組み込みに最適

Claude Code・Gemini CLI:
❌ サンドボックス機能なし

3. モデルを柔軟に使い分けられる

gpt-5.4-mini: 低コストの日常タスク用
gpt-5.4:      高精度の複雑タスク用
gpt-5.3-codex: 100万トークンの大規模解析用

→ タスクに応じてコストと品質を最適化できる

4. Apache-2.0のオープンソース

✅ ソースコードを完全に確認・改変可能
✅ 社内環境への組み込みが容易
✅ コミュニティによる機能拡張が活発
✅ ベンダーロックインのリスクが低い

5. 高速処理（Cerebras統合）

Cerebras社との統合により、1,000トークン/秒超の高速推論が可能です（Claude Codeの約200トークン/秒と比較して5倍以上）。大量のファイルを素早く処理する際に特に有効です。

6. ChatGPT統合による統一体験

ChatGPT Web UI
    ↓ 同一アカウント
ChatGPT iOSアプリ
    ↓ 同一アカウント
VS Code拡張機能
    ↓ 同一アカウント
Codex CLI
→ どこでも同じ会話履歴にアクセス可能

7. マルチエージェントによる並列タスク実行

v0.117.0から本格化したマルチエージェントv2により、複数のサブエージェントが並列で作業できます。大規模なリファクタリングや複数モジュールの同時実装の効率が大幅に向上します。

デメリット・注意点

1. 完全無料枠がない

Codex CLI:   APIキー or ChatGPT Plus（$20/月〜）が必須
Gemini CLI:  Googleアカウントのみで0円から始められる

→ まず試してみたいだけの場合はGemini CLIの方が手軽

2. ターミナル操作が必須

GUIに慣れている方には学習コストがあります。

基本操作の習得: 1〜2時間
日常的な使いこなし: 1週間程度

3. Windowsネイティブのサポートが実験的

公式にはWSL経由の使用が推奨されており、Windowsネイティブでの動作は完全保証されていません。Windows環境で本格的に使う場合はWSLの導入が必要です。

4. コスト管理が必要

APIキー利用の場合、使用量に上限がないため予算管理が必要です。

⚠️ リスクケース:
- gpt-5.4で大規模コードベースを何時間も分析する
- マルチエージェントを多数起動する

✅ 対策:
- OpenAIダッシュボードで予算上限（Usage Limits）を設定
- 日常タスクはgpt-5.4-miniで処理する
- gpt-5.3-codexは大規模解析の時だけ使う

5. ChatGPT・Claude Codeほど日本語コミュニティが充実していない

日本語の情報や事例がまだ少ないため、問題が発生した際に日本語で解決策を探しにくい場面があります。

実践的な活用シーン

シーン1: CI/CDパイプラインへの組み込み

Codex CLIの最も得意な活用法です。

# GitHub Actions での使用例
- name: Codex でコードレビュー
  run: |
    codex --approval-policy never \
      "このPRの変更をレビューして、セキュリティ上の問題を報告して"

サンドボックス付きで完全自動化できるため、CI/CD環境への組み込みが安全です。

シーン2: 大規模コードベースの一括分析

# gpt-5.3-codexモデルで100万トークンを活用
codex
> /model gpt-5.3-codex

> このモノレポ全体を解析して、循環依存のあるモジュールを
> すべてリストアップして、解消の優先順位を提案して

シーン3: ターミナル作業の高度な自動化

> システムのログを解析して、過去24時間のエラーパターンを
> カテゴリ別に集計し、緊急度の高い問題から優先順位をつけてレポートを作成して

> 本番サーバーのデプロイ前チェックリストを実行して、
> 問題があれば詳細を報告して（実際のデプロイはしないこと）

Terminal-Bench 2.0スコア77.3%の実力が発揮される領域です。

シーン4: 夜間バッチ処理の自動化

# 夜間に安全な完全自動モードで実行（サンドボックスは有効）
codex --approval-policy never \
  "todayリリース候補のブランチをテストして、問題があればissueを作成して"

シーン5: 社内ツールへのカスタム組み込み

Apache-2.0ライセンスのため、社内ツールへの改造・組み込みが自由です。

# 独自のワークフローをAGENTS.mdで定義
# 社内のコーディング規約・セキュリティポリシーを強制適用
# 社内MCPサーバーと連携してDBや社内APIにアクセス

Amazon検索[本 Claude Code]

まとめ

Codex CLIは、2026年3月時点でClaude Code・Gemini CLIと並ぶ主要なターミナル型AIエージェントです。

主要なポイント：

✅ メリット

ターミナル作業能力（Terminal-Bench）が業界最高水準（77.3%）
サンドボックスによる安全な完全自動化が可能
CI/CDパイプラインへの組み込みに最適な設計
Apache-2.0オープンソースで社内カスタマイズが自由
gpt-5.3-codexの100万トークンで大規模コードベースに対応
Cerebras統合で1,000トークン/秒超の高速処理

⚠️ デメリット・注意点

完全無料枠はなし（APIキー or ChatGPT Plus必須）
WindowsネイティブはWSL推奨
日本語コミュニティがまだ発展途上
APIキー利用時は予算管理が必要

🎯 こんな方に特におすすめ

CI/CDパイプラインにAIエージェントを安全に組み込みたい方
シェル操作・ターミナル作業を高度に自動化したい方
Apache-2.0ライセンスで社内ツールにカスタム組み込みしたい方
gpt-5系モデルでターミナルエージェントを使いたい方

次のステップ：

まずは npm install -g @openai/codex でインストールして、簡単なファイル操作からお試しください。APIキーのコスト管理に注意しながら、日常的な開発タスクで効果を体感してみてください。

関連記事：

Claude Code完全ガイド｜ターミナルで動くAIコーディングアシスタントの全貌

Claude Code完全ガイド｜ターミナルで動くAIコーディングアシスタントの全貌【2026年3月版】

はじめに「AIにコードを書かせたいけど、ブラウザとエディタを行き来するのが面倒…」そんな悩みを解決するのがClaude Codeです。2026年3月時点で、Anthropicが提供するターミナル型AIエージェントとして、開発者の間で急速に注...

Gemini CLI完全ガイド｜ターミナルで動くGoogleのAIエージェントの全貌

Gemini CLI完全ガイド｜ターミナルで動くGoogleのAIエージェントの全貌【2026年3月最新】

はじめに「Claude CodeみたいなAIコーディングエージェントを試したいけど、費用を抑えたい…」「Googleが出しているターミナル版AIエージェントって何ができるの？」そんな疑問を持つエンジニアに向けて、Gemini CLIの全貌を...

Claude Code vs Gemini CLI vs Codex CLI｜できること・できないことを徹底比較【2026年3月版】

Claude Code vs Gemini CLI vs Codex CLI｜できること・できないことを徹底比較【2026年3月版】

はじめに「ターミナル型AIエージェントが乱立していて、どれを選べばいいか分からない…」Claude Code（Anthropic）、Gemini CLI（Google）、Codex CLI（OpenAI）——三大AI企業がそれぞれターミナル...

タグ: #CodexCLI #Codex #OpenAI #AI #コーディング #開発効率化 #ターミナル #エージェント