はじめに
「ターミナル型AIエージェントが乱立していて、どれを選べばいいか分からない…」
Claude Code(Anthropic)、Gemini CLI(Google)、Codex CLI(OpenAI)——三大AI企業がそれぞれターミナル型エージェントをリリースし、2026年3月現在、どれを使うべきか迷っているエンジニアが急増しています。
どれも「ターミナルから自律的にファイルを編集・コマンドを実行できる」という点は同じです。しかし設計思想・得意分野・コストが大きく異なります。
本記事では3つのツールを同じ観点で徹底的に比較します。「どれを選ぶべきか」の判断材料として、ぜひ参考にしてください。
基本スペック比較
まずは数値で比べます。
| 項目 | Claude Code | Gemini CLI | Codex CLI |
|---|---|---|---|
| 開発元 | Anthropic | OpenAI | |
| 最新安定版 | 最新版(2026/03時点) | v0.34.0(2026/03時点) | v0.117.0(2026/03時点) |
| デフォルトモデル | Sonnet 4.6(Opus 4.6も選択可) | Gemini 2.5 Flash | gpt-5.4(gpt-5.3-codexも選択可) |
| コンテキストウィンドウ | 約20万トークン | 最大100万トークン | 最大100万トークン(gpt-5.3-codex使用時) |
| 無料枠 | なし | あり(1,000req/日) | なし |
| 月額費用 | Pro: $20/月〜 | 個人アカウントで無料 | APIキー従量課金のみ |
| オープンソース | なし | あり(Apache-2.0) | あり(Apache-2.0) |
| SWE-bench Verified | Sonnet 4.6: 72.7% / Opus 4.6: 80.8% | Gemini 2.5 Flash: 78% | ※後述 |
| Terminal-Bench 2.0 | 65.4% | 未公開 | 77.3% |
| サンドボックス実行 | なし | なし | あり |
ベンチマークについての補足
SWE-bench Verifiedはコーディングタスク全般の能力評価です。一方、Terminal-Bench 2.0はターミナル操作・シェルスクリプト実行に特化した評価です。Codex CLIはターミナル特化のベンチマークで最高スコアを記録しています。
※OpenAIはSWE-bench Verifiedにトレーニングデータ汚染が発見されたとして報告を停止。Codex CLIの現行モデル比較にはSWE-bench ProとTerminal-Bench 2.0が使われています。
料金の詳細
Claude Code:
Proプラン: $20/月(5時間ごとに約10〜40プロンプト制限)
Max 5x: $100/月(5倍の使用量)
Max 20x: $200/月(20倍の使用量)
※ Web版・Desktop版・Claude Codeで使用量を共有Gemini CLI:
無料枠: 0円(Googleアカウントのみ)
└→ 60リクエスト/分、1,000リクエスト/日
└→ デフォルト: Gemini 2.5 Flash
API利用: 従量課金(Google AI Studio経由)
└→ Gemini 3 Flash: 高コスパ(SWE-bench Verified 78%)Codex CLI:
無料枠: なし(APIキー or ChatGPT Plus必須)
Plus: $20/月(30〜150メッセージ/5時間)
Pro: $200/月(300〜1,500メッセージ/5時間)
API従量: gpt-5.4-mini: 入力 $1.25/Mトークン
→ 使いすぎると青天井になる点に注意Claude Codeの強み——他2ツールにできないこと
1. 高い自律性と粘り強いデバッグ
Claude Codeの最大の強みは**「テストを回す→エラーが出る→自分で修正する→またテストする」** というループの粘り強さです。
Claude Codeのデバッグループ:
1. エラーを検知
2. 原因を深く推論(Thinkingモード)
3. 修正案を実装
4. テストを再実行
5. 成功するまで繰り返す(ほとんど手動介入不要)実際のベンチマーク比較(あるコーディングタスク):
Claude Code: 1h17m で完了、コスト $4.80(全自動)
Gemini CLI: より長い時間、コスト $7.06(途中で手動介入が必要なケースも)Gemini CLI・Codex CLIの課題: どちらも修正を繰り返すと同じ間違いをループしたり、指示を無視して大幅な書き換えをしてしまうことがあります。
2. 洗練されたコードの品質
Claudeは「コーディングの職人気質」が評価されており、生成されるコードが非常に洗練されています。
Claude Code: 簡潔で読みやすいコード
冗長な記述を避ける傾向
命名規則やスタイルに一貫性がある
Gemini CLI: 実用的だが、時に冗長なボイラープレートを出力
Codex CLI: gpt-5.4使用時は高品質だが、モデル選択に依存する3. 深い思考(Thinkingモード)による自己修正
Claude Codeは、コードを書く前に**「なぜその設計にするのか」を深く自問自答**します。
Claudeの思考プロセス:
1. 要件の本質を理解
2. 複数の実装パターンを検討
3. トレードオフを評価
4. 最適解を選択してから実装
→ 結果: 一発で動くコードを書く確率が高い
SWE-bench Verified: Opus 4.6 で 80.8%(3ツール中最高)4. 音声入力モード(2026年3月〜)
2026年3月のアップデートで、Claude Codeに音声入力モードが追加されました。
/voice コマンドでプッシュトゥトーク方式の音声入力が可能
→ ターミナルでの長い指示も音声で素早く入力できる
→ ハンズフリーでのコーディングが可能にGemini CLI・Codex CLIでは現時点でネイティブ音声モードは未搭載です。
5. VS Code + JetBrains 両方に公式IDE統合
Claude Code: VS Code拡張機能(公式)+ JetBrains拡張機能(公式)
Gemini CLI: VS Code拡張機能あり
Codex CLI: ターミナル中心(公式IDE統合なし)IntelliJ・WebStorm等のJetBrains系IDEを使う開発者には特に優位です。
6. 定額制による費用の予測しやすさ
Claude Code Pro: $20/月で使用量の上限がある
→ 月の予算が読みやすく、予算オーバーが起きない
Codex CLI: APIキー従量課金で青天井になる可能性
Gemini CLI: 無料枠を超えると従量課金にGemini CLIの強み——他2ツールにできないこと
1. 完全無料から始められる
これがGemini CLIの最大のアドバンテージです。
Gemini CLI:
✅ Googleアカウントだけで今日から無料でスタート
✅ 1,000リクエスト/日で日常的な開発には十分
✅ SWE-bench Verified 78%(Sonnet 4.6の72.7%を上回る)という高精度が無料で使える
Claude Code: 別途サブスク($20/月〜)が必要
Codex CLI: APIキー or ChatGPT Plus($20/月〜)が必要2. 超大規模プロジェクトの「一括」把握
Gemini CLIのコンテキスト: 最大100万トークン
└→ 数万行のコードベースを丸ごと読み込める
└→ ファイル間の依存関係や矛盾を一括検出可能
Claude Code: 約20万トークン
└→ 大規模プロジェクトでは記憶を圧縮(Compaction)
└→ 圧縮により細部の記憶が抜け落ちることがある
Codex CLI: gpt-5.3-codexで100万トークン対応
└→ ただし gpt-5.4(デフォルト)は100万トークン未対応
└→ モデルを指定変更する必要があるGemini CLIはデフォルトのモデルから100万トークンが使える点が優位です。
実際の活用例:
# 数万行のコードベースを丸ごと分析
> このプロジェクト全体を俯瞰して、
> アーキテクチャ上の矛盾点と将来の拡張に向けた改善提案を教えて3. Google検索とのリアルタイム統合
# 昨日リリースされたライブラリの最新仕様を調べながらコードを書く
> /search React 19 useOptimistic の使い方
# 最新のAWSサービスを使った実装
> 最新のLambda関数URLの仕様を確認して、このコードに組み込んでClaude Code・Codex CLIはいずれも学習データに基づく推論がメインで、最新情報へのリアルタイムアクセスではGemini CLIが優位です(Codex CLIもWeb検索機能はあるが、Googleほど検索精度が高くない)。
4. Plan Mode(v0.30.0〜デフォルト有効)
Gemini CLI:
✅ 実行前に必ず「実装計画」を提示し、ユーザーが承認してから動く
✅ v0.30.0以降はデフォルト有効
✅ 外部エディタでプランを編集してから実行する機能もあり
Claude Code: 近い機能はあるが、Plan Modeとして独立していない
Codex CLI: /plan コマンドで呼び出せるが、デフォルトではない5. スキル(Skills)機能——ワークフローのチーム共有
Gemini CLI独自の拡張機能です。
スキルとは:
- 定型的なワークフローや複雑な手順を「スキル」として定義・共有できる
- タスクに適合するスキルをGemini CLIが自動検出して起動
- チーム全体での開発標準化が容易になる
管理コマンド:
/skills list → 利用可能なスキルを一覧表示
/skills enable → スキルを有効化
/skills disable → スキルを無効化6. マルチモーダル(動画・音声)の優位性
Gemini CLI(Geminiモデル):
✅ 動画ファイルを渡してバグを修正させることが可能
✅ 画像・音声・PDFなど多様なメディアに対応
Claude Code: スクリーンショット(画像)解析は得意
Codex CLI: 画像入力に対応。動画・音声はGeminiが先行7. コスト効率(大規模タスク)
Gemini 2.5 Flash(デフォルト):
- SWE-bench Verified スコア: 78%(3ツール中最高水準)
- 無料枠: 1,000リクエスト/日
- → 品質を保ちながら大量処理できるCodex CLIの強み——他2ツールにできないこと
1. ターミナル作業能力が業界最高水準
Terminal-Bench 2.0(ターミナル操作・シェルスクリプトの実行能力を評価するベンチマーク)での比較:
Terminal-Bench 2.0:
Codex CLI (gpt-5.3-codex): 77.3% ← 最高
Claude Code (Opus 4.6): 65.4%
Gemini CLI: 未公開シェル操作・コマンドライン作業が本職のツールです。
2. OSネイティブのサンドボックス実行
Codex CLIにしかない最も特徴的な機能です。
Codex CLI:
✅ OSネイティブのサンドボックスでコマンド実行を完全隔離
✅ approval-policy=never でも安全な完全自動化が可能
✅ ワークスペース内に操作範囲を限定できる
Claude Code: サンドボックスなし
Gemini CLI: サンドボックスなしこれにより、他2ツールが「安全のためにfull-autoは危険」なのに対し、Codex CLIはサンドボックスが有効な状態でfull-autoが実現できます。
3. 承認モードの細かい制御(4段階)
Codex CLI の承認モード:
on-request(デフォルト): ワークスペース外の操作のみ確認
untrusted: 変更・破壊的操作を全て確認(読み取りは自動)
never: 全ての承認をスキップ(サンドボックスは有効)
dangerously-bypass: 全制限を解除(隔離環境専用)
Claude Code・Gemini CLI: On/Off 程度の制御しかない4. CI/CDパイプラインへの最適設計
Codex CLI:
✅ never + sandbox の組み合わせで安全な完全自動化
✅ GitHub Actionsに直接組み込める
✅ 夜間バッチ・定期タスクの自動実行に最適
Claude Code・Gemini CLI:
△ CLIとして動作はするが、CI/CD前提の設計ではない5. Apache-2.0ライセンスで社内カスタマイズが自由
Codex CLI(Apache-2.0):
✅ ソースコードを完全に改変・再配布可能
✅ 社内セキュリティポリシーに合わせたカスタマイズが可能
✅ 社内MCPサーバーと組み合わせた専用エージェント構築
Gemini CLI(Apache-2.0): 同様にオープンソース
Claude Code: クローズドソース6. マルチエージェントv2による並列タスク実行
v0.117.0から本格化した機能です。
Codex CLI マルチエージェントv2:
✅ パスベースアドレスで複数のサブエージェントを管理
✅ 構造化メッセージングで各エージェントが協調
✅ フロントエンド・バックエンドを別エージェントが並列で担当
→ 大規模なリファクタリングや複数モジュールの同時実装に効果的7. 高速処理(Cerebras統合)
Codex CLI (Cerebras統合): 1,000トークン/秒超
Claude Code: 約200トークン/秒
→ 約5倍の処理速度大量のファイルを素早く処理する際に特に有効です。
設定ファイルの比較
3つのツールともに、プロジェクトのルールを記述したMarkdownファイルを自動読み込みします。
配置パスの比較
| 階層 | CLAUDE.md(Claude Code) | GEMINI.md(Gemini CLI) | AGENTS.md(Codex CLI) |
|---|---|---|---|
| グローバル | ~/.claude/CLAUDE.md | ~/.gemini/GEMINI.md | ~/.codex/AGENTS.md |
| プロジェクト | ./CLAUDE.md | ./GEMINI.md | ./AGENTS.md |
| サブフォルダ | ./src/CLAUDE.md | ./src/GEMINI.md | ./src/AGENTS.md |
書き方の違いと特徴
CLAUDE.md(Claude Code):
# プロジェクトルール
## コミュニケーション
- すべてのやり取りは日本語で行うこと
## コーディング規約
- コードの右側にコメントを書くこと
例: `const x = 1; // 値を初期化`
## プロジェクト固有のルール
- npm scripts 実行時は -- を使って引数を渡すことGEMINI.md(Gemini CLI):
# プロジェクト概要
このプロジェクトは Next.js + TypeScript で構築したブログシステムです。
# コーディングルール
- すべてのやり取りは日本語で行うこと
- コメントはコードの右側に記述すること
# 開発コマンド
- ビルド: npm run build
- テスト: npm testAGENTS.md(Codex CLI):
# プロジェクト概要
Next.js + TypeScript のブログシステム
# コーディング規約
- すべてのやり取りは日本語で行うこと
- TypeScript strict モードを厳守
# 開発コマンド
- ビルド: npm run build
- テスト: npm test
# セキュリティポリシー(full-autoモードでの暴走防止)
- .envファイルは絶対に読み取らないこと
- node_modules は絶対に編集しないこと
- 本番環境のDBに接続するコマンドは実行しないこと書き方のポイント:
- CLAUDE.md: 制約・スタイルガイドの記述が効果的(指示への忠実さが高いため)
- GEMINI.md: 開発コマンドの記述が効果的(CLIコマンドを自律実行するため)
- AGENTS.md: 禁止事項・セキュリティポリシーの明記が特に効果的(full-autoモードの安全性確保のため)
設定の確認コマンド
| 操作 | Claude Code | Gemini CLI | Codex CLI |
|---|---|---|---|
| 設定の確認 | 自動読み込み(表示なし) | /memory show | /status |
| 設定の再読み込み | 起動し直す | /memory refresh | 起動し直す |
UI・操作感の違い
Claude Code
- ステップを細かく逐次表示(「ファイルAを読み込みました」「ファイルBを編集しました」など、各アクションを個別に報告)
- ツリー形式でアクションを表示
- 変更内容の差分表示が明確
- 承認プロンプトのUXが洗練されている
Gemini CLI
- 複数のアクションをまとめてボックスで表示(「3つのファイルを確認して修正しました」のようにサマリー形式)
- Plan Modeで作業前に確認ステップを挟める(v0.30.0〜デフォルト有効)
- Verboseモードへの切り替えで、Claude Codeのような逐次ログ表示も可能
- 外部エディタでプランを開いて編集する機能も追加(v0.30.0〜)
Codex CLI
- シンプルなターミナルUI(3ツールの中で最もミニマル)
- 承認プロンプトは機能的だが、視覚的な洗練度は低め
/planコマンドでプランモードを呼び出せるが、デフォルトではない- マルチエージェントv2では複数スレッドを
agentコマンドで切り替えて管理
「何をやっているか全部見たい」派 → Claude Code
「結果だけ教えてくれればいい」派 → Gemini CLI
「CIに組み込んで完全自動化したい」派 → Codex CLI実際の使い分け戦略
ケース別おすすめ
| ケース | おすすめ | 理由 |
|---|---|---|
| まず無料で試したい | Gemini CLI | 0円から始められる |
| 大規模プロジェクト全体の分析 | Gemini CLI | デフォルトから100万トークン |
| 最新ライブラリを使った実装 | Gemini CLI | Google検索リアルタイム連携 |
| バグを確実に直したい | Claude Code | 自律デバッグループの粘り強さ |
| 複雑なロジックの実装 | Claude Code | Thinkingモードによる高精度 |
| 品質重視のリファクタリング | Claude Code | 洗練されたコード生成 |
| CI/CDパイプラインに組み込む | Codex CLI | サンドボックス + full-auto設計 |
| シェル・ターミナル作業の自動化 | Codex CLI | Terminal-Bench 2.0 最高水準 |
| チームでワークフローを標準化 | Gemini CLI | Skills共有機能 |
| 社内ツールにカスタム組み込み | Codex CLI | Apache-2.0、改変自由 |
| 費用を月額固定にしたい | Claude Code | 定額制で青天井にならない |
| 並列で大規模タスクを処理 | Codex CLI | マルチエージェントv2 |
| 音声入力で指示したい | Claude Code | /voice コマンド対応(2026/03〜) |
プロの3ツール使い分け
Gemini CLI を使う場面:
✅ ブログ記事100本を一度にスキャンしてSEO課題を見つける
✅ 新しいフレームワークで「まず動くもの」を速攻で作る
✅ コードベース全体の依存関係を把握する
✅ チーム共通のスキル(Skills)を定義してワークフローを標準化する
✅ Plan Modeで実行前に全工程を確認・承認してから安全に作業する
✅ 無料枠の範囲で日常のちょっとした作業を済ませる
Claude Code を使う場面:
✅ 複雑なロジックをバグなしで一発で実装したい
✅ Geminiが書いた「動くけど汚いコード」を清書する
✅ 特定のバグを粘り強くデバッグしたい
✅ 音声入力で手をふさがずにコーディング指示を出したい
✅ VS Code / JetBrains の両方を使った IDE統合で作業したい
Codex CLI を使う場面:
✅ GitHub ActionsなどのCI/CDに組み込んだ安全な自動化
✅ 夜間バッチで大量ファイルの処理を完全自動実行
✅ シェルスクリプト・インフラコードの高度な自動化
✅ Apache-2.0ライセンスで社内ツールに改造・組み込み
✅ マルチエージェントで複数モジュールを並列で開発最適な分担:
「全体像を把握させる」 → Gemini CLI(デフォルトで100万トークン)
「一か所のバグを徹底的に詰める」 → Claude Code(粘り強い自律デバッグ)
「自動化・CI/CDに組み込む」 → Codex CLI(サンドボックス + full-auto)機能比較まとめ表
| 機能・特性 | Gemini CLI | Claude Code | Codex CLI |
|---|---|---|---|
| コンテキストウィンドウ | ◎ 100万トークン(デフォルト) | △ 20万トークン | ◎ 100万トークン(gpt-5.3-codex時) |
| 無料枠 | ◎ あり | × なし | × なし |
| オープンソース | ◎ Apache-2.0 | × なし | ◎ Apache-2.0 |
| Google検索統合 | ◎ リアルタイム | △ 学習データのみ | △ Web検索あり(Google比で精度劣る) |
| マルチモーダル | ◎ 動画・音声対応 | △ 画像のみ | △ 画像のみ |
| 自律デバッグ | △ 介入が必要な場合も | ◎ 粘り強い | △ モデル依存 |
| コードの質 | △ 実用的・やや冗長 | ◎ 洗練されている | ◎ gpt-5.4使用時は高品質 |
| サンドボックス実行 | × なし | × なし | ◎ OSネイティブ実装 |
| 承認モードの粒度 | △ On/Off程度 | △ On/Off程度 | ◎ 4段階(on-request/untrusted/never/bypass) |
| Plan Mode | ◎ デフォルト有効(v0.30.0〜) | △ 近い機能はあり | △ /plan コマンドで呼び出し可 |
| スキル(Skills)機能 | ◎ チームで共有可能 | × なし | × なし |
| 音声入力モード | × なし | ◎ あり(/voice、2026/03〜) | × なし |
| MCP対応 | ◎ あり | ◎ あり | ◎ あり |
| CI/CDへの組み込み | △ 可能 | △ 可能 | ◎ 前提設計 |
| マルチエージェント | × なし | △ 限定的 | ◎ v2(パスベース並列処理) |
| IDE統合 | ◎ VS Code拡張 | ◎ VS Code + JetBrains | × なし(ターミナルのみ) |
| Terminal-Bench 2.0 | 未公開 | △ 65.4% | ◎ 77.3% |
| SWE-bench Verified | ◎ 78%(Gemini 2.5 Flash) | ◎ 72.7% / 80.8%(Opus) | ※独自ベンチ参照 |
| コスト予測性 | ◎ 無料〜定額 | ◎ 定額制 | △ 従量課金(青天井リスク) |
| 設定ファイル | GEMINI.md | CLAUDE.md | AGENTS.md + config.toml |
| 主な強み | 全体分析・大規模処理・無料 | 精密実装・デバッグ・コード品質 | 自動化・CI・ターミナル作業 |
まとめ
Claude Code・Gemini CLI・Codex CLIの3ツールは、三すくみの補完関係にあります。
3ツールの立ち位置
Claude Code → 「精密に・確実に・高品質で」
Gemini CLI → 「広く・大量に・無料で」
Codex CLI → 「自動化・CI・ターミナル最強で」あなたに合うのはどれか
Gemini CLIが向いている方:
- まず0円でAIエージェントを試してみたい
- 大規模なコードベース全体をAIに把握させたい
- Google検索と連携した最新情報を使いたい
- チームでワークフローを標準化したい(Skills機能)
Claude Codeが向いている方:
- コードの品質を最優先にしたい
- 複雑なバグを自律的に修正させたい
- 定額制で費用を予測しやすくしたい
- JetBrains系IDEで使いたい
- 音声入力でハンズフリー開発したい
Codex CLIが向いている方:
- CI/CDパイプラインにAIエージェントを安全に組み込みたい
- シェル・ターミナル作業を高度に自動化したい
- Apache-2.0ライセンスで社内ツールに改造・組み込みしたい
- マルチエージェントで大規模タスクを並列処理したい
最もコスパの良い使い方
STEP 1: Gemini CLIの無料枠から試す(0円)
↓ 物足りなくなったら
STEP 2: Claude CodeのProプランを追加($20/月)
↓ CI/CD自動化が必要になったら
STEP 3: Codex CLIをCI/CDに組み込む(従量課金・少額)この3段階のアプローチが、2026年現在でコスト面でも最も賢い選択です。
関連記事:
- Claude Code完全ガイド|ターミナルで動くAIコーディングアシスタントの全貌【2026年3月版】

- Gemini CLI完全ガイド|ターミナルで動くGoogleのAIエージェントの全貌【2026年3月最新】

- OpenAI Codex CLI完全ガイド|ターミナルで動くOpenAIのAIエージェントの全貌【2026年3月最新】

- 【まとめ記事】Claude Code完全攻略ロードマップ|全記事まとめ

タグ: #CodexCLI #ClaudeCode #GeminiCLI #AI比較 #OpenAI #Google #Anthropic #ターミナル #開発効率化
コメント