Claude Code vs Cursor vs OpenHands
AIコーディングエージェント三つ巴。ターミナルネイティブのClaude Code、エディタ統合型のCursor、オープンソースのOpenHands。それぞれの設計思想から実際のコーディングタスクのベンチマークまで、開発者目線で徹底比較する。
目次
1. AIコーディングエージェントの時代
2024年はAIコーディングアシスタントの年だった。GitHub Copilotが普及し、「AIに補完させながらコードを書く」が当たり前になった。そして2025年後半から2026年にかけて、次のフェーズ — AIコーディングエージェントの時代に突入した。
アシスタントとエージェントの違いは明確だ。アシスタントは人間が書いているコードの続きを予測して補完する。エージェントは、タスクを理解し、必要なファイルを自分で探し、コードを書き、テストし、デバッグまで自律的に行う。人間は「何を作りたいか」を伝えるだけでいい。
2026年3月現在、この領域で特に注目されているのが3つのツールだ。Anthropicが提供するターミナルベースのClaude Code、AI特化エディタのCursor、そしてオープンソースのOpenHands(旧OpenDevin)。それぞれまったく異なるアプローチでAIコーディングエージェントを実現している。
この記事は、3つのツールを実際の開発作業で3ヶ月以上使い込んだ上での比較レポートだ。SWE-benchのスコアだけでは見えない、「実務で使ったときにどう感じるか」を中心に書く。
2. 3ツール概要比較
| 項目 | Claude Code | Cursor | OpenHands |
|---|---|---|---|
| 開発元 | Anthropic | Anysphere | All Hands AI (OSS) |
| タイプ | CLI (ターミナル) | GUI (エディタ) | Web UI + CLI |
| 使用LLM | Claude Opus/Sonnet | GPT-4o, Claude, 他 | 任意 (Claude, GPT, ローカル) |
| オープンソース | 部分的 (CLI) | No | Yes (MIT) |
| ファイルシステムアクセス | 直接アクセス | エディタ内 | Dockerコンテナ内 |
| コマンド実行 | 全コマンド | ターミナル統合 | 全コマンド (sandbox) |
| ブラウザ操作 | 可能 (MCP経由) | 不可 | 可能 (内蔵) |
| SWE-bench Verified | 72.0% | N/A (非公開) | 53.0% |
3. アーキテクチャの違い
Claude Code — ターミナルに住むエージェント
Claude Codeのアーキテクチャは潔い。ターミナルで動くCLIアプリケーションで、ファイルシステムの読み書き、シェルコマンドの実行、Git操作など、開発者がターミナルで日常的に行うすべての操作をAIが代行する。
重要なのは、Claude Codeはコードエディタではないということだ。VS CodeやVimなどの好みのエディタと並行して使う。「エディタで書く、Claude Codeで自動化する」という分業だ。エディタに依存しないので、どんな開発環境でも使える。
内部的には、AnthropicのClaude Sonnet/Opusが動作し、拡張思考(Extended Thinking)モードで複雑な問題を段階的に推論する。コンテキストウィンドウも200Kトークンと広く、大規模なコードベースでも一度に多くのファイルを理解できる。
Cursor — エディタの中のAI
CursorはVS Codeをフォークして作られたAI特化エディタだ。UIはVS Codeそのものだが、AI機能がエディタの隅々まで統合されている。タブ補完、Cmd+Kによるインライン編集、チャットサイドバー、そしてAgent Mode(Composer Agent)が主要な機能だ。
Agent Modeが2025年後半に大幅にアップデートされ、ファイルの作成・編集、ターミナルコマンドの実行、エラーの自動修正ができるようになった。これにより、Cursorは「コーディングアシスタント」から「コーディングエージェント」に進化した。
Cursorの最大の強みは、コードベース全体をインデキシングして理解する能力だ。@codebaseでプロジェクト全体を参照したクエリが可能で、「この関数を使っている箇所を全て教えて」のような横断的な質問に強い。
OpenHands — 自由なオープンソースエージェント
OpenHands(旧OpenDevin)は、Dockerコンテナ内で動作する完全自律型コーディングエージェントだ。Web UI経由でタスクを指示すると、サンドボックス環境でファイル操作、コマンド実行、ブラウザ操作を自動で行う。
最大の特徴はオープンソース(MIT License)であること。バックエンドのLLMを自由に選択でき、Claude、GPT-4o、Gemini、さらにはOllamaを通じたローカルLLMまで使える。また、AgentHubを通じて特定タスク向けのカスタムエージェントを構築・共有できる。
もう一つの大きな特徴がブラウザ操作能力だ。Webアプリのテスト、ドキュメントの調査、APIリファレンスの参照などを、ブラウザを自動操作して行える。Claude CodeやCursorにはないユニークな能力だ。
4. 実際のワークフロー
Claude Code: RESTful APIの実装
# ターミナルでClaude Codeを起動
$ claude
# 自然言語でタスクを指示
> このFastAPIプロジェクトにユーザー認証機能を追加して。
JWT認証で、ログイン/登録/パスワードリセットのエンドポイントを作成。
テストも書いて。
# Claude Codeの動作:
# 1. プロジェクト構造を自動で調査 (ls, cat等)
# 2. 既存のコードを読んでアーキテクチャを理解
# 3. 必要なファイルを作成/編集
# - app/auth/router.py (認証ルーター)
# - app/auth/schemas.py (Pydanticスキーマ)
# - app/auth/service.py (認証ロジック)
# - app/auth/dependencies.py (JWT検証依存関数)
# - tests/test_auth.py (テスト)
# 4. requirements.txtにpasslibとpython-jose追加
# 5. pip installを実行
# 6. テストを実行して確認
# 途中で確認を求められる
Claude: requirements.txtに以下を追加してよいですか?
- passlib[bcrypt]==1.7.4
- python-jose[cryptography]==3.3.0
[y/n] > y
# 全体で約5分で完了
Cursor Agent Mode: 同じタスク
# Cmd+I でComposerを開き、Agent Modeを選択
# プロンプト入力:
"このFastAPIプロジェクトにJWT認証機能を追加してください。
ログイン、登録、パスワードリセットのエンドポイント。テスト付き。"
# Cursor Agent Modeの動作:
# 1. @codebase で既存コード構造を分析
# 2. エディタ内でファイルの作成/編集がリアルタイムに表示される
# 3. 各ファイルの変更をAccept/Rejectで確認
# 4. ターミナルでpip installとpytest実行を提案
# 5. テスト失敗があればエラーを読み取って自動修正
# 変更はエディタ内のdiff表示で確認可能
# 各変更ごとにAccept/Rejectの粒度が細かい
OpenHands: 同じタスク
# ブラウザでOpenHands UIにアクセス (localhost:3000)
# タスク入力:
"このFastAPIプロジェクトにJWT認証を追加して。
ログイン/登録/パスワードリセットのエンドポイント。テスト付き。"
# OpenHandsの動作:
# 1. Dockerコンテナ内でプロジェクトを確認
# 2. 必要に応じてWeb検索でFastAPIの認証ベストプラクティスを調査
# 3. コードエディタ(サンドボックス内)でファイルを作成/編集
# 4. シェルでpip install、テスト実行
# 5. テスト結果を確認して修正
# 操作ログが全てWeb UIに表示される
# ファイルの変更はコンテナ内で行われ、最後にダウンロード可能
ワークフローの違いの本質
Claude Codeは「ターミナルの中で対話しながら進める」、Cursorは「エディタの中で変更を確認しながら進める」、OpenHandsは「指示して放置し、結果を受け取る」。これは好みの問題ではなく、開発スタイルとの相性の問題だ。コマンドラインが好きな人はClaude Code、ビジュアルフィードバックが欲しい人はCursor、丸投げしたい人はOpenHands。
5. コーディングタスクベンチマーク
SWE-benchのようなフォーマルなベンチマークは重要だが、実務のタスクは性質が異なる。そこで、実際の開発作業に近い5つのタスクを設計し、各ツールで実行してみた。
| タスク | Claude Code | Cursor | OpenHands |
|---|---|---|---|
| バグ修正(既存コード) | A (3分) | A- (5分) | B+ (8分) |
| 新機能実装(API追加) | A (7分) | A (8分) | B+ (12分) |
| リファクタリング(大規模) | A+ (15分) | A- (20分) | B (25分) |
| テスト作成 | A (5分) | A (6分) | A- (7分) |
| フロントエンド実装(React) | A- (10分) | A+ (8分) | B+ (15分) |
結果の考察
Claude Codeはバグ修正とリファクタリングで圧倒的に強い。特にリファクタリングでは、grepやfindを駆使してコードベース全体から関連箇所を洗い出す能力が光る。ファイルシステムを直接操作できるCLIの強みがここに出ている。
Cursorはフロントエンド実装で最高点。リアルタイムプレビューとの組み合わせで、UIの微調整を対話的に行える強みがある。TypeScriptの型推論との統合も優秀で、型エラーを即座に検知して修正する。
OpenHandsは全体的にやや遅いが、一度タスクを投げたら放置できるのは強み。特に「テスト→失敗→修正→再テスト」のループを自動で回してくれるのは、人間の介入を最小限にしたい場面で有効。ただし、修正の方向性がズレることがあり、その場合はリカバリに時間がかかる。
ベンチマークの限界について
この結果は特定のプロジェクト(FastAPI + React, 約2万行)でのものであり、言語やフレームワークが異なれば結果も変わる。また、同じツールでも使い手のスキルレベルやプロンプトの書き方で大きく結果が変わる。あくまで参考値として捉えてほしい。
6. 料金比較
| プラン | Claude Code | Cursor | OpenHands |
|---|---|---|---|
| 無料プラン | なし | 2週間トライアル | OSS(無料) |
| 個人プラン | Max Plan $100/月 | Pro $20/月 | LLM API費のみ |
| ヘビーユーザー | Max Plan $200/月 | Business $40/月 | LLM API費のみ |
| 月間利用コスト目安 | $100-200 | $20-40 | $30-80 (API次第) |
料金面ではCursorが最もリーズナブル。月$20のProプランで十分な量のAI機能が使える。ただし、Agent ModeはPremiumリクエストを消費するため、ヘビーに使うとBusinessプラン($40)に上げる必要がある。
Claude CodeはAnthropicのMax Planに含まれるため月$100-200と高額だが、「使い放題」に近い形で使えるのが魅力。API経由で使う場合は従量課金で、1日の開発セッションで$5-15程度のコストが発生する。ヘビーユーザーはMax Planのほうが割安になる分岐点が早い。
OpenHandsは本体無料だが、バックエンドのLLM APIコストがかかる。Claude APIで使う場合、1セッション(1タスク)あたり$0.50-3.00程度。GPT-4oなら$0.30-2.00程度。ローカルLLMを使えば完全無料だが、性能は大幅に落ちる。月間の総コストはLLM APIの使い方次第で大きく変わる。
7. それぞれの強み・弱み
Claude Code
強み
- + コード理解力が最高レベル
- + 大規模リファクタリングに強い
- + gitとの統合が優秀
- + 拡張思考で複雑な問題を段階的に解決
- + エディタに依存しない
- + MCP対応でツール拡張可能
弱み
- - 月額$100-200と高い
- - ビジュアルフィードバックがない
- - CUIに慣れていないと使いにくい
- - Claudeモデルのみ
Cursor
強み
- + UI/UXが洗練されている
- + Tab補完が非常に賢い
- + VS Code互換で移行が楽
- + @codebase でプロジェクト横断検索
- + 月$20からと安い
- + 複数LLMを切り替え可能
弱み
- - Agent Modeの制御粒度がやや粗い
- - クローズドソース
- - ブラウザ操作不可
- - 大規模変更時にdiffが複雑化
OpenHands
強み
- + オープンソース(MIT)
- + LLMを自由に選択可能
- + ブラウザ操作が可能
- + Dockerでのサンドボックス実行
- + カスタムエージェント構築可能
- + セルフホスティング可能
弱み
- - セットアップがやや煩雑
- - 処理速度が遅め
- - UIの完成度がやや低い
- - ローカルLLMだと精度が大幅に低下
8. ユースケース別おすすめ
バックエンド開発メイン
API設計、DB操作、ビジネスロジック
フロントエンド開発メイン
React/Vue、UI実装、スタイリング
既存コードベースの保守・改修
バグ修正、リファクタリング、依存関係更新
プロトタイピング・PoC
素早くMVPを作りたい
OSS貢献・Issue対応の自動化
GitHubのIssueを自動的にPRに変換
予算最優先
コストを最小限に抑えたい
プライバシー・セルフホスティング
コードを外部に送信したくない
9. 結論
3ヶ月使い込んだ率直な結論を書く。
総合力ではClaude Codeが頭一つ抜けている。 コードの理解力、修正の正確性、大規模変更への対応力、いずれもトップレベルだ。SWE-bench Verifiedで72%という数字は伊達ではない。ただし月$100-200のコストは個人開発者にはハードルが高い。
日常的な開発のパートナーとしてはCursorが最も使いやすい。 エディタに統合されているため、「AIと一緒にコードを書いている」感覚が自然だ。Tab補完の精度は生産性を明確に向上させるし、Agent Modeでそこそこの規模のタスクも丸投げできる。月$20というコスパも魅力的だ。
OpenHandsは「自由」を重視する人のための選択肢だ。 LLMを自由に選べる、コードを完全にローカルに保持できる、カスタマイズの余地が大きい。ただし、Claude CodeやCursorと比べると、同じタスクでの完成度にまだ差がある。開発の進行は速いので、今後に期待だ。
最良の選択肢は、Cursor + Claude Codeの併用だ。日常的なコーディングはCursorで行い、大規模なリファクタリングや複雑なバグ修正はClaude Codeに任せる。実際にこの運用で3ヶ月回してみたが、生産性は体感で2-3倍になった。コストは月$120-220程度だが、開発者の時間単価を考えれば十分にペイする。
もちろん、「一つだけ選ぶなら」という質問に対しては、予算に余裕があるならClaude Code、予算を抑えたいならCursor、と答える。どちらも素晴らしいツールだ。
10. FAQ
Q. Claude Codeを使うにはAPIキーが必要ですか?
Max Plan(月額$100/$200)に加入していれば、Claude Codeが含まれています。API経由の場合はトークン消費に応じた従量課金です。多くの場合Max Planのほうがコスパが良いです。
Q. CursorとVS Codeの違いは何ですか?
CursorはVS Codeをフォークして作られたAI特化エディタです。UIや操作感はVS Codeとほぼ同じですが、AI機能(Tab補完、Cmd+K編集、Agent Mode)が深く統合されています。VS Codeの拡張機能もほぼ全て利用可能です。
Q. OpenHandsは完全に無料で使えますか?
OpenHands自体はMITライセンスで無料です。ただしバックエンドのLLMにAPIキーが必要です。ローカルLLM(Ollama等)を使えば完全無料で運用可能ですが、性能は大幅に低下します。
Q. 大規模なコードベースでも使えますか?
3つとも大規模コードベースに対応しています。Cursorはインデキシング、Claude Codeはファイルシステム直接操作、OpenHandsはDocker内でそれぞれ対応。10万行以上のプロジェクトでも問題なく動作します。