海外140万インプ超え──「シンプルが最強」の衝撃
海外のAIエンジニアコミュニティで140万インプレッションを超えるバズを記録した記事がある。タイトルは「How To Be A World-Class Agentic Engineer(世界レベルのAIエージェントエンジニアになる方法)」。
著者は実際にAIエージェントで本番環境のシグナル処理、インフラ、データパイプラインを構築してきた実践者だ。その結論は多くの人の直感に反するものだった──ツールやプラグインをどれだけ増やしても意味がない。CLAUDE.mdが26,000行あっても意味がない。シンプルにするほどエージェントは強くなる。
AIインフルエンサーのチャエン氏も「海外の強者を見ていると、皆結局はシンプル装備+具体的なプロンプトに落ち着いている」と紹介している。この記事から、実践で使える7つの原則を完全解説する。
原則① コンテキストは命──情報を絞れ
最も重要な原則がこれだ。エージェントに渡す情報は必要最小限に絞る。
ハングマンゲームを作らせたいのに、71セッション前のバグ情報を読ませてどうする?プラグインやメモリシステムを増やすと「コンテキスト汚染」が起きる。
多くの人が陥る罠は「情報を増やせばエージェントは賢くなる」という思い込みだ。実際は逆で、無関係な情報が増えるほどエージェントは混乱し、パフォーマンスが低下する。爆弾の作り方とケーキのレシピを同時に渡して「森の詩を書け」と言っているようなものだ。
原則② 実装指示は超具体的に──調査と実装を分離せよ
コンテキストを汚染させないための実践的テクニックが、調査フェーズと実装フェーズの分離だ。
| 指示の出し方 | 具体例 | 結果 |
|---|---|---|
| ❌ 曖昧な指示 | 「認証システムを作って」 | 調査→迷走→ハルシネーション |
| ✅ 具体的な指示 | 「JWT+bcrypt-12+7日リフレッシュトークンで実装して」 | 迷いなく高精度に実装 |
実装の詳細がわからない場合は、まず別のエージェントに調査させ、実装方針を決めてから新しいセッションで実装する。研究コンテキストと実装コンテキストを混ぜないことが鍵だ。
原則③ 「媚び性質」を逆利用せよ──3エージェント構造
AIエージェントはユーザーを喜ばせようとする「媚び性質(Sycophancy)」を持っている。「バグを見つけて」と聞けば、存在しないバグでも作り出して報告する。
この性質を理解した上で、中立的なプロンプトを使うのが正解だ。
- ❌「データベースのバグを見つけて」→ 存在しないバグを創作する
- ✅「データベースのロジックを追って、気づいたことを全部報告して」→ 中立的に事実を報告
上級者向けには、この媚び性質を逆利用した3エージェント構造が最強だと著者は主張する。
| エージェント | 役割 | インセンティブ設計 |
|---|---|---|
| 発見者 | バグを全力で探す | 影響度に応じて+1/+5/+10ポイント |
| 論破者 | バグを否定する | 否定成功でスコア獲得、失敗で-2倍ペナルティ |
| 審判 | 最終判定を下す | 「正解を持っている」と伝え慎重に判定させる |
発見者が「全ての可能性」を洗い出し、論破者がフィルタリングし、審判が最終判定する。3者の媚び性質を相互に衝突させることで、ほぼ完璧な精度が得られるという。
原則④ タスクの「終わり」を定義せよ
エージェントは始め方は知っているが、終わり方を知らない。これが「スタブだけ実装して完了」という問題の根本原因だ。
解決策は明確だ。
- テスト合格を終了条件にする──「このXつのテストが全て通るまで完了ではない」
- スクリーンショット検証──実装後にスクリーンショットを撮影し、デザインや挙動を検証させる
- {タスク名}_CONTRACT.mdに達成条件を明文化──テスト、スクリーンショット、その他の検証を事前に定義
原則⑤ CLAUDE.mdはシンプルな「目次」にせよ
著者が与える最も実践的なアドバイスがこれだ。CLAUDE.mdを「シナリオ別の目次」として設計する。
CLAUDE.md(目次として機能) ├── コードを書くなら → coding-rules.md を読め ├── テストが落ちたら → failing-rules.md を読め ├── APIを設計するなら → api-design-rules.md を読め └── デプロイするなら → deploy-skill.md を読め
重要なのは、CLAUDE.md自体はIF-ELSEの分岐指示だけを含むこと。実際のルールやスキルは別ファイルに分離する。こうすることで、コーディング時にデプロイのルールが読み込まれるような「コンテキスト汚染」を防げる。
ただし、ルールとスキルを追加し続けると、やがて矛盾が蓄積してパフォーマンスが低下する。定期的に整理し、矛盾を解消する「スパデー(整理日)」が必要だ。
原則⑥ 長時間セッションは非推奨──1タスク=1セッション
24時間連続稼働より、「1タスク=1セッション」が最強だと著者は断言する。
| アプローチ | メリット | デメリット |
|---|---|---|
| 24時間連続セッション | セットアップが一度で済む | コンテキスト汚染が蓄積 |
| ✅ 1契約=1セッション | コンテキストがクリーン | オーケストレーション層が必要 |
理想的なワークフローは、CONTRACT.mdごとに新セッションを立ち上げ、オーケストレーション層が「何かする必要がある」と判断したら新しい契約と新しいセッションを自動的に作成する構造だ。
原則⑦ 「本当に使えるもの」の判断基準
著者が示す最もシンプルな判断基準がこれだ。
OpenAIとAnthropicの両方が実装したら、それは本当に重要な機能。skills、memory、planning、subagents──全てこのパターンで公式機能になった。
逆に言えば、最新のハーネスやプラグインを追いかける必要はない。CLIを定期的にアップデートしてリリースノートを読むだけで十分だ。フロンティア企業の社員こそが最大のユーザーであり、本当に必要な機能は必ず公式プロダクトに取り込まれる。
まとめ──シンプルな原則が劇的な差を生む
| 原則 | 一言まとめ |
|---|---|
| ① コンテキストは命 | 必要最小限の情報だけを渡せ |
| ② 超具体的に指示 | 調査と実装は別エージェントに分けよ |
| ③ 媚び性質を逆利用 | 発見・論破・審判の3体構造が最強 |
| ④ 終わりを定義 | CONTRACT.mdで達成条件を明文化 |
| ⑤ CLAUDE.mdは目次 | シナリオ別の「どこを読むか」だけ書け |
| ⑥ 1タスク=1セッション | 24時間連続より新セッションが最強 |
| ⑦ 両社が実装したら本物 | CLIアプデとリリースノートだけで十分 |
ツールを増やすな。コンテキストを絞れ。具体的に指示しろ。タスクの終わりを定義しろ。そしてCLAUDE.mdはシンプルな目次にして少しずつ育てろ。この原則を知るだけで、あなたのAIエージェント活用は劇的に変わる。


コメント