エージェントが書いたものを、誰がレビューするのか

CursorがSDKを公開した。
2026年4月30日、Cursorは開発者がTypeScriptでAIエージェントを自由にプログラムできるSDKをパブリックベータとして公開した。デスクトップ、CLI、Webアプリ——どの環境にもエージェントをデプロイできる。フロンティアモデルを選択し、Cursorのクラウド上で実行することもできる。
これを聞いて「いよいよエージェント量産時代だ」と思った人は多いだろう。
ただ、少し立ち止まってほしい。エージェントが「書けるようになる」ことと、エージェントが書いたものが「正しいかどうか」はまったく別の問題だ。
90%の精度、残り10%は誰が見るのか
NTT DATAが最近Zennに公開した 記事が興味深い。3種類のAIエージェント——PM・CTO・CSOの役割を担う3体——を実際のシステム近代化プロジェクトに投入した2週間の実験だ。
結果は数字として明快だった。ドキュメントのレビューサイクルにかかる時間が1時間から20分に短縮された。品質も上がった。
ただ、実験チームが最終的に直面したのは別の問題だった。
AIの出力速度が、人間の検証速度を上回り始めた。
「90%の精度」で出力されるドキュメントが積み上がっていく。残り10%の誤りを見つけるのは人間だ。でも人間の検証速度は、AIの生成速度についていけない。
これはNTT DATAに特有の問題ではない。エージェントを増やすほど、この現象は複利で加速する。
ボトルネックの移動
AI導入前の世界では、ボトルネックは「生成」にあった。設計書を書くのに時間がかかる。仕様を整理するのに時間がかかる。だからAIを使う——この論理は正しかった。
ところが今、状況が変わりつつある。
AIが書いたドキュメントを人間がレビューする時間の方が、生成にかかる時間より長くなっている。Cursor SDKで自律エージェントが量産されると、この傾向はさらに顕著になるはずだ。
[AI以前]
人間が書く(遅い)→ レビュー → 完成
[AI導入後]
AIが書く(速い)→ 人間がレビュー(ここが詰まる)→ 完成
[エージェント量産後]
複数エージェントが並列で書く(超速い)→ 人間がレビュー(もはや追いつけない)→ ???生成がボトルネックだった時代、AIは解答だった。検証がボトルネックになった時代、AIは新しい問いを突きつけている。
「それっぽさ」の罠
なぜ検証が難しいのか。AIの出力は流暢で、読みやすく、「それっぽい」からだ。
文章の品質は高い。論理的な構成になっている。でもその中に、要件が一つ抜けていても、人間はすぐには気づかない。「なんとなく正しそう」という感覚を、AIの文体は巧みに演出する。
実際のプロジェクトでこれが露呈するのは、実装フェーズに入ってからだ。
「仕様書にはこう書いてあったが、実際の要件はそうじゃなかった」という類の手戻りは、AIを使う前より増える可能性すらある。AIが高速に「それっぽい仕様書」を量産するからだ。
正直なところ、筆者がいくつかのプロジェクトで見てきたのも、まさにこのパターンだ。AIを導入したことで書類仕事は速くなった。でも後工程での修正コストは、想定より下がらなかっ た。
検証を速くするためのただ一つの方法
では、どうすればいいのか。
答えは意外とシンプルで、構造にある。
人間がAIの出力をレビューするとき、何と照らし合わせているのか——それが「元の仕様」だ。その仕様が曖昧だと、AIの出力が正しいかどうかを判断する基準がなくなる。「なんとなく合ってそう」か「なんとなくおかしい」で判断するしかなくなる。
逆に言えば、仕様が構造化されていると、AIの出力との差分が明確になる。「ここが抜けている」「この条件が考慮されていない」という指摘が、ずっと速くできる。
これは人間がレビューする場合にも言えるが、AIがAIをレビューする場合に特に効果が出る。
NTT DATAの実験でも、ドキュメントを構造化されたMarkdownに変換してエージェントに渡すことで、精度が上がったと報告されている。ルールが曖昧なまま処理させても、AIは処理できない。構造があるから、AIは判断できる。
エージェント時代の上流工程設計
Cursor SDKで自律エージェントを作れるようになる、というのは面白い変化だ。でも本当に問われているのは「エージェントに何を書かせるか」ではなく、「エージェントに 何を渡すか」だと思う。
コンテキストの質が、エージェントの出力の質を決める。そしてコンテキストの質を決めるのは、上流工程でどれだけ構造化された仕様を作れているかだ。
エージェントが量産されると、この上流の設計が開発の全体効率を左右するようになる。エージェントが「速く書く」ことよりも、エージェントが「正確に判断できる」仕様を作ることの方が、チームの生産性に直結する時代が来ている。
仕様書を「人間が読む文書」として設計するか、「AIも読める構造」として設計するか——この選択が、エージェント導入の費用対効果を大きく分ける。
AIが書いたものを、誰がレビューするのか。
その答えは「より良い仕様書を持っている側」だと思う。曖昧な仕様を持つチームは、AIの出力に翻弄される。構造化された仕様を持つチームは、AIの出力を素早く検証できる。
ボトルネックが「生成」から「検証」に移った今、上流工程の設計こそが開発の競争力になっている。
関連記事



