AI開発

エージェントが書いたものを、誰がレビューするのか

アツメル株式会社|6分で読めます
エージェントが書いたものを誰がレビューするのか

CursorがSDKを公開した。

2026年4月30日、Cursorは開発者がTypeScriptでAIエージェントを自由にプログラムできるSDKをパブリックベータとして公開した。デスクトップ、CLI、Webアプリ——どの環境にもエージェントをデプロイできる。フロンティアモデルを選択し、Cursorのクラウド上で実行することもできる。

これを聞いて「いよいよエージェント量産時代だ」と思った人は多いだろう。

ただ、少し立ち止まってほしい。エージェントが「書けるようになる」ことと、エージェントが書いたものが「正しいかどうか」はまったく別の問題だ。

90%の精度、残り10%は誰が見るのか

NTT DATAが最近Zennに公開した記事が興味深い。3種類のAIエージェント——PM・CTO・CSOの役割を担う3体——を実際のシステム近代化プロジェクトに投入した2週間の実験だ。

結果は数字として明快だった。ドキュメントのレビューサイクルにかかる時間が1時間から20分に短縮された。品質も上がった。

ただ、実験チームが最終的に直面したのは別の問題だった。

AIの出力速度が、人間の検証速度を上回り始めた。

「90%の精度」で出力されるドキュメントが積み上がっていく。残り10%の誤りを見つけるのは人間だ。でも人間の検証速度は、AIの生成速度についていけない。

これはNTT DATAに特有の問題ではない。エージェントを増やすほど、この現象は複利で加速する。

ボトルネックの移動

AI導入前の世界では、ボトルネックは「生成」にあった。設計書を書くのに時間がかかる。仕様を整理するのに時間がかかる。だからAIを使う——この論理は正しかった。

ところが今、状況が変わりつつある。

AIが書いたドキュメントを人間がレビューする時間の方が、生成にかかる時間より長くなっている。Cursor SDKで自律エージェントが量産されると、この傾向はさらに顕著になるはずだ。

[AI以前]
人間が書く(遅い)→ レビュー → 完成

[AI導入後]
AIが書く(速い)→ 人間がレビュー(ここが詰まる)→ 完成

[エージェント量産後]
複数エージェントが並列で書く(超速い)→ 人間がレビュー(もはや追いつけない)→ ???

生成がボトルネックだった時代、AIは解答だった。検証がボトルネックになった時代、AIは新しい問いを突きつけている。

「それっぽさ」の罠

なぜ検証が難しいのか。AIの出力は流暢で、読みやすく、「それっぽい」からだ。

文章の品質は高い。論理的な構成になっている。でもその中に、要件が一つ抜けていても、人間はすぐには気づかない。「なんとなく正しそう」という感覚を、AIの文体は巧みに演出する。

実際のプロジェクトでこれが露呈するのは、実装フェーズに入ってからだ。

「仕様書にはこう書いてあったが、実際の要件はそうじゃなかった」という類の手戻りは、AIを使う前より増える可能性すらある。AIが高速に「それっぽい仕様書」を量産するからだ。

正直なところ、筆者がいくつかのプロジェクトで見てきたのも、まさにこのパターンだ。AIを導入したことで書類仕事は速くなった。でも後工程での修正コストは、想定より下がらなかった。

検証を速くするためのただ一つの方法

では、どうすればいいのか。

答えは意外とシンプルで、構造にある。

人間がAIの出力をレビューするとき、何と照らし合わせているのか——それが「元の仕様」だ。その仕様が曖昧だと、AIの出力が正しいかどうかを判断する基準がなくなる。「なんとなく合ってそう」か「なんとなくおかしい」で判断するしかなくなる。

逆に言えば、仕様が構造化されていると、AIの出力との差分が明確になる。「ここが抜けている」「この条件が考慮されていない」という指摘が、ずっと速くできる。

これは人間がレビューする場合にも言えるが、AIがAIをレビューする場合に特に効果が出る。

NTT DATAの実験でも、ドキュメントを構造化されたMarkdownに変換してエージェントに渡すことで、精度が上がったと報告されている。ルールが曖昧なまま処理させても、AIは処理できない。構造があるから、AIは判断できる。

エージェント時代の上流工程設計

Cursor SDKで自律エージェントを作れるようになる、というのは面白い変化だ。でも本当に問われているのは「エージェントに何を書かせるか」ではなく、「エージェントに何を渡すか」だと思う。

コンテキストの質が、エージェントの出力の質を決める。そしてコンテキストの質を決めるのは、上流工程でどれだけ構造化された仕様を作れているかだ。

エージェントが量産されると、この上流の設計が開発の全体効率を左右するようになる。エージェントが「速く書く」ことよりも、エージェントが「正確に判断できる」仕様を作ることの方が、チームの生産性に直結する時代が来ている。

仕様書を「人間が読む文書」として設計するか、「AIも読める構造」として設計するか——この選択が、エージェント導入の費用対効果を大きく分ける。


AIが書いたものを、誰がレビューするのか。

その答えは「より良い仕様書を持っている側」だと思う。曖昧な仕様を持つチームは、AIの出力に翻弄される。構造化された仕様を持つチームは、AIの出力を素早く検証できる。

ボトルネックが「生成」から「検証」に移った今、上流工程の設計こそが開発の競争力になっている。


関連記事

#AIエージェント#上流工程#要件定義#開発プロセス#レビュー

AI仕様書エディタKakusillに興味がありますか?

無料トライアルで、AIと開発する体験をすぐにお試しいただけます。

お問い合わせ