Scribble at 2026-06-28 06:24:12 Last modified: 2026-06-28 06:27:57

添付画像 — Fifty Years of Specification Completeness: What Aviation Certification Tells AI Governance About Epoch Limits, Proof Surfaces, and the Structural Gap

Gemini と ChatGPT では「カスタム指示」、Claude では「Claudeへの指示」という設定項目として既に広く知られていて活用されている「システム・プロンプト」という手法は、あらかじめ AI にレスポンスや推論の諸条件を与える。たとえば、テキストで何かを説明するときに箇条書きは使わないでくれとか、画像で何かを描くならキャプションは英語で表記しろとかいった指示のことだ。

システム開発では、AI エージェントを色々な意味で安全に運用するため、多くの組織が自然言語による指示文書やリポジトリ単位の定義ファイルを "AGENTS.md" として記述している。ソフトウェア・エンジニアリングの要求工学（requirements engineering）という分野の観点から見れば、AGENTS.md のようなファイルの内容は、開発しようとしているシステムの仕様書にも匹敵すると言っていい。従来のソフトウェア開発では、仕様書の完全性や検証可能性を厳密に評価する理論やツールが存在していたが、AI のシステム・プロンプトにおいては、そうした品質基準が欠落したまま運用されていて、実装後のシステムが起こすトラブルを通じて、初めて不備が発覚するという問題が生じている。ガバナンスが不十分な AI エージェントの運用は、モデル自体の能力不足というよりも、寧ろ AI エージェントを運用する人間の意図が適切に AI へ指示されていないために、組織の意図に反する出力を生成してしまっていると言える。

筆者らが現実の開発現場で使われている AGENTS.md のコーパスを調査した研究では、評価対象の 37 % が構造的完全性の閾値を下回っていることが判明した。これは、多くのシステム・プロンプトが業務のやり方（プロセス）つまり手順を指示する運用ガイドにとどまっており、何をもって成果物を完了・合格とするかを判定する仕様書になっていないことを示している。さらに、実態調査を進めると AGENTS.md が単に別のファイルへのリダイレクトとして使われてしまっているケースや、そのリダイレクトのリンク先が消失しているケースなど、成果物の分類やアーキテクチャ上の混乱も確認されており、AI エージェントがガバナンスを取り込んで構築できないリスクがあるという。

ただ、これは僕らのような IT アーキテクト級の人材から言えば、ごくあたりまえのことだと思う。なぜなら、プログラマやコーダの多くは現実には大学や専門学校では機能要件しか学んでいないし、IT ゼネコンの「生体部品」として３か月ていどの研修で Java のコードを書き始める昆虫みたいな連中や５次請けの派遣社員などは、機能要件すら満足には習得しないでコードを書いているからだ。したがって、システムの仕様を決めたり理解するためには必ず習得しておかなくてはいけない「非機能要件」、つまりパフォーマンス要件にはじまって、そのシステムがかかわる業務に関連する情報セキュリティ上の制約だとか法令だとか、あるいはそのシステムを導入する組織の社内ルールや管理会計上の方針など、コーディングのアルゴリズムしか理解していない人々には扱えない「ビジネスのロジック」やデュー・デリジェンスなどの概念を習得せずに仕様やシステム・プロンプトを書くなんてできるわけがないのだ。

ということなので、論文の著者はガバナンスにかかわる幾つかの提案を並べているのだけれど、実際の開発ベンダーやゼネコンでの対策は、もっと簡単だし単純であろう。つまり、AGENTS.md を運用するなら、それを現場のコーダやプログラマに書かせてはいけないということである。

冒頭に戻る