最終更新: 2026/06/22 19:15
RQ-052 メタプロンプト: アーキテクチャ意思決定における多基準評価 (MCDA / AHP / Decision Matrix) のベストプラクティス調査
1. 背景
bizlp-gas-accounting プロジェクトでは Decision Pipeline (ADR-0019) と Triage 基準 (ADR-0020) を運用しているが、特に 3 モデル並列調査結果を Synthesis に統合する際の「評価軸の選定方法」 が確立していない。
具体的な顕在化事例:
- RQ-051 段階 3 Synthesis (PR #814, close): Claude / Gemini / GPT の 3 モデル相違点を bizlp 採用方針に集約する際、評価軸(「MVP の即時実装可能性」「将来の拡張性」「AI Agent 解釈性」「既存 ADR 整合性」等)が業界フレームワーク未照合の独自合成だった
- 同様に RQ-050 Synthesis でも採用判定の評価軸が独自設定(採用判断の根拠は学術的に強固だが、評価軸セット自体は事後合成)
業界では MCDA (Multi-Criteria Decision Analysis) / AHP (Analytic Hierarchy Process) / Decision Matrix Analysis / WSM (Weighted Sum Model) / TOPSIS / PROMETHEE などの確立された多基準評価フレームワークが存在し、ソフトウェアアーキテクチャ領域でも Wardley Mapping / DACI / RACI / Choosing By Advantages (CBA) などが採用されている。
これらを未調査で独自軸を設定するのは RQ-038 / RQ-045 / RQ-050 / RQ-051 と同じアンチパターン (PR #811 / #814 で発覚)。
2. 調査の目的
- 多基準意思決定分析 (MCDA) の業界ベストプラクティスを特定する
- アーキテクチャ意思決定 (ADR / Synthesis) に適用可能なフレームワークを抽出する
- 3 モデル並列調査結果の集約(複数 LLM の出力突合)に特化した評価軸選定パターンを導出する
- 1 人法人 + AI Agent スケールで過剰回避基準を確立する
3. 調査論点 (Research Questions)
| # | 調査論点 | 期待アウトプット |
|---|---|---|
| Q1 | 多基準意思決定分析 (MCDA) の主要フレームワーク網羅 | 一覧 + 一次資料 URL |
| Q2 | 各フレームワーク (AHP / TOPSIS / PROMETHEE / WSM / ELECTRE 等) の評価軸選定アプローチ | 比較表 |
| Q3 | ソフトウェアアーキテクチャ意思決定での MCDA 適用事例 (Zimmermann / Kazman / SAAM / ATAM 等) | 事例 + 引用 |
| Q4 | ADR / Synthesis における評価軸選定の業界事例 (Spotify / GitLab / ThoughtWorks Tech Radar 等) | 事例マトリクス |
| Q5 | 軽量フレームワーク (DACI / RACI / CBA / Wardley Mapping / Cynefin) の適用領域比較 | 適用ガイドライン |
| Q6 | 複数 LLM の出力突合 (Multi-Model Synthesis) に特化した評価軸選定パターンの先行研究 | 学術引用 + パターン |
| Q7 | 評価軸の重み付け (Weight Assignment) の手法とアンチパターン | 重み付け実例 |
| Q8 | 1 人法人 + AI Agent スケールで省略可能な項目の判定 | MVP / 省略リスト |
| Q9 | bizlp の RQ-050 / RQ-051 Synthesis に遡及適用すべきフレームワーク | 推奨案 |
| Q10 | Synthesis 評価軸の標準テンプレート (bizlp 用) | テンプレート Markdown |
4. 調査対象 (最低限カバー)
古典的 MCDA フレームワーク
- AHP (Analytic Hierarchy Process, Saaty 1980) — pairwise comparison + eigenvector
- TOPSIS (Technique for Order Preference by Similarity to Ideal Solution)
- PROMETHEE (Preference Ranking Organization Method for Enrichment Evaluations)
- WSM (Weighted Sum Model) / WPM (Weighted Product Model)
- ELECTRE (Elimination Et Choix Traduisant la REalité)
- MAUT (Multi-Attribute Utility Theory)
ソフトウェアアーキテクチャ特化
- SAAM (Software Architecture Analysis Method, Kazman 1994)
- ATAM (Architecture Tradeoff Analysis Method, SEI Carnegie Mellon)
- Zimmermann's Architectural Decision Modeling (ADMentor / SOAD)
- Cost-Benefit Analysis Method (CBAM) for software
- Architecture Decision Records (MADR) の評価項目
アジャイル / 軽量フレームワーク
- DACI (Driver, Approver, Contributors, Informed) — Atlassian / Spotify
- RACI (Responsible, Accountable, Consulted, Informed)
- Choosing By Advantages (CBA) — Jim Suhr の意思決定法
- Wardley Mapping — Simon Wardley の戦略マッピング
- Cynefin Framework — Dave Snowden の意思決定文脈分類
LLM / AI 出力評価特化
- LLM-as-a-Judge パターン (Anthropic / OpenAI / Google)
- Multi-Agent Debate 評価軸 (LangGraph / AutoGen)
- Ensemble Decision Making (Wang et al. ICLR 2024 等)
5. 期待するアウトプット形式
- エグゼクティブ・サマリ (200 字以内): bizlp が採用すべき Synthesis 評価軸選定フレームワークの推奨
- 業界事例マトリクス: フレームワーク名 / 適用領域 / 評価軸選定アプローチ / 重み付け / 出典
- 適用可能性スコアリング (各フレームワーク 1〜5 点、bizlp Synthesis での適合度)
- bizlp Synthesis 標準テンプレート案: 評価軸選定 → 重み付け → スコアリング → 採択判定の流れ
- RQ-050 / RQ-051 への遡及適用案: 既存 Synthesis を新フレームワークで再評価する手順
- 未解決リスク / 追加調査が必要な領域
6. 制約・スコープ外
- 個別 MCDA ツール (Decision Lab / SuperDecisions 等) の機能比較は対象外
- AI Agent のオーケストレーション実装 (LangGraph / AutoGen) の比較は ADR-0019 で別途
- 1 人法人スケールでの過剰設計を避ける (AHP の完全形は組織的に過剰)
- 学術的厳密性 > 実装速度、ただし実用性とバランス
7. 期待する調査深度
- 古典 MCDA (Saaty / Kazman) と新興 LLM-as-Judge の双方を一次資料で確認
- ソフトウェアアーキテクチャ領域での適用論文を最低 3 件は引用
- 3 モデル並列での得意領域:
- Gemini Deep Research: 最新 LLM 評価フレームワーク・グローバル動向
- Claude Research: 学術的厳密性・bizlp ADR-0020 との整合性
- GPT Deep Research: 実装観点・テンプレート提案
8. 後続アクション (Post-Synthesis)
3 モデルの調査結果を RQ-052_..._synthesis.md にまとめ、
ADR-0050 (仮): Synthesis 評価軸選定フレームワークの確立
の Standard ADR 起案、または既存 ADR-0020 (Triage 基準) の補遺として位置付ける。さらに以下のメタ作業:
- RQ-051 Synthesis を新フレームワークで再起案 (PR #814 改訂版)
- RQ-050 Synthesis の遡及検証 (既に確定済みだが評価軸根拠を補強)
9. 推奨実行モデル
| モデル | 役割 | 期待 token 量 |
|---|---|---|
| Gemini 2.5 Pro Deep Research | LLM-as-Judge / Multi-Agent 評価の最新事例 | 20,000+ |
| Claude Opus 4.7 Research | 古典 MCDA + bizlp ADR との整合性 | 15,000+ |
| GPT-5 Deep Research | 軽量フレームワーク (DACI / CBA / Wardley) | 10,000+ |
10. 関連 ADR / RQ
- ADR-0019: Decision Pipeline LangGraph 移行 — Synthesis 自動化の文脈
- ADR-0020: Triage 基準の学術的根拠 — 評価軸選定の先例 (Light/Standard/Critical の閾値設定)
- ADR-0023: ADR ドキュメント構造 — Decision Drivers セクションの位置付け
- RQ-050: ADR Scope 4 層分類 — 同じ 3 モデル並列パターンの先例
- RQ-051: Lint 規約ドキュメント — 評価軸独自設定問題が発覚 (PR #811 / #814 close)
- PR #814: RQ-051 Synthesis (close 済) — 本 RQ-052 完了後に再起案