RQ-052 メタプロンプト: アーキテクチャ意思決定における多基準評価 (MCDA / AHP / Decision Matrix) のベストプラクティス調査

1. 背景

bizlp-gas-accounting プロジェクトでは Decision Pipeline (ADR-0019) と Triage 基準 (ADR-0020) を運用しているが、特に 3 モデル並列調査結果を Synthesis に統合する際の「評価軸の選定方法」 が確立していない。

具体的な顕在化事例:

RQ-051 段階 3 Synthesis (PR #814, close): Claude / Gemini / GPT の 3 モデル相違点を bizlp 採用方針に集約する際、評価軸（「MVP の即時実装可能性」「将来の拡張性」「AI Agent 解釈性」「既存 ADR 整合性」等）が業界フレームワーク未照合の独自合成だった
同様に RQ-050 Synthesis でも採用判定の評価軸が独自設定（採用判断の根拠は学術的に強固だが、評価軸セット自体は事後合成）

業界では MCDA (Multi-Criteria Decision Analysis) / AHP (Analytic Hierarchy Process) / Decision Matrix Analysis / WSM (Weighted Sum Model) / TOPSIS / PROMETHEE などの確立された多基準評価フレームワークが存在し、ソフトウェアアーキテクチャ領域でも Wardley Mapping / DACI / RACI / Choosing By Advantages (CBA) などが採用されている。

これらを未調査で独自軸を設定するのは RQ-038 / RQ-045 / RQ-050 / RQ-051 と同じアンチパターン (PR #811 / #814 で発覚)。

2. 調査の目的

多基準意思決定分析 (MCDA) の業界ベストプラクティスを特定する
アーキテクチャ意思決定 (ADR / Synthesis) に適用可能なフレームワークを抽出する
3 モデル並列調査結果の集約（複数 LLM の出力突合）に特化した評価軸選定パターンを導出する
1 人法人 + AI Agent スケールで過剰回避基準を確立する

3. 調査論点 (Research Questions)

#	調査論点	期待アウトプット
Q1	多基準意思決定分析 (MCDA) の主要フレームワーク網羅	一覧 + 一次資料 URL
Q2	各フレームワーク (AHP / TOPSIS / PROMETHEE / WSM / ELECTRE 等) の評価軸選定アプローチ	比較表
Q3	ソフトウェアアーキテクチャ意思決定での MCDA 適用事例 (Zimmermann / Kazman / SAAM / ATAM 等)	事例 + 引用
Q4	ADR / Synthesis における評価軸選定の業界事例 (Spotify / GitLab / ThoughtWorks Tech Radar 等)	事例マトリクス
Q5	軽量フレームワーク (DACI / RACI / CBA / Wardley Mapping / Cynefin) の適用領域比較	適用ガイドライン
Q6	複数 LLM の出力突合 (Multi-Model Synthesis) に特化した評価軸選定パターンの先行研究	学術引用 + パターン
Q7	評価軸の重み付け (Weight Assignment) の手法とアンチパターン	重み付け実例
Q8	1 人法人 + AI Agent スケールで省略可能な項目の判定	MVP / 省略リスト
Q9	bizlp の RQ-050 / RQ-051 Synthesis に遡及適用すべきフレームワーク	推奨案
Q10	Synthesis 評価軸の標準テンプレート (bizlp 用)	テンプレート Markdown

4. 調査対象 (最低限カバー)

古典的 MCDA フレームワーク

AHP (Analytic Hierarchy Process, Saaty 1980) — pairwise comparison + eigenvector
TOPSIS (Technique for Order Preference by Similarity to Ideal Solution)
PROMETHEE (Preference Ranking Organization Method for Enrichment Evaluations)
WSM (Weighted Sum Model) / WPM (Weighted Product Model)
ELECTRE (Elimination Et Choix Traduisant la REalité)
MAUT (Multi-Attribute Utility Theory)

ソフトウェアアーキテクチャ特化

SAAM (Software Architecture Analysis Method, Kazman 1994)
ATAM (Architecture Tradeoff Analysis Method, SEI Carnegie Mellon)
Zimmermann's Architectural Decision Modeling (ADMentor / SOAD)
Cost-Benefit Analysis Method (CBAM) for software
Architecture Decision Records (MADR) の評価項目

アジャイル / 軽量フレームワーク

DACI (Driver, Approver, Contributors, Informed) — Atlassian / Spotify
RACI (Responsible, Accountable, Consulted, Informed)
Choosing By Advantages (CBA) — Jim Suhr の意思決定法
Wardley Mapping — Simon Wardley の戦略マッピング
Cynefin Framework — Dave Snowden の意思決定文脈分類

LLM / AI 出力評価特化

LLM-as-a-Judge パターン (Anthropic / OpenAI / Google)
Multi-Agent Debate 評価軸 (LangGraph / AutoGen)
Ensemble Decision Making (Wang et al. ICLR 2024 等)

5. 期待するアウトプット形式

エグゼクティブ・サマリ (200 字以内): bizlp が採用すべき Synthesis 評価軸選定フレームワークの推奨
業界事例マトリクス: フレームワーク名 / 適用領域 / 評価軸選定アプローチ / 重み付け / 出典
適用可能性スコアリング (各フレームワーク 1〜5 点、bizlp Synthesis での適合度)
bizlp Synthesis 標準テンプレート案: 評価軸選定 → 重み付け → スコアリング → 採択判定の流れ
RQ-050 / RQ-051 への遡及適用案: 既存 Synthesis を新フレームワークで再評価する手順
未解決リスク / 追加調査が必要な領域

6. 制約・スコープ外

個別 MCDA ツール (Decision Lab / SuperDecisions 等) の機能比較は対象外
AI Agent のオーケストレーション実装 (LangGraph / AutoGen) の比較は ADR-0019 で別途
1 人法人スケールでの過剰設計を避ける (AHP の完全形は組織的に過剰)
学術的厳密性 > 実装速度、ただし実用性とバランス

7. 期待する調査深度

古典 MCDA (Saaty / Kazman) と新興 LLM-as-Judge の双方を一次資料で確認
ソフトウェアアーキテクチャ領域での適用論文を最低 3 件は引用
3 モデル並列での得意領域:
- Gemini Deep Research: 最新 LLM 評価フレームワーク・グローバル動向
- Claude Research: 学術的厳密性・bizlp ADR-0020 との整合性
- GPT Deep Research: 実装観点・テンプレート提案

8. 後続アクション (Post-Synthesis)

3 モデルの調査結果を RQ-052_..._synthesis.md にまとめ、

ADR-0050 (仮): Synthesis 評価軸選定フレームワークの確立

の Standard ADR 起案、または既存 ADR-0020 (Triage 基準) の補遺として位置付ける。さらに以下のメタ作業:

RQ-051 Synthesis を新フレームワークで再起案 (PR #814 改訂版)
RQ-050 Synthesis の遡及検証 (既に確定済みだが評価軸根拠を補強)

9. 推奨実行モデル

モデル	役割	期待 token 量
Gemini 2.5 Pro Deep Research	LLM-as-Judge / Multi-Agent 評価の最新事例	20,000+
Claude Opus 4.7 Research	古典 MCDA + bizlp ADR との整合性	15,000+
GPT-5 Deep Research	軽量フレームワーク (DACI / CBA / Wardley)	10,000+

10. 関連 ADR / RQ

ADR-0019: Decision Pipeline LangGraph 移行 — Synthesis 自動化の文脈
ADR-0020: Triage 基準の学術的根拠 — 評価軸選定の先例 (Light/Standard/Critical の閾値設定)
ADR-0023: ADR ドキュメント構造 — Decision Drivers セクションの位置付け
RQ-050: ADR Scope 4 層分類 — 同じ 3 モデル並列パターンの先例
RQ-051: Lint 規約ドキュメント — 評価軸独自設定問題が発覚 (PR #811 / #814 close)
PR #814: RQ-051 Synthesis (close 済) — 本 RQ-052 完了後に再起案