1. 背景

bizlp-gas-accounting プロジェクトでは Decision Pipeline (ADR-0019) と Triage 基準 (ADR-0020) を運用しているが、特に 3 モデル並列調査結果を Synthesis に統合する際の「評価軸の選定方法」 が確立していない。

具体的な顕在化事例:

  • RQ-051 段階 3 Synthesis (PR #814, close): Claude / Gemini / GPT の 3 モデル相違点を bizlp 採用方針に集約する際、評価軸(「MVP の即時実装可能性」「将来の拡張性」「AI Agent 解釈性」「既存 ADR 整合性」等)が業界フレームワーク未照合の独自合成だった
  • 同様に RQ-050 Synthesis でも採用判定の評価軸が独自設定(採用判断の根拠は学術的に強固だが、評価軸セット自体は事後合成)

業界では MCDA (Multi-Criteria Decision Analysis) / AHP (Analytic Hierarchy Process) / Decision Matrix Analysis / WSM (Weighted Sum Model) / TOPSIS / PROMETHEE などの確立された多基準評価フレームワークが存在し、ソフトウェアアーキテクチャ領域でも Wardley Mapping / DACI / RACI / Choosing By Advantages (CBA) などが採用されている。

これらを未調査で独自軸を設定するのは RQ-038 / RQ-045 / RQ-050 / RQ-051 と同じアンチパターン (PR #811 / #814 で発覚)。

2. 調査の目的

  1. 多基準意思決定分析 (MCDA) の業界ベストプラクティスを特定する
  2. アーキテクチャ意思決定 (ADR / Synthesis) に適用可能なフレームワークを抽出する
  3. 3 モデル並列調査結果の集約(複数 LLM の出力突合)に特化した評価軸選定パターンを導出する
  4. 1 人法人 + AI Agent スケールで過剰回避基準を確立する

3. 調査論点 (Research Questions)

#調査論点期待アウトプット
Q1多基準意思決定分析 (MCDA) の主要フレームワーク網羅一覧 + 一次資料 URL
Q2各フレームワーク (AHP / TOPSIS / PROMETHEE / WSM / ELECTRE 等) の評価軸選定アプローチ比較表
Q3ソフトウェアアーキテクチャ意思決定での MCDA 適用事例 (Zimmermann / Kazman / SAAM / ATAM 等)事例 + 引用
Q4ADR / Synthesis における評価軸選定の業界事例 (Spotify / GitLab / ThoughtWorks Tech Radar 等)事例マトリクス
Q5軽量フレームワーク (DACI / RACI / CBA / Wardley Mapping / Cynefin) の適用領域比較適用ガイドライン
Q6複数 LLM の出力突合 (Multi-Model Synthesis) に特化した評価軸選定パターンの先行研究学術引用 + パターン
Q7評価軸の重み付け (Weight Assignment) の手法とアンチパターン重み付け実例
Q81 人法人 + AI Agent スケールで省略可能な項目の判定MVP / 省略リスト
Q9bizlp の RQ-050 / RQ-051 Synthesis に遡及適用すべきフレームワーク推奨案
Q10Synthesis 評価軸の標準テンプレート (bizlp 用)テンプレート Markdown

4. 調査対象 (最低限カバー)

古典的 MCDA フレームワーク

  • AHP (Analytic Hierarchy Process, Saaty 1980) — pairwise comparison + eigenvector
  • TOPSIS (Technique for Order Preference by Similarity to Ideal Solution)
  • PROMETHEE (Preference Ranking Organization Method for Enrichment Evaluations)
  • WSM (Weighted Sum Model) / WPM (Weighted Product Model)
  • ELECTRE (Elimination Et Choix Traduisant la REalité)
  • MAUT (Multi-Attribute Utility Theory)

ソフトウェアアーキテクチャ特化

  • SAAM (Software Architecture Analysis Method, Kazman 1994)
  • ATAM (Architecture Tradeoff Analysis Method, SEI Carnegie Mellon)
  • Zimmermann's Architectural Decision Modeling (ADMentor / SOAD)
  • Cost-Benefit Analysis Method (CBAM) for software
  • Architecture Decision Records (MADR) の評価項目

アジャイル / 軽量フレームワーク

  • DACI (Driver, Approver, Contributors, Informed) — Atlassian / Spotify
  • RACI (Responsible, Accountable, Consulted, Informed)
  • Choosing By Advantages (CBA) — Jim Suhr の意思決定法
  • Wardley Mapping — Simon Wardley の戦略マッピング
  • Cynefin Framework — Dave Snowden の意思決定文脈分類

LLM / AI 出力評価特化

  • LLM-as-a-Judge パターン (Anthropic / OpenAI / Google)
  • Multi-Agent Debate 評価軸 (LangGraph / AutoGen)
  • Ensemble Decision Making (Wang et al. ICLR 2024 等)

5. 期待するアウトプット形式

  1. エグゼクティブ・サマリ (200 字以内): bizlp が採用すべき Synthesis 評価軸選定フレームワークの推奨
  2. 業界事例マトリクス: フレームワーク名 / 適用領域 / 評価軸選定アプローチ / 重み付け / 出典
  3. 適用可能性スコアリング (各フレームワーク 1〜5 点、bizlp Synthesis での適合度)
  4. bizlp Synthesis 標準テンプレート案: 評価軸選定 → 重み付け → スコアリング → 採択判定の流れ
  5. RQ-050 / RQ-051 への遡及適用案: 既存 Synthesis を新フレームワークで再評価する手順
  6. 未解決リスク / 追加調査が必要な領域

6. 制約・スコープ外

  • 個別 MCDA ツール (Decision Lab / SuperDecisions 等) の機能比較は対象外
  • AI Agent のオーケストレーション実装 (LangGraph / AutoGen) の比較は ADR-0019 で別途
  • 1 人法人スケールでの過剰設計を避ける (AHP の完全形は組織的に過剰)
  • 学術的厳密性 > 実装速度、ただし実用性とバランス

7. 期待する調査深度

  • 古典 MCDA (Saaty / Kazman) と新興 LLM-as-Judge の双方を一次資料で確認
  • ソフトウェアアーキテクチャ領域での適用論文を最低 3 件は引用
  • 3 モデル並列での得意領域:
    • Gemini Deep Research: 最新 LLM 評価フレームワーク・グローバル動向
    • Claude Research: 学術的厳密性・bizlp ADR-0020 との整合性
    • GPT Deep Research: 実装観点・テンプレート提案

8. 後続アクション (Post-Synthesis)

3 モデルの調査結果を RQ-052_..._synthesis.md にまとめ、

ADR-0050 (仮): Synthesis 評価軸選定フレームワークの確立

Standard ADR 起案、または既存 ADR-0020 (Triage 基準) の補遺として位置付ける。さらに以下のメタ作業:

  • RQ-051 Synthesis を新フレームワークで再起案 (PR #814 改訂版)
  • RQ-050 Synthesis の遡及検証 (既に確定済みだが評価軸根拠を補強)

9. 推奨実行モデル

モデル役割期待 token 量
Gemini 2.5 Pro Deep ResearchLLM-as-Judge / Multi-Agent 評価の最新事例20,000+
Claude Opus 4.7 Research古典 MCDA + bizlp ADR との整合性15,000+
GPT-5 Deep Research軽量フレームワーク (DACI / CBA / Wardley)10,000+

10. 関連 ADR / RQ

  • ADR-0019: Decision Pipeline LangGraph 移行 — Synthesis 自動化の文脈
  • ADR-0020: Triage 基準の学術的根拠 — 評価軸選定の先例 (Light/Standard/Critical の閾値設定)
  • ADR-0023: ADR ドキュメント構造 — Decision Drivers セクションの位置付け
  • RQ-050: ADR Scope 4 層分類 — 同じ 3 モデル並列パターンの先例
  • RQ-051: Lint 規約ドキュメント — 評価軸独自設定問題が発覚 (PR #811 / #814 close)
  • PR #814: RQ-051 Synthesis (close 済) — 本 RQ-052 完了後に再起案