JTBD 完了判定の定量的評価手法調査
調査日: 2026-05-26 調査者: [email protected] 目的: ADR-0043 軸 1(達成可能ゴール軸)の定性判定「この業務が完了した」を定量評価に転換する方法論を 3 vendor で調査する。RQ-049 で推奨された Direction + Metric + Object of control 構文を前提に、計測方法・達成度数値化・集約手法を明らかにする 調査モデル: Gemini 1.5 Pro (Deep Research) / Claude Opus 4.7 / GPT-4o (Deep Research) 先行調査: RQ-049 Synthesis — 3 vendor 一致で「ゴール軸を Direction + Metric + Object of control に強化」を推奨
0. 調査設問
- Ulwick ODI の Desired Outcome Statement で書いた outcome を、実際の業務完了判定にどう計測・数値化するか? Importance x Satisfaction Gap 分析はジョブ完了判定にも応用できるか?
- JTBD 文献 (Ulwick, Christensen, Moesta, Kalbach, thrv) で「ジョブがどの程度完了したか」を段階的・定量的に測る手法はあるか? binary ではなく continuous/ordinal な評価は可能か?
- BPM / プロセスマイニングの完了度指標 (cycle time, completion rate, conformance rate 等) を JTBD 完了判定に接続する方法論はあるか?
- 会計業務 5 件 (月次決算・銀行照合・資金繰り予測・予実差異分析・RPA 自動起票) について Direction + Metric + Object of control 形式の Desired Outcome Statement を各 2〜3 個例示し、それぞれの計測方法を提示せよ
- ソロ開発 (起案者=評価者) で月次 < 0.5h の運用コストで回せる定量評価の仕組みを提案せよ
1. サマリー(3-vendor 統合結論)
3 者一致率: 5/6 論点で完全一致 (83%)、1 論点で 2/3 majority (集約方式)
統合判定
| # | 論点 | 統合結論 | 一致度 |
|---|---|---|---|
| 1 | Opportunity Score の完了判定転用 | 直接転用不可。優先順位付け (innovation priority) 用であり完了度指標ではない。ただし weight 付けロジックは outcome の重要度設定に応用可 | 3/3 |
| 2 | Job Completion Score の業界標準 | 存在しない。Ulwick も Kalbach も集約スカラーを提示せず、thrv の Job Execution Metrics も "framework であり単一 index ではない" と明示 | 3/3 |
| 3 | continuous な完了度評価 | 可能。Universal Job Map の 8 ステップで ordinal 評価 + thrv の 5 指標 (Success rate / Completion time / Error rate / First-time success / Perceived effort) で continuous 評価 | 3/3 |
| 4 | BPM KPI との接続 | 直接マッピング可能。JTBD が「何を測るか」、BPM が「どう測るか」を提供する二層構造が最適 | 3/3 |
| 5 | 集約方式 | Min-rule (主指標) + Weighted Average (補助指標) のハイブリッド (majority: Gemini + Claude)。加重平均単独は Compensatory で致命的誤評価リスクあり | 2/3 |
| 6 | 月次 < 0.5h 達成可能性 | 達成可能。GAS auto-telemetry + Sheets ダッシュボードで自動集計、手動は目視確認 + コメント記入のみ | 3/3 |
統合推奨アーキテクチャ
Layer 1: Desired Outcome Statement (JTBD — 「何を測るか」)
[Minimize/Maximize] the [Metric] of [Object of control] [Contextual clarifier]
Metric は time / likelihood / number / % の 4 種に限定 (Ulwick 原典準拠)
↓
Layer 2: Achievement Score 0.0〜1.0 (BPM — 「どう測るか」)
minimize 系: score = clamp((baseline - observed) / (baseline - target), 0, 1)
maximize 系: score = clamp((observed - baseline) / (target - baseline), 0, 1)
↓
Layer 3: Job Completion Score (集約)
主指標: JCS = min(outcome_scores) ← ボトルネック検出
補助指標: JCI = Σ(w_i × score_i) / Σ(w_i) ← トレンド可視化
ADR-0043 軸 1 改訂提案 (3 vendor 方向性一致)
現行 (Before):
軸 1 (達成可能ゴール軸): 「この業務が完了した」と判断できる明確なアウトカムが存在する
改訂案 (After):
軸 1 (達成可能ゴール軸 v2): ジョブに対し、Ulwick ODI 構文 (Direction + Metric + Object of control + Contextual clarifier) に準拠した Desired Outcome Statement が 3 個以上 定義されており、かつ次の 3 条件を満たす:
- 構文準拠: 全 outcome が 4 要素を備え、Metric は time / likelihood / count / % のいずれかで表現される
- 計測可能性: 全 outcome に baseline (過去実績) と target threshold が固定され、自動計測比率 ≥ 60%
- ボトルネック可視化: Min-rule による Job Completion Score が定義され、最低 outcome が一意に identifiable
2. Vendor 別分析
2.1 Gemini 分析 (Deep Research, 14 ページ, 引用 49 件)
Status: DONE (2026-05-26)
固有の貢献:
- Ulwick 構文は 3 要素 (Direction + Metric + Object of control) として整理。Metric カテゴリは「時間」「可能性・確率」「数量」の 3 分類
- Universal Job Map (Bettencourt & Ulwick 2008) の 8 ステップ (Define → Locate → Prepare → Confirm → Execute → Monitor → Modify → Conclude) による ordinal 評価を提案
- thrv の Job Execution Metrics (Job Completion Rate / Time to Job Completion / Customer Effort Score) を continuous 指標として推奨
- BPM との接続: Case ID = Job Instance / Activity = Job Step / Timestamp = Outcome 計測根拠。Cycle Time・Conformance Rate・Step Completion Rate が直接転用可能
- Google Sheets を「軽量イベントログリポジトリ」として構成し、AVERAGEIFS / COUNTIFS でリアルタイムダッシュボード構築可能と論証
- 集約方式: 加重平均は Compensatory で致命的。Weakest Link (min 関数) + Gatekeeper (エラー率 > 5% → JCS を強制 0) を推奨。銀行照合の「速いが不正確」シナリオで加重平均が 50% と誤評価する例を図示
業界ベンチマーク:
- APQC: 月次決算 cycle time median 6.4 日 / top quartile ≤ 4.8 日 (n=2,300)
- Hackett Group 2025: "35-57% shorter close cycles" / "~99% JE automation" (Digital World Class)
2.2 Claude 分析 (Opus 4.7, 14 ページ)
Status: DONE (2026-05-26)
固有の貢献:
- Ulwick 構文は 4 要素 (Direction + Metric + Object of control + Contextual clarifier) と明示。Metric は time / likelihood / number / % の 4 種に限定 (Strategyn whitepaper 準拠)
- Opportunity Score (= Importance + max(Importance - Satisfaction, 0)) の bizlp 転用法: Importance = 「監査リスク・経営インパクト」、Satisfaction = 「現状自動化率」に読み替え → outcome 優先順位付けに応用可
- JTBD 文献サーベイ: Ulwick / Christensen / Moesta / Kalbach / thrv の 6 文献を横断比較し「集約スカラーは意図的に避けられている (低スコアが高スコアに隠蔽されるため)」と結論
- BPM 側の理論的根拠: van der Aalst Conformance Checking 4 軸 (fitness / precision / generalization / simplicity)、del-Río-Ortega PPINOT メタモデル (Base / Derived / Aggregated measure)、APQC PCF 8.0/9.0、Six Sigma Cpk/DPMO
- 集約方式: Min-rule (主指標) + Weighted Average (補助指標) のハイブリッド。GQM (Basili 1994) の Goal/Question/Metric 3 層を Sheets 構造に直接マッピング
- 評価者バイアス対策 6 項目: (a) baseline を
PropertiesServiceで凍結 (b) 自動計測比率 ≥ 60% (c) 3-strike rule (d) 過去ベースラインのロック (e) Min-rule の構造的強制 (f) QUnitGS2 による閾値ロジックの単体テスト - Sheets テンプレート 4 シート構造:
outcomes_catalog/measurements_log/dashboard/adr_links。数式例まで提示 (=MIN(FILTER(...))/=SUMPRODUCT(scores, weights)/SUM(weights)) - Caveats 10 項目: 特に「1-day close は Fortune 500 のみ、ソロ法人は 5-7 営業日が現実的」「STP 99% は auto-generation rate であり no-review rate ではない」が実務的に重要
2.3 GPT 分析 (Deep Research, 5 ページ, 引用 14 件)
Status: DONE (2026-05-26)
固有の貢献:
- Desired Outcome Statement を「達成方向 (方向性) + 性能指標 + 制御対象 (Outcome) + 文脈」の構造で整理
- Opportunity Score は「改善余地の発見」用であり完了度評価には不適切と明言。「むしろ上記の実行性能指標 (時間・率・エラー数など) を測定し、目標値との乖離で評価するのが一般的」
- BPM 指標との接続を「ジョブ = 社内プロセスとみなした上で、その進捗や品質指標を Outcome と対応させる」と簡潔に定式化
- 集約方式: Weighted Average を推奨しつつ、Min-rule は「代替手段」として言及。「初期は均等重み (閾値クリア = 1 点、未達 = 0 点) にしても良い」と段階的導入を提案
- 運用コスト削減: 「可能な限り自動化しつつ、セルフチェックリストで確認」形式を推奨。Balanced Scorecard 的な「複合 KPI ダッシュボード」として各 Outcome の詳細も併記する構成を提案
3. 3-vendor 一致度分析
| 論点 | Gemini | Claude | GPT | 一致 |
|---|---|---|---|---|
| Opportunity Score は完了判定に不適切 | 不可 (優先順位付け用) | 不可 (innovation priority 用) | 不可 (改善余地の発見用) | 3/3 |
| Job Completion Score の業界標準 | なし | なし (意図的に避けられている) | なし (thrv も単一 index 未公表) | 3/3 |
| continuous な完了度評価の可否 | 可 (Job Map ordinal + Job Execution Metrics) | 可 (ODI の Satisfaction 軸で連続値) | 可 (KPI を時間値で連続化) | 3/3 |
| BPM KPI との接続 | Case ID=Job Instance / Activity=Job Step | van der Aalst 4 軸 / PPINOT 3 階層 | ジョブ=社内プロセスとみなして KPI 対応 | 3/3 |
| 集約: Min-rule 採用 | 主指標 (+ Gatekeeper) | 主指標 (+ WA 補助) | 代替手段として言及 | 2/3 majority |
| 集約: Weighted Average の位置づけ | 危険 (Compensatory) | 補助指標として採用 | 主推奨 | 分裂 |
| 月次 < 0.5h 達成可能 | 可 (auto-telemetry) | 可 (約 25 分) | 可 (自動集計 + セルフチェック) | 3/3 |
| ADR-0043 軸 1 改訂方向 | Outcome 3+ 個 + 計測可能 | 3 条件 (構文 + 計測 + ボトルネック) | Outcome 定義 + ベースライン設定 | 3/3 |
一致率: 8 論点中 7 論点で一致 (87.5%)。1 論点 (Weighted Average の位置づけ) は 2/3 majority で Min-rule 優先を採用。
分裂点の裁定: 集約方式
Gemini と Claude が「加重平均は Compensatory で致命的誤評価リスクがある」と理論的根拠を示して Min-rule 優先を主張。GPT は実装容易性から Weighted Average を推奨しつつ Min-rule の有用性は認めている。
裁定: Gemini の「銀行照合でスピード 100%・正確性 0% → 加重平均 50% vs min 方式 0%」の例が会計業務の実態 (正確性が致命的) を正確に反映しており、Gemini + Claude の majority を採用する。Weighted Average はトレンド可視化の補助指標として併用。
4. 参照元
Gemini 引用 (主要)
- Ulwick, A. (2005). What Customers Want
- Bettencourt, L. & Ulwick, A. (2008). "The Customer-Centered Innovation Map." Harvard Business Review
- thrv.com (2025). "Job Execution Metrics." JTBD 用語集
- van der Aalst, W. (2011). Process Mining: Discovery, Conformance and Enhancement of Business Processes. Springer
- APQC / Wiggins, P. "Cycle Time for Monthly Close." CFO.com (n=2,300)
- The Hackett Group (2025). Digital World Class Finance research
Claude 引用 (主要)
- Ulwick, A. "What is Outcome-Driven Innovation?" Strategyn whitepaper
- Kalbach, J. (2020). The Jobs To Be Done Playbook, ch.4
- Basili, V., Caldiera, G., Rombach, H.D. (1994). "The Goal Question Metric Approach." Encyclopedia of Software Engineering
- del-Río-Ortega, A. et al. (2013). "On the definition and design-time analysis of process performance indicators." Information Systems
- APQC PCF v7.0.5, Category 8.0/9.0 Manage Financial Resources
GPT 引用 (主要)
- Ulwick, A. (2021). "Measure Customer Progress Using JTBD + Outcome-Driven Innovation." JTBD + ODI ブログ
- Mehta, H. (2026). "Month End Close KPIs: Metrics Every Finance Team Should Track." Xenett
- Pandey, A. (2026). "Account Reconciliation Metrics." ScryAI
- thrv.com (2023). "Job Execution Metrics." JTBD 用語集
5. プロジェクトへの示唆
5.1 実装ロードマップ (3 vendor 統合)
段階 1 (直近 2 週間、約 8h):
outcomes_catalogシートを新規作成 (5 業務 × 各 2-3 outcome = 約 12 outcome を初期投入)- baseline を過去 6 ヶ月の実績から手動計算
- MC-1 (close 日数) と RPA-1 (STP rate) の 2 つだけ自動計測を実装
- ADR-0043 を改訂案で更新、軸 1 の判定基準を明示化
段階 2 (1-2 ヶ月後): 5. 自動計測比率を 60% 以上へ拡大 (BR-1, BR-2, VA-2, CF-1 を順に自動化) 6. QUnitGS2 で閾値ロジックの単体テストを追加 7. dashboard の Min-rule alert を実装
段階 3 (3-6 ヶ月後): 8. Cpk / DPMO の RPA-2/RPA-3 導入 9. APQC PCF コードタグでベンチマーク比較レポートを月次自動生成 10. Opportunity Score で次に自動化すべき outcome を四半期ごとに棚卸し
5.2 Sheets テンプレート構造 (Claude 提案ベース、3 vendor 合意)
Sheet 1: outcomes_catalog (マスタ、ADR で変更管理)
| outcome_id | job | direction | metric | object_of_control | clarifier | weight | auto_meas | apqc_code |
|---|---|---|---|---|---|---|---|---|
| MC-1 | monthly_close | Minimize | calendar days | period-end to FS issuance | fiscal month | 0.25 | TRUE | 9.3 |
| BR-1 | bank_recon | Maximize | % | auto-matched txn / total | 24h post-import | 0.20 | TRUE | 9.3.3 |
| RPA-1 | auto_je | Maximize | % | STP rate | per month | 0.20 | TRUE | 8.5.1 |
Sheet 2: measurements_log (GAS が自動 append)
| timestamp | outcome_id | observed_value | normalized_score | source | comment |
|---|
正規化式:
- Minimize 系:
score = clamp((baseline - observed) / (baseline - target), 0, 1) - Maximize 系:
score = clamp((observed - baseline) / (target - baseline), 0, 1)
Sheet 3: dashboard
=MIN(FILTER(measurements_log!D:D, measurements_log!B:B="MC-*", recent=TRUE))
→ Job Completion Score (Min-rule)
=SUMPRODUCT(scores, weights) / SUM(weights)
→ Job Completion Index (Weighted Average)
=ARRAYFORMULA(IF(scores < 0.5, "🔴 BOTTLENECK", IF(scores<0.8, "🟡","🟢")))
→ outcome 別ステータス
5.3 注意事項 (3 vendor 共通指摘)
- outcome 数は 12 個以下に抑える: Kalbach 自身も "50-150 outcomes のフル ODI 実装は執行困難" と認めている。自動計測対象は 7-8 個が上限
- スコアインフレ対策: baseline を
PropertiesServiceで凍結し、target 変更は ADR 起票を必須化 - Opportunity Score の誤用回避: 元来 n≥180 の survey ツール。ソロ法人で自己採点する際は APQC / Hackett / J-SOX の外部基準から importance を参照し、自己判断のみで決めない
- 月次決算の現実的目標: "1-day close" は Fortune 500 の Digital World Class 帯のみ。ソロ法人の現実的目標は 5-7 営業日 (APQC median 寄り)
- STP 99% の正確な解釈: Hackett の "99% JE automation" は「仕訳の 99% がシステムから自動生成される」意味であり「人間レビュー無し」ではない。bizlp では auto-generation rate と auto-post-without-review rate を別 outcome に分解する