最終更新: 2026/06/22 18:56
② 7アプローチ 3モデル深掘り(OpenAI o3 / Gemini deep-research / Claude managed-agent)
3グループ×3モデル(計9本)を横断統合 / 2026-06-15 / ② コスト $14.82 モデル横断で食い違う点は「(モデル名)は〜」と明記。出典の質感: claude(一次文献・査読誌中心)> gemini(査読+実務記事)> openai(網羅的だが二次媒体に依存気味)。
1. 合理的・分析的アプローチ(Rational / Comprehensive Rational Model)
- 出自: 古典派経済学「経済人」に立つ規範モデル。3モデルとも、これを批判して限定合理性を導入した サイモン(1947『Administrative Behavior』)を起点に挙げ、openai/claude は リンドブロム(1959「Muddling Through」で批判)も重視。
- 核心/手順: 完全情報・安定選好・無限の計算力を仮定し最適化(maximizing)。ほぼ一致で6〜8ステップ(問題定義→評価基準→重みづけ→代替案網羅→得点化→加重合計で最適案→実行→モニタリング)。claude はサイモンの「諜報→設計→選択」も提示。
- 強み/限界: 規律・透明性・監査可能性(規制業種で audit trail)↔ 完全情報・客観分析の前提が非現実的(限定合理性・muddling through・バイアス研究で反証)。
- 実証: Paul Nutt の長期研究(358件・20年、決定の約半数が失敗、2/3が失敗しやすい戦術)。openai は Brinckmann ら(2010)メタ分析(事業計画は概ね業績に寄与・「計画+学習」推奨)、gemini は fMRI の資源合理性。
- 失敗モード: 「分析麻痺」→time-box・代替案数制限・満足化基準の事前設定。openai は誤前提のまま最適化(米国防総省 PPBS の機能不全)。
- 使いどころ: 大型・不可逆/基準明示可/情報十分の3条件(例: 新工場立地選定)。探索的・高不確実には不向き。
- ★3モデル異同: 骨格は一致。gemini が最も広い(神経科学・Cynefin等)、claude が最も操作的(手順・具体例)、openai が歴史実例(PPBS・計画メタ分析)を厚く。
- 出典: Nutt(PDF) / Bounded Rationality(SEP) / Muddling Through
2. 限定合理性・満足化(Bounded Rationality / Satisficing)
- 出自: サイモン 1947、1978年ノーベル賞。「satisfice」= satisfy + suffice。
- 核心: 認知・時間・情報の制約下で全選択肢を最適化せず、要求水準(aspiration level)を満たす最初の案で打ち切る。claude 強調: 要求水準は固定でなく動的に上下する。代替案は探索中に逐次発見。
- 強み/限界: 分析麻痺回避・探索コスト減・実行速度(中小の「人・金・暇がない」に適合)↔ 「十分よい」で良機を逸する・基準設定ミス・現状維持の正当化。
- 実証: claude=中古車ディーラー628社の97%が満足化(競合1店増ごとに待機βを約3%短縮)。gemini=Schwartz 2002 の maximizer/satisficer(maximizer は初任給平均$7,500高いが主観満足は低い「maximizer の罠」)。
- 失敗モード: 早すぎる妥協/基準が低すぎ→振り返りで受容基準を段階調整。重要戦略は意識的に最大化モードへ。
- 使いどころ: 仕入・価格・人員配置・ソフト選定などルーチン〜半構造的決定。
- ★3モデル異同: メカニズム一致。claude は動的要求水準+実地研究、gemini は心理学+企業導入数値、openai は選択肢過多パラドックス+「規範性の欠如」批判。
- 出典: Satisficing(Wikipedia) / 小野2013 経済のプリズム
3. 直感的意思決定(Recognition-Primed Decision / NDM)
- 出自: ゲイリー・クライン。消防士等を自然環境で研究し1985年 RPD。1989『Sources of Power』。openai は起源を米陸軍委託研究とする。
- 核心/手順: パターン認識で「典型」を識別→典型行動を一つ想起→心的シミュレーションで検証→不都合なら修正/次案。複数案の同時比較はしない(単一評価)。gemini は3バリエーション(単純照合/診断・特徴照合/心的シミュレーション)。
- 強み/限界: 時間圧・高ストレス下の即断・暗黙知の動員 ↔ 経験者専用(初心者不可)・専門外への過剰一般化(fractionated expertise)・主観的確信は精度の指標でない。
- 実証: 消防隊長研究(claude: 26名・156決定点で並列比較<12%/gemini: 134中117がRPD)、新生児ICU 看護師の異常検知(Crandall 1993)。Kahneman–Klein(2009) が直感の信頼3条件で合意: ①高妥当性環境(学習可能な規則性)②十分な反復経験 ③迅速・明確なフィードバック。
- 失敗モード: 誤パターン認識・確証バイアス・過信 → プリモータム(「既に失敗した」と仮定し理由を遡る/HBR 2007・失敗モード特定が約30%向上)。
- 使いどころ: 消防・救急など生死の即断、熟練経営者の市場変化の察知。
- ★3モデル異同: 一致度高い。claude が一次研究の数値・引用で最精密、gemini が3バリエーション表+プリモータムの認知科学、openai は陸軍起源・現場逸話だが二次媒体依存。
- 出典: Kahneman & Klein 2009 / Project Premortem(HBR) / Fire-ground研究
4. 漸進主義(Incrementalism / Muddling Through)
- 出自: リンドブロム 1959「The Science of 'Muddling Through'」。後に Braybrooke と『A Strategy of Decision』(1963)で「断片的漸進主義」へ。
- 核心: ゼロベースの「根(root)法」でなく、現状から近接案を「連続的限定比較」する「枝(branch)法」。目的と手段を同時選択。大組織では partisan mutual adjustment(パルチザン的相互調整)。
- 強み/限界: 可逆性・低リスク・摩擦最小・認知経済・試行学習 ↔ 保守化・現状維持・大変革を逃す(Dror「制度化された惰性」)。claude=1990年代半ばに規範理論として衰退。
- 実証/例: Wildavsky の予算研究(前年比漸増)。反証=コダック(フィルムを漸進改良し続けデジタル大転換に出遅れ破綻、openai)。後継: Quinn「論理的漸進主義」、Etzioni「混合走査」。
- 失敗モード: ゆでガエル(手遅れまで方向転換できない)→年1〜2回ゼロベース再評価+混合走査(広域スキャン+詳細精査)。gemini=二速経営(Horizon 1/2)。
- 使いどころ: 環境変化が穏やかな局面(年度予算微調整・制度小修正)。特定SKUのみ5%値上げして反応を見る等。Lean Startup は商業応用(gemini)。
- 日本: openai が トヨタのカイゼンを漸進主義の好例として位置づけ。
- ★3モデル異同: 理論記述は一致。claude=理論史・衰退論、gemini=混合走査・Quinn・Thiel反論・二速経営、openai=カイゼン肯定例+コダック反証例。
- 出典: Lindblom 1959 / Bendor "Dead yet Flourishing"
5. データ駆動・エビデンスベース経営(Evidence-Based Management / EBM)
- 出自: Evidence-Based Medicine(Sackett)を経営に転用。Pfeffer & Sutton(HBR 2006・『Hard Facts』)。学術化は Rousseau(2006)・CEBMa。邦訳『事実に基づいた経営』。
- 核心/手順: 勘・流行・権威でなく「最良の入手可能なエビデンス」+批判的吟味。4源泉の三角測量(科学的文献/組織データ/実務家の専門知/ステークホルダーの価値)。CEBMa の6ステップ(Ask→Acquire→Appraise→Aggregate→Apply→Assess)+PICOC。
- 強み/限界: 半真実・流行・ベストプラクティス盲従への耐性・透明性 ↔ 経営は文脈依存で RCT が乏しい・測定可能物への偏重・直感とのトレードオフ懸念。
- 実証: Brynjolfsson の DDD 研究(179社、DDD採用で生産性が平均5〜6%高い/製造業の DDD 率 2005→2010 で11%→30%)。Pfeffer&Sutton: ストックオプションと業績の証拠は220超の研究で乏しい、Harrah's の実験。
- 失敗モード: メトリック固着(Goodhart の法則)。例: SaaS の MTTR 単一KPI化→一時パッチ多発で再発増(→複合指標へ)、Wells Fargo の口座件数至上→不正、英NHS「4時間ルール」の goal displacement。緩和=複合指標/BSC・定期見直し・定性評価・小規模ABテスト。
- 使いどころ: データが取れ反復実験できる領域(Webマーケ・価格・採用・UX・解約率)。
- 日本: gemini が日本中小の実例(ハーツ・And Steady・TSUKUMO)と省庁 EBPM 普及。openai は PDCA・トヨタ「現地現物」と親和。
- ★3モデル異同: 起点・5〜6%実証・Goodhart は共有。claude/gemini は CEBMa の「4源泉×6ステップ×PICOC」中核、openai は枠組み名を使わず「実験的機動性」中心。gemini が最もローカル文脈。
- 出典: Pfeffer & Sutton(PDF) / Brynjolfsson DDD / Goodhart's law
6. 参加型・集団/取締役会型(Vroom-Yetton-Jago・稟議・根回し)
- 出自: Vroom & Yetton(1973『Leadership and Decision-Making』)→Jago 拡張(1988)。状況適合の規範モデル。稟議は別系統で、claude のみ起源を「明治期にプロイセン官僚制参考・1873年の印鑑登録」と特定。
- 核心: 「参加の是非」でなく「どの程度参加させるか」。5スタイル A1(単独)/A2(情報収集のみ)/C1(個別相談)/C2(集団相談)/G2(合議) を、決定の質・コミットメント・時間制約で選ぶ。日本式=根回し→稟議書回覧→各階層のハンコ→決裁。
- 強み/限界: 納得感・当事者意識・実行円滑・知恵結集 ↔ グループシンク・遅延・責任曖昧。claude=Field(1979)「複雑すぎる」・約50%で全案が実行可能集合に残り選択指針なし。
- 実証: 「モデル準拠で成功率約2倍」が共通。claude=Vroom&Jago(1978)181ケース(集合内51/105 成功 vs 集合外31/87)、gemini=公共環境241ケースのメタ分析で Conflict Rule 支持。
- 失敗モード: グループシンク(Janis: ピッグス湾)→悪魔の代弁者・心理的安全性・採否理由のフィードバック。
- 日本(稟議・根回しの功罪): 功=ボトムアップ合意・現場反映・多階層承認が内部統制・実行円滑。罪=最長1か月の遅さ・「みんなで決めた」で責任不明・過度なコンセンサスが革新を抑制。claude=根回しで承認時間を最大30%短縮、近年は e-Ringi。単独創業者は「顧問への事前個別相談=ミニ根回し」「決定経緯の文書化=ミニ稟議」。
- ★3モデル異同: 大枠一致。claude が一次研究・年・数値+稟議の明治起源で最精密、gemini が241ケースメタ分析+IBM/Gates 事例+「根回し=G2/C2の制度化」、openai は失敗事例の物語的描写。(※状況要因の数え方は openai「8→11」/gemini「7問×14タイプ」/claude「7問」とモデル版で表現が揺れる)
- 出典: Vroom–Yetton(Wikipedia) / 稟議・根回し(Jugaad)
7. エフェクチュエーション(Effectuation)
- 出自: Saras Sarasvathy。中核論文 Sarasvathy(2001) AMR 26(2):243-263。サイモンの弟子で限定合理性が土台(gemini 強調)。2008『Effectuation』。
- 核心/5原則: コーゼーション(目標固定→最適手段)の反転。「未来は予測できないがコントロールできるなら予測は要らない」。①手中の鳥(手元資源から)②許容可能な損失(失ってよい上限で小さく賭ける)③クレイジーキルト(競合分析でなくコミットする協働者を編む)④レモネード(想定外を機会に)⑤飛行機の操縦士(コントロール可能要素に集中)。
- 強み/限界: 不確実下の行動力・柔軟性・低コスト試行・偶然に強い(リーンスタートアップの母体)↔ 長期ビジョン軽視・場当たり化・安定市場では計画型優位。
- 実証: 定性(プロトコル分析)。専門起業家 N=27 にシンクアラウド(gemini/claude 一致)。★openai のみ「45人・約89%」とサンプル数が食い違う(要注意)。メタ分析 Read/Song/Smit(2009)が9,897ベンチャーで正の関連。批判 Arend ら(2015)「Effectuation as Ineffectual?」(3E枠で理論未発達)↔ Gupta/Garud が反論。gemini=N=27の小ささ・命題の同語反復性を指摘。
- 失敗モード: 目標の漂流(ピボット連発)→ミッション軸+撤退基準。claude=生存者バイアス(成功者だけのサンプル)・「許容損失の暴走」→時間/経費メーターで撤退を定量化。
- 使いどころ: 市場・顧客が未確定の創造的領域。例: Branson/Virgin、FitBit(自己ネットワークから40万ドル・木箱に試作→IPO41億ドル、claude)、千石アラジントースター・ウォークマン・わらしべ長者(gemini)、Dropbox/Instagram のピボット(openai)。
- 日本/現実解: 規制・契約で固い業種は事前計画必須、安定成長期は計画型へ。テスラのように計画とエフェクチュエーションを段階統合するハイブリッドが現実解。
- ★3モデル異同: 5原則・コーゼーション対比・Arend批判・ハイブリッド推奨は一致。claude が書誌・メタ分析n・多次元構成で最精密、gemini が Simon/Knightian と日本企業例、openai はサンプル数(45/89%)と事例(Dropbox)が他2モデルと食い違う。
- 出典: Effectuation 101 / Read/Song/Smit 2009 / Arend 2015
横断像(3モデル共通の収斂)
- 1〜7 はいずれも「経済人=完全合理性」への反措定として相互補完的に語られる。日常運営は満足化(2)、現場の即断は条件付きで直感/RPD(3)、未来方向の継続調整は漸進主義(4)、分析が要る大型決定は合理/EBM(1・5)、合意が成否を分けるなら参加型(6)、未確定の創造領域はエフェクチュエーション(7)。
- 共通処方箋: 大きな賭けの前にプリモータム+年1〜2回の包括レビューで「保守化」と「過信」を抑える。直感は高妥当性環境+学習機会の条件下のみ信頼。データと直感は融合(仮説を直感で立てデータで検証)。
モデル間の食い違い(検証メモ)
- エフェクチュエーションのサンプル数: gemini/claude=「N=27」、openai=「45人・89%」。一次論文(Sarasvathy 2001)は N=27 が定説。openai の数値は要確認。
- Vroom-Yetton-Jago の状況要因数: openai「8→11」/gemini「7問×14タイプ」/claude「7問」。モデル版(1973原版 vs 1988 Jago版)で異なるため表現揺れ。
- 出典の堅牢性: claude(査読誌・一次文献)が最も検証しやすい。gemini は内容は厚いが URL が vertexaisearch リダイレクト。openai は網羅的だが二次媒体(gigazine・mbalib 等)依存箇所あり。
成果物・コスト
- 生レポート:
tmp/deep-research/approaches-{A,B,C}-*/{openai,gemini}_*.md・claude_FULL.md(各グループ3モデル・計9本) - 統合:
tmp/deep-research/DEEP_DIVE_3MODEL.md - ② コスト $14.82(A $4.86 / B $5.10 / C $4.86・各 openai o3+gemini+claude)