最終更新: 2026/06/22 19:15
MAS-333 [Synthesis]: Claude Research × Gemini Deep Research の突合と統合結論
作成日: 2026-04-25 入力:
RQ-035_*_result_claude.md+RQ-035_*_result_gemini.md目的: 両調査の一致点・相反点・補完情報を整理し、MAS-059 仕様書 v1.0 起草前の統合 SSoT を提供
役割分担の振り返り
| ツール | 担当 | 強み |
|---|---|---|
| Claude Research | 深さ重視(A エグゼクティブサマリ + D/E/F の深い洞察 + Q6/Q7 の哲学的・技術的トレードオフ) | 不確実性の保留・GitHub Issue 番号付き根拠・最新論文引用・規制法理 |
| Gemini Deep Research | 広さ重視(事例網羅 + 市場マップ + 参照アーキテクチャ) | JPMorgan/Wells Fargo/Vena/Workiva 等の事例追加・EU AI Act 施行日・HSB 保険など補完情報 |
両者の役割分担が機能した結果、突合すると論点が立体的に見える状態になった。
✅ 両者一致(強い確証で採用すべき)
| 結論 | Claude 根拠 | Gemini 根拠 |
|---|---|---|
| E 案(LangGraph + checkpoint + LangSmith)= 採用推奨 | AppFolio/Klarna/Fastweb 商用事例 | JPMorgan Coach AI/Wells Fargo Fargo/Vena Copilot |
| 計算は決定論エンジン・LLM は説明のみ | 金融庁ペーパー + 法的責任論 | Financial Planning Gone Wrong (ローン誤算事故) |
| HITL = 金額閾値 + Autonomy Slider | Ramp Agents ($5,000 強制レビュー) | Microsoft Procurement / Unit21 (77% 自動・例外人間) |
| Recursion 暴走 = 一人法人を破産させる | GitHub Issue #6731 + Sonnet 4 課金試算 | recursion_limit 厳格化必須 |
| ソロ CEO × 日本税制 × 個人 B/S 統合 = 世界空白 | freee/マネフォ/弥生/Collective.com 比較表 | グローバル SaaS が日本特有税制を捨てる構造的理由を分析 |
| 真のツリー UI は世界に存在せず・並列カード型が事実上のデファクト | Pigment/Causal/Runway/Anaplan 全社が並列ブランチ採用 | Runway / Mosaic / Anaplan CoModeler のカード並列 UI |
| Causal AI = DAG 思考フレームのみ採用、do-calculus エンジン不採用 | arXiv 2506.00844 で明確否定 | Tool Use で決定論的因果表現すれば causaLens に匹敵 |
| EU AI Act + 監査ログ必須 | Annex III 解釈・LangSmith Developer / Langfuse | FINRA / SOC2 / Latitude / Monitaur |
| 法的免責・専門家相談誘導の Disclaimer 必須 | Air Canada v. Moffatt (2024 BCCRT 149) | 強力な免責事項提示の徹底 |
⚠ 相反する判断(要決着)
| 論点 | Claude | Gemini | 統合判断 |
|---|---|---|---|
| Firestore checkpointer の実装可否 | 不可(公式パッケージ未存在・自前実装は GitHub Issue #6533/#3380 で罠と確認) | 可能(HTTP ベースで Cloud Run scale-zero と相性良) | Claude 側採用(具体的 Issue 番号で裏取り済)。ただし Gemini の「Cloud Run + Firestore = Stateless Paradox 回避」は別論点で正しい。結論: アプリ用ユーザーデータは Firestore、LangGraph checkpointer は Cloud SQL Postgres で両立 |
| EU AI Act の SMB 財務計画 AI 該当判定 | 保留(Annex III 解釈ガイドライン 2026/2 待ち) | 断定的に「与信・融資 = 高リスク」と扱う | Claude 側の保留を採用(高リスク確定すると過度な対応コスト発生)。設計上は「将来高リスク認定されても通用する設計」を予防的に採る |
| コスト試算の精度 | $56-170/月(Vertex / Bedrock / LangGraph 5 案比較) | 「数十〜数百ドル」と大雑把 | Claude 側を採用(具体的試算 = 月 $56-170・最安は Vertex Agent Engine + Gemini 1.5 Pro) |
🤝 補完関係(両者統合すべき)
| 領域 | Claude のみ言及 | Gemini のみ言及 |
|---|---|---|
| 商用事例 | AppFolio Realm-X / Klarna / Fastweb / Ramp / Harvey AI / Mata v. Avianca / Johnson v. Dunn / DoNotPay | JPMorgan Coach AI / Wells Fargo Fargo / Vena Copilot / Workiva AI / Microsoft Procurement / Hebbia / Unit21 / Anaplan CoModeler |
| 規制対応 | 国内法(税理士法 52 条・金商法 28-3・個情法 32 条 / Q&A 7-53) | EU AI Act 2026/8/2 完全施行・FINRA Rule 3110 |
| 保険 | 言及なし | HSB AI Liability Insurance(小規模事業者向け) |
| OSS 監査ログ | LangSmith / Langfuse self-host | Latitude / Monitaur |
| Causal AI 否定の根拠 | arXiv 2506.00844 / 2506.21215 / 2025 最新研究 | Retail Budget Optimization 論文(肯定的事例) |
🎯 統合主要結論(MAS-059 spec の SSoT)
アーキテクチャ層
- 採用方式: LangGraph + Cloud SQL Postgres checkpointer + LangSmith Developer + Vertex AI Gemini 1.5 Pro
- コスト: 月 $56-95(1,000 セッション規模)
- Firestore: アプリ用ユーザーデータのみ・checkpointer には使わない
- 観測性: LangSmith primary + OpenTelemetry → Langfuse self-host で保険
UI/UX 層
- 真のツリー UI は採用しない(世界の主要 FP&A SaaS が誰一人採用していない事実)
- 並列カード比較 UI(Runway/Mosaic 型)+ Progressive Disclosure(選択パスのみ展開)
- HITL ルール: 金額閾値(役員報酬±20% / 資金調達 / 採用 1 名以上)+ Autonomy Slider(Conservative/Balanced/Autonomous)
ロジック層
- 計算は決定論的エンジン(MAS-058/MAS-012/MAS-048/MAS-017 を Tool Use 経由)
- LLM は数値を復唱しない(Function Calling 結果をそのまま UI に渡す・LLM は説明 NL 生成のみ)
- Causal AI = DAG 思考フレームのみ(経営者主導でエッジを描く・do-calculus エンジン不採用)
法務層
- Disclaimer 必須(「税理士・財務アドバイザーの代替ではない」明示)
- 監査証跡: LangSmith + BigQuery で全 LLM 入出力を構造化保存(FINRA / EU AI Act / J-SOX 対応)
- 税理士法 52 条 / 金商法 28-3 回避: 「個人の判断材料」フレーミング徹底
- HSB AI Liability Insurance(または同等)の検討(商用化時)
統合ポジショニング図
汎用/エンタープライズ ─────── ソロ/SMB特化
高 Agentic │ Klarna / Fastweb │ ⭐ bizlp F-59 完全空白 ⭐
│ AppFolio / Vena │
│ Workiva / Anaplan CM │ AppFolio Realm-X (近接)
│ causaLens │
│ Wells Fargo Fargo │
│ JPMorgan Coach AI │
│ Hebbia / Unit21 │
│ │
中 Agentic │ Bloomberg GPT │ freee AI β / マネフォ AI Cowork
│ Pilot AI Acct │ 弥生 AI 取引入力 β
│ Vertex AI ADK │ Collective.com (米 Solo S-Corp)
│ │
低 Agentic │ Anaplan / Pigment │ Runway / Causal / Mosaic
│ Cube / Deltek │
両者を合わせると bizlp MAS-059 候補は 「Agentic 高 × ソロ特化 = 完全ブルーオーシャン」 であり、直接競合は地球上に存在しないことが二重に裏付けられた。
MAS-059 仕様書 v1.0 起草時の準拠順位
- 本 synthesis 文書(最優先 SSoT)
RQ-035_*_result_claude.md(深い洞察・トレードオフ整理が必要な箇所で参照)RQ-035_*_result_gemini.md(事例網羅・補完情報が必要な箇所で参照)
矛盾発生時は本 synthesis の判断を最優先する。