合同会社MNML マルチエージェント基盤の全体構造・運用ルール・管理体制
MNMLのAIエージェント基盤は「会社組織 × チーム」の掛け合わせで構築されている。
Slackに投げた依頼が、組織の階層(Z軸)を降りながら適切なDivision(M層)に振り分けられ、スキルプール(W層・XY平面)から最適なメンバーがアサインされて実行される。サッカーチームのように、固有スキルを持つAIメンバーが目的に応じて編成される。
CEO → IF層(受付)→ M層(管理)→ W層(実行)の4階層。上位ほど判断権限が大きく、下位ほど専門性が高い。
W層に8名のスペシャリスト。調査・設計・実装・テスト・法務・税務など、必要なスキルを持つメンバーがオンデマンドで動く。
AI同士で自律的にタスクを進め、CEOには承認・報告・相談のみ。AI Opsが監視・異常検知で品質を担保する。
CEOの組織メタファーに基づく3次元構造図。Z軸が指揮系統の階層、XY平面がW層のスキルプールを表す。
| 責務 | MVV(ミッション・ビジョン・バリュー)の定義、有限リソースの意思決定、社外折衝 |
|---|---|
| 判断タイミング | リソース逼迫時の優先順位決定、承認依頼(APPROVAL_NEEDED)、相談(CONSULT)への回答 |
| 介入しないこと | タスクの分解方法、W層のアサイン、コードの書き方(AI自律領域) |
| 責務 | Slackメッセージの分類・M層へのルーティング・GitHub Issue自動起票 |
|---|---|
| 分類先 |
direct(IF層が直接回答)/
m-dev(開発)/
m-bo(管理)/
m-legal(法務)
|
| ルール | git操作は自分でやらない(M層に委任)。判断に迷う場合はCEOに相談 |
共通原則: 自分でコードを書かない・調査しない・設計しない。全てW層に委譲する。
開発タスクの分解とフェーズ管理。6名のW層(researcher, architect, coder, docs, reviewer, tester)を統括。
フェーズ制御:
経理・月次業務の統括。opsパイプラインの実行管理。tax(税務AI)を管轄。
管轄ops:
契約書レビュー・法務調査を統括。legal-reviewer(法務AI)を管轄。
知識ベース:
M層はSTATUSタグでbot.pyに制御を指示する:
| STATUS | 意味 | bot.pyの動作 |
|---|---|---|
CONTINUE | 次のフェーズに進む | M層を再起動して継続 |
DONE | 全作業完了 | CEOに完了報告 |
APPROVAL_NEEDED | CEO承認が必要 | CEOに確認を求める |
CONSULT | CEOに相談 | CEOに選択肢を提示 |
共通ルール: 結果の捏造禁止 / 未検証で完了報告しない / ファイル保存はls -laで実証 / エラー時は最大3回自力修正
| ワーカー | フェーズ | 役割 | 成果物 | 管轄M層 |
|---|---|---|---|---|
| researcher | Phase 1 | 技術調査・コード分析 | 調査レポート(Pros/Cons付き) | m-dev |
| architect | Phase 1 | 設計方針・IF定義 | HTML設計書 | m-dev |
| coder | Phase 2 | コード実装 | 実装コード + テスト実行済み | m-dev |
| docs | Phase 2 | ドキュメント作成 | Markdown / HTMLドキュメント | m-dev |
| reviewer | Phase 3 | コード/設計レビュー | レビューレポート(MUST/SHOULD/NIT) | m-dev |
| tester | Phase 3 | テスト作成・実行 | テスト実装 + カバレッジ報告 | m-dev |
| tax | — | 税務調査・計算 | 税務分析結果 | m-bo |
| legal-reviewer | — | 契約書レビュー | 法務分析レポート | m-legal |
| 責務 | エラー監視 / リトライ制御 / レジストリ管理(agents.json, tasks.json)/ CLAUDE.md整合性チェック |
|---|---|
| 検知項目 | 孤立タスク(120秒超更新なし)/ エラー率異常(10分窓で50%超)/ 系統的障害(30分で3件以上同一ルート) |
| リトライ制御 | Rate limit: exponential backoff(30s→60s→120s)/ 通常エラー: 5秒待機 / 上限: 3回/スレッド |
| 実装 | 独立Pythonプロセス(launchd: com.mnml.ai-ops-monitor) |
| 責務 | Slack接続(Socket Mode)/ claude CLI subprocess管理 / タスク状態管理 / rate limit制御 |
|---|---|
| 主要モジュール | app.py(Bolt本体)/ router.py(ルーティング)/ delegation.py(委譲プロトコル)/ claude_runner.py(CLI実行)/ task_tracker.py(状態管理) |
| データ | tasks.json / agents.json / worker_status.json / monitor_commands.json |
AIエージェントの動力源はClaude Max Planのトークン。月額定額だが、同時実行数・1日あたりのトークン消費量に上限がある。サッカーで言えば「選手の体力」に相当し、使い切ると全員が動けなくなる。
| リソース種別 | 説明 | 枯渇した場合 |
|---|---|---|
| トークン(API消費量) | 各エージェントのClaude CLI呼び出しで消費 | Rate limit発動 → 全タスク待機 |
| 同時プロセス数 | 並行実行できるclaude CLIの数 | キュー待ち発生 |
| 時間(経過時間) | 長時間タスクがリソースを占有 | 他タスクの着手遅延 |
| 操作 | CEO | IF層 | M層 | W層 | AI Ops |
|---|---|---|---|---|---|
| タスク作成 | ○ | ○(分類後) | ○(分解) | × | × |
| タスク停止 | ○ | × | × | × | ○(異常時) |
| W層アサイン | × | × | ○ | × | × |
| コミット | ○ | × | ○(指示) | ○(作成) | × |
| プッシュ | ○ | × | ○ | × | × |
| Force push | ○(承認) | × | × | × | × |
| リトライ指示 | ○ | × | ○ | × | ○(自動) |
| 外部API書込み | ○(承認) | × | 確認後○ | × | × |
各層のルール・制約・品質ゲートを定義。全エージェントが起動時に読み込む。階層的に継承される(プロジェクト → 層 → 個別ワーカー)。
agents/CLAUDE.md — プロジェクト全体agents/if/CLAUDE.md — IF層agents/managers/*/CLAUDE.md — M層agents/workers/*/CLAUDE.md — W層過去の設計判断・フィードバック・プロジェクト文脈を記録。新しい会話でも過去の学びを引き継げる。
各W層が持つドメイン知識。法令・税務資料・技術ドキュメントなど。起動時にワーカーが参照する。
workers/legal-reviewer/knowledge/workers/tax/knowledge/workers/coder/knowledge/info-mnml/issuesリポジトリで一元管理。IF層が自動起票し、M層がタスク分解時にIssue番号を紐づける。
| 資産種別 | 保管場所 | 用途 | 管理者 |
|---|---|---|---|
| ソースコード | GitHub(info-mnml org) | 全リポジトリ(Private) | m-dev |
| ビジネス文書 | OneDrive / SharePoint | 契約書・請求書・納品物 | m-bo / m-legal |
| コミュニケーション | Slack | タスク依頼・報告・通知 | 全層 |
| OAuth基盤 | ops/shared/ | MS Graph / Slack API認証 | m-bo |
| HTML成果物 | Cloudflare Pages | 設計書・報告書の公開 | 自動デプロイ |
| カレンダー | Outlook(MS Graph経由) | 予定調整・作業報告書 | m-bo(scheduler) |
m-bo管轄の定型業務自動化。各パイプラインが独立して実行可能。
リソースビュータブのモックUI。スレッド単位でグルーピングし、M層→W層を親子ネスト表示。経過時間降順で並べ、リソース消費の代替指標とする。