Polmani v2.4
v2.4· консилиум 6 раундов· верификатор 9.6/10

Polmani

Перевёрнутый Nexus — отказоустойчивая мультиагентная платформа для Wildberries-бизнеса. Одна платформа, направленная внутрь — на собственные продажи, финансы и производство.

ЛИСТАТЬ ВНИЗ
01 / 09
Концепция

Перевёрнутый Nexus

Nexus задумывался как корпоративная мультиагентная платформа, обслуживающая много клиентов наружу. Polmani переворачивает модель: одна платформа обслуживает один растущий бизнес-селлер. Те же блоки направлены внутрь — на собственные продажи, финансы, производство и продвижение.

Было · Nexus

Корпорация

Одна платформа → много внешних клиентов. Универсальный сервис, продаваемый наружу.

Стало · Polmani

Один бизнес

Одна платформа → внутрь, на один растущий бизнес: продажи, финансы, производство, продвижение на Wildberries (задел на Ozon / Я.Маркет).

ПРИНЦИП №1

Отказоустойчивость

Платформа не падает и не требует постоянного ремонта. Каждый внешний вызов защищён, каждый граф восстанавливается, каждая ошибка перехватывается до того, как пойдёт дальше.

ПРИНЦИП №2

Рост агентами, а не людьми

Масштабируемся числом агентов, а не штатом. Новые функции — это новые узлы в сети, а не новые сотрудники.

Граница ответственности строгая: LLM отвечает за извлечение текста, понимание и оркестрацию. Детерминированный Python — за всю математику, деньги и правила. Принцип «Zero Mental Math»: Python считает до того, как LLM увидит данные.
02 / 09
Архитектура

Оркестратор, 6 департаментов, ~35 агентов

В центре — Макро-Оркестратор. Под ним подсистемы устойчивости и единый шлюз к WB API. Ниже — пять рабочих департаментов и общий слой данных. Наведите на карточку, чтобы раскрыть агентов.

Макро-Оркестратор
LangGraph + PostgresSaver
Supervisor / Watchdog
резюмирует графы
Детерм. шедулер
расписание задач
HITL-подсистема
человек в контуре
WB API-Gateway Redis token-bucket 3 req / 20s на аккаунт + распределённый circuit breaker
D1

Продажи и аналитика WB

8 агентов
  • Data Collector — сбор данных WB
  • Unit-Economics / P&L — CM1 / CM2 / CM3
  • ABC / XYZ — классификация ассортимента
  • Forecaster — прогноз спроса
  • Repricer — Action-Aware, знает акции WB и СПП
  • Push-Hold-Cut — решения по позициям
  • Монитор акций — отслеживание промо
  • Sales Narrator — LLM-нарратив продаж
наведите для раскрытия
D2

Финансы и банкинг

9 агентов
  • Settlement Parser — Python; LLM НЕ извлекает суммы
  • Normalizer — нормализация данных
  • Ledger Posting Engine — blnk, неизменяемые двойные проводки
  • Reconciliation — materiality-порог
  • Cash-Flow Forecaster — 13-week
  • Tax Engine РФ — УСН 6/15% / ОСН / НДС
  • Payment-Intent Service — state machine + HITL
  • Price-Change Validator — валидация цен
  • Financial Reporter — LLM-отчётность
наведите для раскрытия
D3

Рекомендации и конкуренты

6 агентов
  • Trend Spotter — поиск трендов
  • Niche Validator — валидация ниш
  • Competitor Monitor — мониторинг конкурентов
  • Review Intelligence — LLM + защита от prompt injection
  • Gap Finder — поиск пробелов рынка
  • Price Intelligence — ценовая разведка
наведите для раскрытия
D4

Производство, заказы, документы

7 агентов
  • Production Planner — POQ + HITL
  • Orders / Supply — ROP, SS
  • Честный знак — ГИС МТ, КИЗы (юр. блокер для одежды в РФ)
  • Монитор штрафов / габаритов
  • Document Extractor — LLM + sanitization
  • 3-Way Match — сверка документов
  • Doc Archivist — Paperless-ngx
наведите для раскрытия
D5

Маркетинг и трафик

5 агентов
  • PPC Agent — ВБ.Продвижение; смена >20% → HITL
  • Content Factory — производство контента
  • Attribution — ВБ.Ссылки / UTM + Метрика
  • Influencer Outreach — работа с блогерами
  • Review / Q&A Responder — ответы на отзывы
наведите для раскрытия
D6

Данные и платформа

общий слой
  • PostgreSQL — источник правды
  • Redis / Valkey — Streams + DLQ
  • MCP-слой — интеграции инструментов
  • A2A через Shared State — обмен между агентами
наведите для раскрытия
03 / 09
Принцип №1

Отказоустойчивость по построению

Главная инженерная проблема мультиагентных систем — накопление ошибок. Цепочка из 20 шагов по 95% надёжности успешна лишь в 36% случаев. Polmani проектируется так, чтобы этого не происходило.

95%
20 последовательных шагов · 95% надёжности каждый = 36% общего успеха. Без защиты ошибки перемножаются. Поэтому каждый шаг изолирован, проверен и восстановим.
0.9520 ≈ 0.358
01

Декомпозиция в DAG

Атомарные подзадачи; каждый выход проверяется до входа в следующий шаг.

02

«Закалка» с начала

Inspector, идемпотентность, reconciliation, schema-валидация заложены уже в Ф0–Ф1.

03

Inspector Pattern

Проверка на другом семействе моделей. Для денег D2 — Python-инварианты.

04

Consensus voting

5 сэмплов на важных текстовых решениях: ошибка падает с 5% до 0.11%.

05

Триада на вызов

Распределённый circuit breaker (Redis) + backoff с jitter + DLQ.

06

Глобальный WB Gateway

Token-bucket 3 req/20s на аккаунт + общий circuit breaker.

07

HITL-подсистема

SLA, эскалация, batch-approve, graduated autonomy — полноценный контур.

08

Supervisor / Watchdog

Checkpointing ≠ durable execution: Watchdog резюмирует графы; на горизонте Temporal.

04 / 09
Деньги

Деньги никогда не считает LLM

Любое денежное движение проходит через детерминированную state machine с обязательным HITL. LLM не извлекает суммы и не выполняет арифметику — это делает Python.

draft proposed approved queued submitted bank_pending executed rejected reconciled exception

exception — аварийный выход; submitted может идти напрямую в executed / rejected. Переходы детерминированы, каждое движение требует подтверждения через HITL.

РСБУ финансовое ядро РФ

19входящий НДС
41товары
44расходы на продажу
50касса
51расчётный счёт
68НДС к уплате
76.WBagent-счёт; gross = deductions + payout, закрывается в 0
90выручка 90.1 / себестоимость 90.2 / НДС-субсчёт 90.3

Gross-inclusive НДС 20/120. Двойные неизменяемые проводки через blnk.

Верифицированная математика

0
Safety Stock combined
0
SS demand-only
0
POQ
0
EOQ

Accrual: expected_buyout_qty = sent × 0.166. Все формулы вычисляются Python до передачи LLM.

05 / 09
Open-source и лицензии

Зрелый стек, прошедший детские болезни

Интегрируем только зрелые open-source модели и компоненты. Лицензионная чистота проверяется реальным CI на каждом коммите — версии пинуются, несовместимые лицензии блокируются.

LangGraph
MIT

Оркестрация графов агентов

PostgreSQL
PostgreSQL License

Источник правды, хранилище состояния

blnk
Apache-2.0

Canonical ledger, двойные проводки

Redis → Valkey
BSD-3

Streams, DLQ, token-bucket

Qdrant
Apache-2.0

Векторный поиск (вне MVP)

Prophet
MIT

Прогноз спроса (только бенчмарк)

Paperless-ngx
GPL3

Архив документов

OTel · Prometheus · Grafana
Apache-2.0

Наблюдаемость и метрики

Langfuse
MIT

Трассировка LLM

Inspector текстовых агентов: Qwen2.5-32B-Instruct (Apache-2.0) — primary; резерв — Llama-3.3-70B и DeepSeek-V3. Anthropic в проде не используется.
License gate.ci/check_licenses.py
PASSLangGraph 0.2.x— MIT, версия запинена
PASSblnk— Apache-2.0, веса/код проверены
BLOCKDeepSeek-V3 release 2024-12— DeepSeek License Agreement, не MIT; требуется ≥ 2025-03
PASSLlama-3.3-70B— attribution «Built with Llama», Community License < 700M MAU

Убрано из ядра: CrewAI (лишний слой отказа); CatVTON / IDM-VTON (некоммерческая CC BY-NC-SA).

06 / 09
Roadmap

Восемь фаз: от фундамента к автономному маркетингу

Сначала закладываются деньги и отказоустойчивость, затем рост и аналитика, дашборд, AI-кодеры и production. Финальная фаза — автономный маркетинг-отдел.

Ф0

Фундамент

~1.5 нед

PostgreSQL + WB Data Collector + Redis + скелет LangGraph + idempotency + DLQ + OTel.

Ф1

Деньги

~3 нед

D2 Финансы + ledger + payment-intent SM + outbox + reconciliation + D1 P&L / репрайсер + HITL.

Ф2

Рост

~2 нед

D3 Рекомендации + D4 Производство / документы + Честный знак + Langfuse.

Ф3

Аналитические агенты

~4 нед

Углублённая аналитика по всем департаментам.

Ф4

Масштабируемый дашборд

~5 нед · параллельно Ф3

Next.js + Tremor / Recharts + FastAPI + ClickHouse.

Ф5

AI-агенты-кодеры + CI/CD

~3 нед

Автоматизация разработки и пайплайнов.

Ф6

Production + оптимизация

~3 нед

SLO 99.9%, снижение стоимости на 15%.

Ф8

Автономный маркетинг-отдел

11 агентов

Trend → Trend-Jacking → Compliance → Scriptwriter → Critic → Visual (Flux LoRA + Leffa) → Producer → Audio Overlay → Publisher → SEO → Analyst.

07 / 09
Контроль качества

Консилиум: 6 раундов adversarial-ревью

Архитектура и код прошли шесть раундов консилиума из критиков на разных семействах моделей. Критики ловили «false-close» — например, payment outbox INSERT без business_key упал бы на DDL. Все правки проверены в реальном коде и DDL, не в changelog.

0
ВЕРИФИКАТОР · OPUS 4.8
Раунд 1
8.375
Раунд 3
8.70
Раунд 5
9.00
Финал
9.60
Opus 4.8 GPT-5.5 GPT-5.4 Gemini 3.1 Pro
Финальный верификатор Opus 4.8 — 9.6/10: все 6 фиксов найдены в реальном коде, ни одного blocker или major. Средний балл вырос с 8.375 до 9.6.
08 / 09
Итог

Платформа, которая растёт агентами и не падает

Принцип №1 — отказоустойчивость Принцип №2 — рост агентами, не людьми

Перевёрнутый Nexus, направленный на один растущий Wildberries-бизнес.