Files
Lotty/ADR/06-operations.md
2026-02-24 17:53:14 +03:00

1.1 KiB

6. Эксплуатация и наблюдаемость

Endpoints

  • /health -> liveness (health_check.Memory).
  • /ready -> readiness (Cache, Database, Storage, Celery Ping).
  • /metrics -> Prometheus metrics.

SLA ready <= 180s подтверждается только live-demo.

Метрики и логи

  • Инфраструктурные метрики через django-prometheus middleware.
  • Бизнес-счётчики: lotty_decide_requests_total, lotty_events_ingested_total.
  • Production logs: JSON + Correlation-ID (django-guid).

Celery задачи

Периодические:

  • guardrails.check_all - 60s.
  • notifications.flush_pending - 30s.
  • events.cleanup_expired_pending - 3600s.

По запросу:

  • events.persist_decision - асинхронная запись Decision при DECISION_WRITE_MODE=async.

Runtime knobs

  • DECISION_RESULT_CACHE_TTL_SECONDS (по умолчанию 60).
  • DECISION_WRITE_MODE (sync|async|disabled, по умолчанию sync).

Команды

cd src/backend && just run|test|test-coverage|lint|format