fix(flags): added cache invalidation

This commit is contained in:
ITQ
2026-02-24 19:30:19 +03:00
parent 1c7753b71e
commit 2056041ee2
5 changed files with 27 additions and 4 deletions
+3 -2
View File
@@ -14,7 +14,7 @@
| ADR-08 | Conflict domains (`mutual_exclusion`, `priority`) | Детерминированное разрешение пересечений экспериментов | Дополнительные проверки на старте и в decide |
| ADR-09 | Базовая observability (`health`, `ready`, `/metrics`, JSON logs) | Проверяемость B9 и эксплуатационная диагностика | SLA readiness подтверждается только live-demo |
| ADR-10 | Проверка качества через `just` и автотесты | Воспроизводимая верификация B1/B8/B10 | - |
| ADR-11 | Кэш результата `decide` в cache backend (Redis/Valkey в целевом окружении) | Снизить CPU/DB в hot-path | Ниже latency на повторяющихся запросах; риск stale-ответа в рамках TTL |
| ADR-11 | Кэш результата `decide` в cache backend (Redis/Valkey в целевом окружении) | Снизить CPU/DB в hot-path | Ниже latency на повторяющихся запросах; stale-риск снижен revision-aware cache key и инвалидацией `flag:{key}` при обновлении default |
| ADR-12 | Режим записи `Decision`: `sync\|async\|disabled`; async через `events.persist_decision`; `experiment_assigned` всегда sync | Снять write-pressure с hot-path без потери атрибуции | В `async` режиме нужна стабильность broker/worker и мониторинг очереди |
| ADR-13 | RBAC через роли `admin/experimenter/approver/viewer` + JWT bearer + endpoint guards | Выполнение требований доступа и ревью-ответственности из раздела 0 ТЗ | Вся авторизация централизована в role guards; нужен контроль качества секретов JWT в окружении |
| ADR-14 | Типизированные feature flags (`string/boolean/integer`) и публичный контракт обновления только `default_value` | Исключить несогласованные значения флагов и обеспечить безопасные переключения без релиза | Смена `key/value_type` решается созданием нового флага и миграцией использования |
@@ -33,12 +33,13 @@
- Для `requires_exposure=True` событие без exposure не атрибутируется сразу: уходит в `PendingEvent`, промотируется после прихода exposure, затем очищается по TTL.
- Одна метрика не может быть прикреплена к эксперименту дважды (`unique_experiment_metric`).
- `Learning` хранится в one-to-one связи с экспериментом.
- После `FeatureFlag.default_value` update удаляется cache key `flag:{key}`; следующий `decide` читает актуальный flag из DB.
## Ключевые риски
| Риск | Проявление | Смягчение | Остаток |
|---|---|---|---|
| Stale ответ из кэша `decide` | Кратковременный возврат устаревшего результата в пределах TTL | Revision-aware cache key + короткий TTL | Низкий/средний |
| Stale ответ из кэша `decide` | Кратковременный возврат устаревшего результата в пределах TTL | Revision-aware cache key + инвалидация `flag:{key}` при update default + короткий TTL | Низкий |
| Потеря throughput при проблемах Celery в `async` | Очередь растёт, запись `Decision` отстаёт | Режимы `sync|async|disabled`, force-sync для `experiment_assigned`, fallback на sync при ошибке enqueue | Средний |
| Тяжёлые запросы отчётов на больших данных | Рост latency для percentile/агрегаций | DB aggregate + `Subquery`, фильтрация attributed событий, индексы | Средний |
| Потеря отложенных атрибуций | `PendingEvent` истекает до прихода exposure | TTL 7 дней + cleanup + промоция при exposure | Средний |
+1 -1
View File
@@ -2,7 +2,7 @@
## Decide (`apps/decision/services.py`)
1. `flag` из cache/DB.
1. `flag` из cache/DB; при `FeatureFlag.default_value` update удаляется `flag:{key}`.
2. `active_experiment` из cache/DB.
3. Формируется cache key результата (`flag`, `subject`, digest атрибутов, ревизии `flag/experiment`).
4. При cache hit возвращается тот же outcome/reason/value с новым `decision_id`.
+1 -1
View File
@@ -11,7 +11,7 @@
| `D.3` | `B1-3` | Скрытые ручные шаги делают запуск невоспроизводимым | `RUNBOOK.md`, `compose.yaml`, `compose.prod.yaml` | Полный прогон по runbook на стенде | Чистое окружение и runtime-сервисы | частично (live-demo) |
| `3.7` | `B1-4` | Сервис может стартовать, но быть неготовым к запросам | `src/backend/api/urls.py` (`/health`, `/ready`) | Runtime `curl /health` и `curl /ready` | Поднятый backend и зависимости | частично (live-demo) |
| `D.5` | `B1-5` | Без e2e happy-path нельзя доказать работоспособность | `src/backend/tests/integration/test_happy_path.py`, `src/backend/tests/integration/test_api_contract.py` | `cd src/backend && just test` | Тестовые фикстуры и встроенный test DB | подтверждено |
| `1.3, 3.4` | `B2-1` | Возврат не-default без активного эксперимента искажает контроль | `src/backend/apps/decision/services.py` | `apps.decision.tests.test_decide.DecideForFlagTest.test_no_active_experiment` | Флаг с default и без running эксперимента | подтверждено |
| `1.3, 3.4` | `B2-1` | Возврат не-default без активного эксперимента искажает контроль | `src/backend/apps/decision/services.py`, `src/backend/apps/flags/services.py` | `apps.decision.tests.test_decide.DecideForFlagTest.test_no_active_experiment`, `apps.flags.tests.test_flags.FeatureFlagServiceTest.test_update_default_invalidates_decide_flag_cache` | Флаг с default и без running эксперимента; update `default_value` на том же флаге | подтверждено |
| `1.3, 2.7` | `B2-2` | Пользователь вне таргетинга не должен получать variant | `src/backend/apps/decision/services.py`, `src/backend/libs/dsl/*` | `apps.decision.tests.test_decide.TargetingRulesTest.test_targeting_fail_returns_default` | Эксперимент с targeting rules и mismatching subject | подтверждено |
| `1.3, 3.4` | `B2-3` | При применимом эксперименте нужен variant, а не default | `src/backend/apps/decision/services.py` | `apps.decision.tests.test_decide.DecideForFlagTest.test_running_experiment_assigns_variant` | Running experiment с вариантами | подтверждено |
| `3.5.1` | `B2-4` | Нестабильная выдача ломает статистику и UX | `src/backend/apps/decision/services.py` (`_hash_subject`) | `apps.decision.tests.test_decide.DecideForFlagTest.test_deterministic_assignment` | Повторные вызовы для одного subject | подтверждено |
+7
View File
@@ -1,8 +1,13 @@
from django.core.cache import cache
from django.core.exceptions import ValidationError
from apps.flags.models import FeatureFlag, FeatureFlagType
def _flag_cache_key(flag_key: str) -> str:
return f"flag:{flag_key}"
def feature_flag_create(
*,
key: str,
@@ -28,6 +33,7 @@ def feature_flag_create(
default_value=default_value,
)
flag.save()
cache.delete(_flag_cache_key(flag.key))
return flag
@@ -38,4 +44,5 @@ def feature_flag_update_default(
) -> FeatureFlag:
flag.default_value = default_value
flag.save(update_fields=["default_value", "updated_at"])
cache.delete(_flag_cache_key(flag.key))
return flag
@@ -1,6 +1,7 @@
from django.core.exceptions import ValidationError
from django.test import TestCase
from apps.decision.services import decide_for_flag
from apps.flags.models import (
FeatureFlagType,
validate_value_for_type,
@@ -159,6 +160,20 @@ class FeatureFlagServiceTest(TestCase):
with self.assertRaises(ValidationError):
feature_flag_update_default(flag=flag, default_value="bad")
def test_update_default_invalidates_decide_flag_cache(self) -> None:
flag = feature_flag_create(
key="svc_upd_cache",
name="Update Cache",
value_type=FeatureFlagType.STRING,
default_value="old",
)
first = decide_for_flag(flag.key, "svc_subj_1", {})
self.assertEqual(first["value"], "old")
feature_flag_update_default(flag=flag, default_value="new")
second = decide_for_flag(flag.key, "svc_subj_2", {})
self.assertEqual(second["reason"], "no_active_experiment")
self.assertEqual(second["value"], "new")
class FeatureFlagSelectorTest(TestCase):
def test_list_all(self) -> None: