From 15d80532e067e33e65458803b0eb1041bd2005d3 Mon Sep 17 00:00:00 2001
From: ITQ <itq.dev@ya.ru>
Date: Mon, 23 Feb 2026 11:48:03 +0300
Subject: [PATCH] test(integration): added integration tests

---
 src/backend/justfile                          |   5 +
 src/backend/tests/__init__.py                 |   0
 src/backend/tests/integration/__init__.py     |   0
 .../tests/integration/test_api_contract.py    | 231 +++++++++++
 src/backend/tests/integration/test_events.py  | 323 +++++++++++++++
 .../tests/integration/test_guardrails.py      | 290 +++++++++++++
 .../tests/integration/test_happy_path.py      | 218 ++++++++++
 .../tests/integration/test_negative.py        | 389 ++++++++++++++++++
 8 files changed, 1456 insertions(+)
 create mode 100644 src/backend/tests/__init__.py
 create mode 100644 src/backend/tests/integration/__init__.py
 create mode 100644 src/backend/tests/integration/test_api_contract.py
 create mode 100644 src/backend/tests/integration/test_events.py
 create mode 100644 src/backend/tests/integration/test_guardrails.py
 create mode 100644 src/backend/tests/integration/test_happy_path.py
 create mode 100644 src/backend/tests/integration/test_negative.py

diff --git a/src/backend/justfile b/src/backend/justfile
index 7afb740..6711e51 100644
--- a/src/backend/justfile
+++ b/src/backend/justfile
@@ -51,6 +51,11 @@ mypy:
 test:
     @ uv run python manage.py test
 
+# run integration tests
+[group('test')]
+test-integration:
+    @ uv run python manage.py test tests.integration
+
 # run tests with coverage report
 [group('test')]
 test-coverage:
diff --git a/src/backend/tests/__init__.py b/src/backend/tests/__init__.py
new file mode 100644
index 0000000..e69de29
diff --git a/src/backend/tests/integration/__init__.py b/src/backend/tests/integration/__init__.py
new file mode 100644
index 0000000..e69de29
diff --git a/src/backend/tests/integration/test_api_contract.py b/src/backend/tests/integration/test_api_contract.py
new file mode 100644
index 0000000..b6b7c79
--- /dev/null
+++ b/src/backend/tests/integration/test_api_contract.py
@@ -0,0 +1,231 @@
+import json
+import uuid
+from decimal import Decimal
+from typing import override
+
+from django.core.cache import cache
+from django.test import Client, TestCase
+from django.urls import reverse
+from django.utils import timezone
+
+from apps.events.tests.helpers import make_event_type, make_exposure_type
+from apps.experiments.services import (
+    experiment_approve,
+    experiment_start,
+    experiment_submit_for_review,
+)
+from apps.experiments.tests.helpers import add_two_variants, make_experiment
+from apps.metrics.services import (
+    experiment_metric_add,
+    metric_definition_create,
+)
+from apps.reviews.services import review_settings_update
+from apps.reviews.tests.helpers import make_approver, make_experimenter
+
+
+class APIContractFlowTest(TestCase):
+    @override
+    def setUp(self) -> None:
+        cache.clear()
+        self.client = Client()
+
+        review_settings_update(
+            default_min_approvals=1,
+            allow_any_approver=True,
+        )
+
+        owner = make_experimenter("_api")
+        approver = make_approver("_api")
+
+        self.experiment = make_experiment(
+            owner=owner,
+            suffix="_api",
+            traffic_allocation=Decimal("100.00"),
+        )
+        add_two_variants(self.experiment)
+
+        self.metric = metric_definition_create(
+            key="ctr_api",
+            name="CTR",
+            metric_type="ratio",
+            direction="higher_is_better",
+            calculation_rule={
+                "numerator_event": "api_click",
+                "denominator_event": "api_exposure",
+            },
+        )
+        experiment_metric_add(
+            experiment=self.experiment,
+            metric=self.metric,
+            is_primary=True,
+        )
+
+        make_exposure_type(name="api_exposure")
+        make_event_type(
+            name="api_click",
+            display_name="Click",
+            requires_exposure=True,
+        )
+
+        self.experiment = experiment_submit_for_review(
+            experiment=self.experiment, user=owner
+        )
+        self.experiment = experiment_approve(
+            experiment=self.experiment, approver=approver
+        )
+        self.experiment = experiment_start(
+            experiment=self.experiment, user=owner
+        )
+
+    def test_decide_to_events_to_report_via_http(self) -> None:
+        decide_resp = self.client.post(
+            reverse("api-1:decide"),
+            data=json.dumps(
+                {
+                    "subject_id": "api_user_1",
+                    "flags": [self.experiment.flag.key],
+                    "subject_attributes": {},
+                }
+            ),
+            content_type="application/json",
+        )
+        self.assertEqual(decide_resp.status_code, 200)
+        decide_data = decide_resp.json()
+
+        self.assertEqual(len(decide_data["decisions"]), 1)
+        decision = decide_data["decisions"][0]
+        self.assertEqual(decision["reason"], "experiment_assigned")
+        self.assertIsNotNone(decision["decision_id"])
+        self.assertIsNotNone(decision["variant_id"])
+
+        now = timezone.now().isoformat()
+        events_resp = self.client.post(
+            reverse("api-1:ingest_events"),
+            data=json.dumps(
+                {
+                    "events": [
+                        {
+                            "event_id": "api_exp_1",
+                            "event_type": "api_exposure",
+                            "decision_id": decision["decision_id"],
+                            "subject_id": "api_user_1",
+                            "timestamp": now,
+                            "properties": {},
+                        },
+                        {
+                            "event_id": "api_click_1",
+                            "event_type": "api_click",
+                            "decision_id": decision["decision_id"],
+                            "subject_id": "api_user_1",
+                            "timestamp": now,
+                            "properties": {},
+                        },
+                    ]
+                }
+            ),
+            content_type="application/json",
+        )
+        self.assertEqual(events_resp.status_code, 200)
+        events_data = events_resp.json()
+        self.assertEqual(events_data["accepted"], 2)
+        self.assertEqual(events_data["rejected"], 0)
+        self.assertEqual(events_data["duplicates"], 0)
+
+        report_resp = self.client.get(
+            reverse(
+                "api-1:get_experiment_report",
+                args=[self.experiment.pk],
+            ),
+        )
+        self.assertEqual(report_resp.status_code, 200)
+        report = report_resp.json()
+
+        self.assertEqual(report["experiment_id"], str(self.experiment.pk))
+        total_exposures = sum(v["exposures"] for v in report["variants"])
+        self.assertEqual(total_exposures, 1)
+        self.assertEqual(len(report["variants"]), 2)
+
+        for variant in report["variants"]:
+            if variant["exposures"] > 0:
+                self.assertEqual(len(variant["metrics"]), 1)
+                self.assertEqual(
+                    variant["metrics"][0]["metric_key"], "ctr_api"
+                )
+
+    def test_decide_returns_all_requested_flags(self) -> None:
+        resp = self.client.post(
+            reverse("api-1:decide"),
+            data=json.dumps(
+                {
+                    "subject_id": "api_user_2",
+                    "flags": [
+                        self.experiment.flag.key,
+                        "nonexistent_flag",
+                    ],
+                }
+            ),
+            content_type="application/json",
+        )
+        self.assertEqual(resp.status_code, 200)
+        data = resp.json()
+
+        self.assertEqual(len(data["decisions"]), 2)
+        reasons = {d["flag"]: d["reason"] for d in data["decisions"]}
+        self.assertEqual(
+            reasons[self.experiment.flag.key], "experiment_assigned"
+        )
+        self.assertEqual(reasons["nonexistent_flag"], "flag_not_found")
+
+    def test_events_dedup_via_http(self) -> None:
+        cache.clear()
+        decide_resp = self.client.post(
+            reverse("api-1:decide"),
+            data=json.dumps(
+                {
+                    "subject_id": "api_user_3",
+                    "flags": [self.experiment.flag.key],
+                }
+            ),
+            content_type="application/json",
+        )
+        decision = decide_resp.json()["decisions"][0]
+        now = timezone.now().isoformat()
+
+        event_payload = json.dumps(
+            {
+                "events": [
+                    {
+                        "event_id": "api_ddup_1",
+                        "event_type": "api_exposure",
+                        "decision_id": decision["decision_id"],
+                        "subject_id": "api_user_3",
+                        "timestamp": now,
+                        "properties": {},
+                    }
+                ]
+            }
+        )
+
+        r1 = self.client.post(
+            reverse("api-1:ingest_events"),
+            data=event_payload,
+            content_type="application/json",
+        )
+        self.assertEqual(r1.json()["accepted"], 1)
+
+        r2 = self.client.post(
+            reverse("api-1:ingest_events"),
+            data=event_payload,
+            content_type="application/json",
+        )
+        self.assertEqual(r2.json()["duplicates"], 1)
+        self.assertEqual(r2.json()["accepted"], 0)
+
+    def test_report_404_for_unknown_experiment(self) -> None:
+        resp = self.client.get(
+            reverse(
+                "api-1:get_experiment_report",
+                args=[uuid.uuid4()],
+            ),
+        )
+        self.assertEqual(resp.status_code, 404)
diff --git a/src/backend/tests/integration/test_events.py b/src/backend/tests/integration/test_events.py
new file mode 100644
index 0000000..4c27c8e
--- /dev/null
+++ b/src/backend/tests/integration/test_events.py
@@ -0,0 +1,323 @@
+from decimal import Decimal
+from typing import override
+
+from django.core.cache import cache
+from django.test import TestCase
+from django.utils import timezone
+
+from apps.decision.services import decide_for_flag
+from apps.events.models import Exposure, PendingEvent
+from apps.events.services import process_events_batch
+from apps.events.tests.helpers import make_event_type, make_exposure_type
+from apps.experiments.services import (
+    experiment_approve,
+    experiment_start,
+    experiment_submit_for_review,
+)
+from apps.experiments.tests.helpers import add_two_variants, make_experiment
+from apps.metrics.services import (
+    experiment_metric_add,
+    metric_definition_create,
+)
+from apps.reports.services import build_experiment_report
+from apps.reviews.services import review_settings_update
+from apps.reviews.tests.helpers import make_approver, make_experimenter
+
+
+class OutOfOrderAttributionTest(TestCase):
+    @override
+    def setUp(self) -> None:
+        cache.clear()
+        review_settings_update(
+            default_min_approvals=1,
+            allow_any_approver=True,
+        )
+        self.owner = make_experimenter("_ooa")
+        self.approver = make_approver("_ooa")
+
+        self.experiment = make_experiment(
+            owner=self.owner,
+            suffix="_ooa",
+            traffic_allocation=Decimal("100.00"),
+        )
+        add_two_variants(self.experiment)
+
+        self.metric = metric_definition_create(
+            key="conv_ooa",
+            name="Conversion",
+            metric_type="count",
+            direction="higher_is_better",
+            calculation_rule={"event": "ooa_purchase"},
+        )
+        experiment_metric_add(
+            experiment=self.experiment,
+            metric=self.metric,
+            is_primary=True,
+        )
+
+        make_exposure_type(name="ooa_exposure")
+        make_event_type(
+            name="ooa_purchase",
+            display_name="Purchase",
+            requires_exposure=True,
+        )
+
+        self.experiment = experiment_submit_for_review(
+            experiment=self.experiment, user=self.owner
+        )
+        self.experiment = experiment_approve(
+            experiment=self.experiment, approver=self.approver
+        )
+        self.experiment = experiment_start(
+            experiment=self.experiment, user=self.owner
+        )
+
+    def test_conversion_before_exposure_goes_to_pending(self) -> None:
+        cache.clear()
+        d = decide_for_flag("flag_ooa", "user_ooa_1", {})
+        now = timezone.now().isoformat()
+
+        result = process_events_batch(
+            [
+                {
+                    "event_id": "ooa_conv_1",
+                    "event_type": "ooa_purchase",
+                    "decision_id": d["decision_id"],
+                    "subject_id": "user_ooa_1",
+                    "timestamp": now,
+                    "properties": {},
+                }
+            ]
+        )
+        self.assertEqual(result.accepted, 1)
+        self.assertTrue(
+            PendingEvent.objects.filter(event_id="ooa_conv_1").exists()
+        )
+
+    def test_pending_event_promoted_on_exposure_arrival(self) -> None:
+        cache.clear()
+        d = decide_for_flag("flag_ooa", "user_ooa_2", {})
+        now = timezone.now().isoformat()
+
+        process_events_batch(
+            [
+                {
+                    "event_id": "ooa_conv_2",
+                    "event_type": "ooa_purchase",
+                    "decision_id": d["decision_id"],
+                    "subject_id": "user_ooa_2",
+                    "timestamp": now,
+                    "properties": {},
+                }
+            ]
+        )
+
+        self.assertTrue(
+            PendingEvent.objects.filter(event_id="ooa_conv_2").exists()
+        )
+
+        result = process_events_batch(
+            [
+                {
+                    "event_id": "ooa_exp_2",
+                    "event_type": "ooa_exposure",
+                    "decision_id": d["decision_id"],
+                    "subject_id": "user_ooa_2",
+                    "timestamp": now,
+                    "properties": {},
+                }
+            ]
+        )
+        self.assertEqual(result.accepted, 1)
+
+        self.assertFalse(
+            PendingEvent.objects.filter(event_id="ooa_conv_2").exists()
+        )
+
+    def test_promoted_event_appears_in_report(self) -> None:
+        cache.clear()
+        d = decide_for_flag("flag_ooa", "user_ooa_3", {})
+        now = timezone.now().isoformat()
+
+        process_events_batch(
+            [
+                {
+                    "event_id": "ooa_conv_3",
+                    "event_type": "ooa_purchase",
+                    "decision_id": d["decision_id"],
+                    "subject_id": "user_ooa_3",
+                    "timestamp": now,
+                    "properties": {},
+                }
+            ]
+        )
+        process_events_batch(
+            [
+                {
+                    "event_id": "ooa_exp_3",
+                    "event_type": "ooa_exposure",
+                    "decision_id": d["decision_id"],
+                    "subject_id": "user_ooa_3",
+                    "timestamp": now,
+                    "properties": {},
+                }
+            ]
+        )
+
+        report = build_experiment_report(self.experiment)
+        total_exposures = sum(v["exposures"] for v in report["variants"])
+        self.assertEqual(total_exposures, 1)
+
+
+class EventDeduplicationTest(TestCase):
+    @override
+    def setUp(self) -> None:
+        cache.clear()
+        review_settings_update(
+            default_min_approvals=1,
+            allow_any_approver=True,
+        )
+        self.owner = make_experimenter("_ded")
+        self.approver = make_approver("_ded")
+
+        self.experiment = make_experiment(
+            owner=self.owner,
+            suffix="_ded",
+            traffic_allocation=Decimal("100.00"),
+        )
+        add_two_variants(self.experiment)
+
+        make_exposure_type(name="ded_exposure")
+
+        self.experiment = experiment_submit_for_review(
+            experiment=self.experiment, user=self.owner
+        )
+        self.experiment = experiment_approve(
+            experiment=self.experiment, approver=self.approver
+        )
+        self.experiment = experiment_start(
+            experiment=self.experiment, user=self.owner
+        )
+
+    def test_duplicate_exposure_not_counted_twice(self) -> None:
+        cache.clear()
+        d = decide_for_flag("flag_ded", "user_dup", {})
+        now = timezone.now().isoformat()
+
+        event = {
+            "event_id": "ded_same_id",
+            "event_type": "ded_exposure",
+            "decision_id": d["decision_id"],
+            "subject_id": "user_dup",
+            "timestamp": now,
+            "properties": {},
+        }
+
+        r1 = process_events_batch([event])
+        self.assertEqual(r1.accepted, 1)
+
+        r2 = process_events_batch([event])
+        self.assertEqual(r2.duplicates, 1)
+        self.assertEqual(r2.accepted, 0)
+
+        exposures = Exposure.objects.filter(
+            decision_id=d["decision_id"],
+        )
+        self.assertEqual(exposures.count(), 1)
+
+    def test_deduplication_prevents_metric_inflation(self) -> None:
+        cache.clear()
+        d = decide_for_flag("flag_ded", "user_infl", {})
+        now = timezone.now().isoformat()
+
+        event = {
+            "event_id": "ded_infl_id",
+            "event_type": "ded_exposure",
+            "decision_id": d["decision_id"],
+            "subject_id": "user_infl",
+            "timestamp": now,
+            "properties": {},
+        }
+
+        process_events_batch([event])
+        process_events_batch([event])
+        process_events_batch([event])
+
+        report = build_experiment_report(self.experiment)
+        total_exposures = sum(v["exposures"] for v in report["variants"])
+        self.assertEqual(total_exposures, 1)
+
+
+class ConversionWithoutExposureTest(TestCase):
+    @override
+    def setUp(self) -> None:
+        cache.clear()
+        review_settings_update(
+            default_min_approvals=1,
+            allow_any_approver=True,
+        )
+        self.owner = make_experimenter("_cwe")
+        self.approver = make_approver("_cwe")
+
+        self.experiment = make_experiment(
+            owner=self.owner,
+            suffix="_cwe",
+            traffic_allocation=Decimal("100.00"),
+        )
+        add_two_variants(self.experiment)
+
+        self.metric = metric_definition_create(
+            key="conv_cwe",
+            name="Conversion",
+            metric_type="count",
+            direction="higher_is_better",
+            calculation_rule={"event": "cwe_purchase"},
+        )
+        experiment_metric_add(
+            experiment=self.experiment,
+            metric=self.metric,
+            is_primary=True,
+        )
+
+        make_exposure_type(name="cwe_exposure")
+        make_event_type(
+            name="cwe_purchase",
+            display_name="Purchase",
+            requires_exposure=True,
+        )
+
+        self.experiment = experiment_submit_for_review(
+            experiment=self.experiment, user=self.owner
+        )
+        self.experiment = experiment_approve(
+            experiment=self.experiment, approver=self.approver
+        )
+        self.experiment = experiment_start(
+            experiment=self.experiment, user=self.owner
+        )
+
+    def test_unresolved_pending_event_not_in_report(self) -> None:
+        cache.clear()
+        d = decide_for_flag("flag_cwe", "user_no_exp", {})
+        now = timezone.now().isoformat()
+
+        process_events_batch(
+            [
+                {
+                    "event_id": "cwe_conv_only",
+                    "event_type": "cwe_purchase",
+                    "decision_id": d["decision_id"],
+                    "subject_id": "user_no_exp",
+                    "timestamp": now,
+                    "properties": {},
+                }
+            ]
+        )
+
+        self.assertTrue(
+            PendingEvent.objects.filter(event_id="cwe_conv_only").exists()
+        )
+
+        report = build_experiment_report(self.experiment)
+        total_exposures = sum(v["exposures"] for v in report["variants"])
+        self.assertEqual(total_exposures, 0)
diff --git a/src/backend/tests/integration/test_guardrails.py b/src/backend/tests/integration/test_guardrails.py
new file mode 100644
index 0000000..7a3e9ca
--- /dev/null
+++ b/src/backend/tests/integration/test_guardrails.py
@@ -0,0 +1,290 @@
+from decimal import Decimal
+from typing import override
+
+from django.core.cache import cache
+from django.test import TestCase
+from django.utils import timezone
+
+from apps.decision.services import decide_for_flag
+from apps.events.services import process_events_batch
+from apps.events.tests.helpers import make_event_type, make_exposure_type
+from apps.experiments.models import ExperimentOutcome, ExperimentStatus
+from apps.experiments.services import (
+    experiment_approve,
+    experiment_start,
+    experiment_submit_for_review,
+)
+from apps.experiments.tests.helpers import add_two_variants, make_experiment
+from apps.guardrails.models import GuardrailAction, GuardrailTrigger
+from apps.guardrails.services import (
+    check_all_running_experiments,
+    check_experiment_guardrails,
+    guardrail_create,
+)
+from apps.metrics.services import (
+    experiment_metric_add,
+    metric_definition_create,
+)
+from apps.reviews.services import review_settings_update
+from apps.reviews.tests.helpers import make_approver, make_experimenter
+
+
+def _start_experiment(owner, approver, suffix, traffic=Decimal("100.00")):
+    experiment = make_experiment(
+        owner=owner,
+        suffix=suffix,
+        traffic_allocation=traffic,
+    )
+    add_two_variants(experiment)
+    experiment = experiment_submit_for_review(
+        experiment=experiment, user=owner
+    )
+    experiment = experiment_approve(experiment=experiment, approver=approver)
+    return experiment_start(experiment=experiment, user=owner)
+
+
+class GuardrailPauseIntegrationTest(TestCase):
+    @override
+    def setUp(self) -> None:
+        cache.clear()
+        review_settings_update(
+            default_min_approvals=1,
+            allow_any_approver=True,
+        )
+        self.owner = make_experimenter("_gpi")
+        self.approver = make_approver("_gpi")
+
+        self.experiment = _start_experiment(self.owner, self.approver, "_gpi")
+
+        self.error_metric = metric_definition_create(
+            key="error_rate_gpi",
+            name="Error Rate",
+            metric_type="ratio",
+            direction="lower_is_better",
+            calculation_rule={
+                "numerator_event": "gpi_error",
+                "denominator_event": "gpi_exposure",
+            },
+        )
+        experiment_metric_add(
+            experiment=self.experiment,
+            metric=self.error_metric,
+        )
+
+        make_exposure_type(name="gpi_exposure")
+        make_event_type(name="gpi_error", display_name="Error")
+
+        guardrail_create(
+            experiment=self.experiment,
+            metric=self.error_metric,
+            threshold=Decimal("0.10"),
+            observation_window_minutes=60,
+            action=GuardrailAction.PAUSE,
+        )
+
+    def test_guardrail_pauses_experiment_on_threshold_breach(self) -> None:
+        now = timezone.now().isoformat()
+        cache.clear()
+        d = decide_for_flag("flag_gpi", "user_gp1", {})
+        self.assertEqual(d["reason"], "experiment_assigned")
+
+        process_events_batch(
+            [
+                {
+                    "event_id": "gpi_exp_1",
+                    "event_type": "gpi_exposure",
+                    "decision_id": d["decision_id"],
+                    "subject_id": "user_gp1",
+                    "timestamp": now,
+                    "properties": {},
+                },
+                {
+                    "event_id": "gpi_err_1",
+                    "event_type": "gpi_error",
+                    "decision_id": d["decision_id"],
+                    "subject_id": "user_gp1",
+                    "timestamp": now,
+                    "properties": {},
+                },
+            ]
+        )
+
+        triggers = check_experiment_guardrails(self.experiment)
+        self.assertTrue(len(triggers) > 0)
+
+        self.experiment.refresh_from_db()
+        self.assertEqual(self.experiment.status, ExperimentStatus.PAUSED)
+        self.assertTrue(
+            GuardrailTrigger.objects.filter(
+                experiment=self.experiment
+            ).exists()
+        )
+
+    def test_no_trigger_when_metric_below_threshold(self) -> None:
+        now = timezone.now().isoformat()
+        cache.clear()
+        decisions = []
+        for i in range(10):
+            cache.clear()
+            d = decide_for_flag("flag_gpi", f"user_ok_{i}", {})
+            decisions.append(d)
+
+        events = [
+            {
+                "event_id": f"gpi_ok_exp_{i}",
+                "event_type": "gpi_exposure",
+                "decision_id": d["decision_id"],
+                "subject_id": f"user_ok_{i}",
+                "timestamp": now,
+                "properties": {},
+            }
+            for i, d in enumerate(decisions)
+        ]
+        process_events_batch(events)
+
+        triggers = check_experiment_guardrails(self.experiment)
+        self.assertEqual(len(triggers), 0)
+        self.experiment.refresh_from_db()
+        self.assertEqual(self.experiment.status, ExperimentStatus.RUNNING)
+
+
+class GuardrailRollbackIntegrationTest(TestCase):
+    @override
+    def setUp(self) -> None:
+        cache.clear()
+        review_settings_update(
+            default_min_approvals=1,
+            allow_any_approver=True,
+        )
+        self.owner = make_experimenter("_gri")
+        self.approver = make_approver("_gri")
+
+        self.experiment = _start_experiment(self.owner, self.approver, "_gri")
+
+        self.crash_metric = metric_definition_create(
+            key="crash_rate_gri",
+            name="Crash Rate",
+            metric_type="ratio",
+            direction="lower_is_better",
+            calculation_rule={
+                "numerator_event": "gri_crash",
+                "denominator_event": "gri_exposure",
+            },
+        )
+        experiment_metric_add(
+            experiment=self.experiment,
+            metric=self.crash_metric,
+        )
+
+        make_exposure_type(name="gri_exposure")
+        make_event_type(name="gri_crash", display_name="Crash")
+
+        guardrail_create(
+            experiment=self.experiment,
+            metric=self.crash_metric,
+            threshold=Decimal("0.05"),
+            action=GuardrailAction.ROLLBACK,
+        )
+
+    def test_rollback_completes_experiment_with_control_winner(self) -> None:
+        now = timezone.now().isoformat()
+        cache.clear()
+        d = decide_for_flag("flag_gri", "user_rb1", {})
+
+        process_events_batch(
+            [
+                {
+                    "event_id": "gri_exp_1",
+                    "event_type": "gri_exposure",
+                    "decision_id": d["decision_id"],
+                    "subject_id": "user_rb1",
+                    "timestamp": now,
+                    "properties": {},
+                },
+                {
+                    "event_id": "gri_crash_1",
+                    "event_type": "gri_crash",
+                    "decision_id": d["decision_id"],
+                    "subject_id": "user_rb1",
+                    "timestamp": now,
+                    "properties": {},
+                },
+            ]
+        )
+
+        triggers = check_experiment_guardrails(self.experiment)
+        self.assertTrue(len(triggers) > 0)
+
+        self.experiment.refresh_from_db()
+        self.assertEqual(self.experiment.status, ExperimentStatus.COMPLETED)
+
+        outcome = ExperimentOutcome.objects.get(experiment=self.experiment)
+        self.assertEqual(outcome.outcome, "rollback")
+
+
+class GuardrailCheckAllTest(TestCase):
+    @override
+    def setUp(self) -> None:
+        cache.clear()
+        review_settings_update(
+            default_min_approvals=1,
+            allow_any_approver=True,
+        )
+        self.owner = make_experimenter("_gca")
+        self.approver = make_approver("_gca")
+
+        self.exp1 = _start_experiment(self.owner, self.approver, "_gca1")
+        self.exp2 = _start_experiment(self.owner, self.approver, "_gca2")
+
+        self.metric = metric_definition_create(
+            key="err_gca",
+            name="Error",
+            metric_type="ratio",
+            direction="lower_is_better",
+            calculation_rule={
+                "numerator_event": "gca_error",
+                "denominator_event": "gca_exposure",
+            },
+        )
+        for exp in (self.exp1, self.exp2):
+            experiment_metric_add(experiment=exp, metric=self.metric)
+            guardrail_create(
+                experiment=exp,
+                metric=self.metric,
+                threshold=Decimal("0.10"),
+                action=GuardrailAction.PAUSE,
+            )
+
+        make_exposure_type(name="gca_exposure")
+        make_event_type(name="gca_error", display_name="Error")
+
+    def test_check_all_processes_multiple_experiments(self) -> None:
+        now = timezone.now().isoformat()
+
+        for suffix, _ in [("gca1", self.exp1), ("gca2", self.exp2)]:
+            cache.clear()
+            d = decide_for_flag(f"flag_{suffix}", "user_ca", {})
+            process_events_batch(
+                [
+                    {
+                        "event_id": f"{suffix}_exp",
+                        "event_type": "gca_exposure",
+                        "decision_id": d["decision_id"],
+                        "subject_id": "user_ca",
+                        "timestamp": now,
+                        "properties": {},
+                    },
+                    {
+                        "event_id": f"{suffix}_err",
+                        "event_type": "gca_error",
+                        "decision_id": d["decision_id"],
+                        "subject_id": "user_ca",
+                        "timestamp": now,
+                        "properties": {},
+                    },
+                ]
+            )
+
+        results = check_all_running_experiments()
+        self.assertEqual(results["checked"], 2)
+        self.assertGreaterEqual(results["triggered"], 1)
diff --git a/src/backend/tests/integration/test_happy_path.py b/src/backend/tests/integration/test_happy_path.py
new file mode 100644
index 0000000..888bfd2
--- /dev/null
+++ b/src/backend/tests/integration/test_happy_path.py
@@ -0,0 +1,218 @@
+from decimal import Decimal
+from typing import override
+
+from django.core.cache import cache
+from django.test import TestCase
+from django.utils import timezone
+
+from apps.decision.services import decide_for_flag
+from apps.events.services import process_events_batch
+from apps.events.tests.helpers import make_event_type, make_exposure_type
+from apps.experiments.models import ExperimentStatus
+from apps.experiments.services import (
+    experiment_approve,
+    experiment_complete,
+    experiment_create,
+    experiment_start,
+    experiment_submit_for_review,
+    variant_create,
+)
+from apps.experiments.tests.helpers import (
+    add_two_variants,
+    make_experiment,
+    make_flag,
+)
+from apps.metrics.services import (
+    experiment_metric_add,
+    metric_definition_create,
+)
+from apps.reports.services import build_experiment_report
+from apps.reviews.services import review_settings_update
+from apps.reviews.tests.helpers import make_approver, make_experimenter
+
+
+class FullHappyPathTest(TestCase):
+    @override
+    def setUp(self) -> None:
+        cache.clear()
+        review_settings_update(
+            default_min_approvals=1,
+            allow_any_approver=True,
+        )
+
+        self.owner = make_experimenter("_hp")
+        self.approver = make_approver("_hp")
+
+        self.experiment = make_experiment(
+            owner=self.owner,
+            suffix="_hp",
+            traffic_allocation=Decimal("100.00"),
+        )
+        self.v_control, self.v_treatment = add_two_variants(self.experiment)
+
+        self.metric = metric_definition_create(
+            key="ctr_hp",
+            name="CTR",
+            metric_type="ratio",
+            direction="higher_is_better",
+            calculation_rule={
+                "numerator_event": "hp_click",
+                "denominator_event": "hp_exposure",
+            },
+        )
+        experiment_metric_add(
+            experiment=self.experiment,
+            metric=self.metric,
+            is_primary=True,
+        )
+
+        make_exposure_type(name="hp_exposure")
+        make_event_type(
+            name="hp_click",
+            display_name="Click",
+            requires_exposure=True,
+        )
+
+        self.experiment = experiment_submit_for_review(
+            experiment=self.experiment, user=self.owner
+        )
+        self.experiment = experiment_approve(
+            experiment=self.experiment, approver=self.approver
+        )
+        self.experiment = experiment_start(
+            experiment=self.experiment, user=self.owner
+        )
+
+    def test_full_decide_event_report_flow(self) -> None:
+        decisions = []
+        for i in range(10):
+            cache.clear()
+            d = decide_for_flag("flag_hp", f"user_{i}", {"country": "US"})
+            self.assertEqual(d["reason"], "experiment_assigned")
+            self.assertIsNotNone(d["variant_id"])
+            decisions.append(d)
+
+        now = timezone.now().isoformat()
+        exposure_events = [
+            {
+                "event_id": f"hp_exp_{i}",
+                "event_type": "hp_exposure",
+                "decision_id": d["decision_id"],
+                "subject_id": f"user_{i}",
+                "timestamp": now,
+                "properties": {},
+            }
+            for i, d in enumerate(decisions)
+        ]
+        result = process_events_batch(exposure_events)
+        self.assertEqual(result.accepted, 10)
+
+        click_events = [
+            {
+                "event_id": f"hp_click_{i}",
+                "event_type": "hp_click",
+                "decision_id": d["decision_id"],
+                "subject_id": f"user_{i}",
+                "timestamp": now,
+                "properties": {},
+            }
+            for i, d in enumerate(decisions[:5])
+        ]
+        result = process_events_batch(click_events)
+        self.assertEqual(result.accepted, 5)
+
+        report = build_experiment_report(self.experiment)
+        self.assertEqual(str(report["experiment_id"]), str(self.experiment.pk))
+        total_exposures = sum(v["exposures"] for v in report["variants"])
+        self.assertEqual(total_exposures, 10)
+
+    def test_lifecycle_with_rollout_outcome(self) -> None:
+        cache.clear()
+        d = decide_for_flag("flag_hp", "subject_1", {})
+        self.assertEqual(d["reason"], "experiment_assigned")
+
+        self.experiment = experiment_complete(
+            experiment=self.experiment,
+            user=self.owner,
+            outcome="rollout",
+            rationale="Treatment wins",
+            winning_variant_id=str(self.v_treatment.pk),
+        )
+        self.assertEqual(self.experiment.status, ExperimentStatus.COMPLETED)
+
+    def test_decide_returns_default_after_complete(self) -> None:
+        self.experiment = experiment_complete(
+            experiment=self.experiment,
+            user=self.owner,
+            outcome="no_effect",
+            rationale="No significant difference",
+        )
+
+        cache.clear()
+        d = decide_for_flag("flag_hp", "subject_2", {})
+        self.assertEqual(d["reason"], "no_active_experiment")
+        self.assertEqual(d["value"], "a")
+
+    def test_targeting_mismatch_returns_default(self) -> None:
+        owner = make_experimenter("_tm")
+        approver = make_approver("_tm")
+
+        flag = make_flag(suffix="_tm", default="a")
+
+        exp = experiment_create(
+            flag=flag,
+            name="Targeting Test",
+            owner=owner,
+            traffic_allocation=Decimal("100.00"),
+            targeting_rules='country IN ["DE"]',
+        )
+        variant_create(
+            experiment=exp,
+            user=owner,
+            name="control",
+            value="a",
+            weight=Decimal("50.00"),
+            is_control=True,
+        )
+        variant_create(
+            experiment=exp,
+            user=owner,
+            name="treatment",
+            value="b",
+            weight=Decimal("50.00"),
+        )
+        exp = experiment_submit_for_review(experiment=exp, user=owner)
+        exp = experiment_approve(experiment=exp, approver=approver)
+        exp = experiment_start(experiment=exp, user=owner)
+
+        cache.clear()
+        d = decide_for_flag("flag_tm", "subject_3", {"country": "US"})
+        self.assertEqual(d["reason"], "targeting_mismatch")
+        self.assertEqual(d["value"], "a")
+
+    def test_report_with_period_filter(self) -> None:
+        cache.clear()
+        d = decide_for_flag("flag_hp", "user_rp", {})
+        now = timezone.now()
+
+        process_events_batch(
+            [
+                {
+                    "event_id": "hp_rp_exp",
+                    "event_type": "hp_exposure",
+                    "decision_id": d["decision_id"],
+                    "subject_id": "user_rp",
+                    "timestamp": now.isoformat(),
+                    "properties": {},
+                }
+            ]
+        )
+
+        future = now + timezone.timedelta(hours=1)
+        report = build_experiment_report(
+            self.experiment,
+            start_date=future,
+            end_date=future + timezone.timedelta(hours=1),
+        )
+        total_exposures = sum(v["exposures"] for v in report["variants"])
+        self.assertEqual(total_exposures, 0)
diff --git a/src/backend/tests/integration/test_negative.py b/src/backend/tests/integration/test_negative.py
new file mode 100644
index 0000000..3b7b015
--- /dev/null
+++ b/src/backend/tests/integration/test_negative.py
@@ -0,0 +1,389 @@
+from decimal import Decimal
+from typing import override
+
+from django.core.cache import cache
+from django.core.exceptions import ValidationError
+from django.test import TestCase
+from django.utils import timezone
+
+from apps.events.services import (
+    decision_create,
+    event_type_create,
+    process_events_batch,
+)
+from apps.experiments.models import ExperimentStatus
+from apps.experiments.services import (
+    experiment_approve,
+    experiment_complete,
+    experiment_create,
+    experiment_start,
+    experiment_submit_for_review,
+    variant_create,
+)
+from apps.experiments.tests.helpers import add_two_variants, make_flag
+from apps.reviews.services import (
+    approver_group_create,
+    review_settings_update,
+)
+from apps.reviews.tests.helpers import (
+    make_approver,
+    make_experimenter,
+    make_viewer,
+)
+from config.errors import ForbiddenError
+
+
+class InvalidLifecycleTransitionsTest(TestCase):
+    @override
+    def setUp(self) -> None:
+        cache.clear()
+        review_settings_update(
+            default_min_approvals=1,
+            allow_any_approver=True,
+        )
+        self.owner = make_experimenter("_ilt")
+        self.approver = make_approver("_ilt")
+
+    def test_cannot_start_draft_experiment(self) -> None:
+        flag = make_flag(suffix="_nsd", default="d")
+        experiment = experiment_create(
+            flag=flag,
+            name="Draft Start",
+            owner=self.owner,
+            traffic_allocation=Decimal("100.00"),
+        )
+        add_two_variants(experiment)
+
+        with self.assertRaises(ValidationError) as ctx:
+            experiment_start(experiment=experiment, user=self.owner)
+        self.assertIn("status", ctx.exception.message_dict)
+
+    def test_cannot_start_without_enough_approvals(self) -> None:
+        flag = make_flag(suffix="_nsa", default="d")
+        experiment = experiment_create(
+            flag=flag,
+            name="No Approval Start",
+            owner=self.owner,
+            traffic_allocation=Decimal("100.00"),
+        )
+        add_two_variants(experiment)
+
+        review_settings_update(
+            default_min_approvals=2,
+            allow_any_approver=True,
+        )
+        experiment = experiment_submit_for_review(
+            experiment=experiment, user=self.owner
+        )
+        experiment = experiment_approve(
+            experiment=experiment, approver=self.approver
+        )
+        self.assertEqual(experiment.status, ExperimentStatus.IN_REVIEW)
+
+        with self.assertRaises(ValidationError):
+            experiment_start(experiment=experiment, user=self.owner)
+
+    def test_cannot_submit_without_variants(self) -> None:
+        flag = make_flag(suffix="_nsv", default="d")
+        experiment = experiment_create(
+            flag=flag,
+            name="No Variants",
+            owner=self.owner,
+        )
+
+        with self.assertRaises(ValidationError) as ctx:
+            experiment_submit_for_review(
+                experiment=experiment, user=self.owner
+            )
+        self.assertIn("variants", ctx.exception.message_dict)
+
+    def test_cannot_complete_without_rationale(self) -> None:
+        flag = make_flag(suffix="_ncr", default="d")
+        experiment = experiment_create(
+            flag=flag,
+            name="No Rationale",
+            owner=self.owner,
+            traffic_allocation=Decimal("100.00"),
+        )
+        add_two_variants(experiment)
+        experiment = experiment_submit_for_review(
+            experiment=experiment, user=self.owner
+        )
+        experiment = experiment_approve(
+            experiment=experiment, approver=self.approver
+        )
+        experiment = experiment_start(experiment=experiment, user=self.owner)
+
+        with self.assertRaises(ValidationError) as ctx:
+            experiment_complete(
+                experiment=experiment,
+                user=self.owner,
+                outcome="no_effect",
+                rationale="",
+            )
+        self.assertIn("rationale", ctx.exception.message_dict)
+
+    def test_cannot_run_two_experiments_on_same_flag(self) -> None:
+        flag = make_flag(suffix="_dup", default="d")
+
+        exp1 = experiment_create(
+            flag=flag,
+            name="Exp1",
+            owner=self.owner,
+            traffic_allocation=Decimal("100.00"),
+        )
+        add_two_variants(exp1)
+        exp1 = experiment_submit_for_review(experiment=exp1, user=self.owner)
+        exp1 = experiment_approve(experiment=exp1, approver=self.approver)
+        exp1 = experiment_start(experiment=exp1, user=self.owner)
+
+        exp2 = experiment_create(
+            flag=flag,
+            name="Exp2",
+            owner=self.owner,
+            traffic_allocation=Decimal("100.00"),
+        )
+        add_two_variants(exp2)
+        exp2 = experiment_submit_for_review(experiment=exp2, user=self.owner)
+        exp2 = experiment_approve(experiment=exp2, approver=self.approver)
+
+        with self.assertRaises(ValidationError) as ctx:
+            experiment_start(experiment=exp2, user=self.owner)
+        self.assertIn("flag", ctx.exception.message_dict)
+
+
+class ReviewPolicyEnforcementTest(TestCase):
+    @override
+    def setUp(self) -> None:
+        cache.clear()
+
+    def test_approver_group_restricts_who_can_approve(self) -> None:
+        review_settings_update(
+            default_min_approvals=1,
+            allow_any_approver=False,
+        )
+
+        owner = make_experimenter("_rpea")
+        approved_approver = make_approver("_rpea1")
+        unauthorized_approver = make_approver("_rpea2")
+
+        approver_group_create(
+            experimenter=owner,
+            approver_ids=[approved_approver.pk],
+            min_approvals=1,
+        )
+
+        flag = make_flag(suffix="_rpea", default="d")
+        experiment = experiment_create(
+            flag=flag,
+            name="Restricted Approval",
+            owner=owner,
+            traffic_allocation=Decimal("100.00"),
+        )
+        add_two_variants(experiment)
+
+        experiment = experiment_submit_for_review(
+            experiment=experiment, user=owner
+        )
+
+        with self.assertRaises(ValidationError):
+            experiment_approve(
+                experiment=experiment,
+                approver=unauthorized_approver,
+            )
+
+        experiment = experiment_approve(
+            experiment=experiment,
+            approver=approved_approver,
+        )
+        self.assertEqual(experiment.status, ExperimentStatus.APPROVED)
+
+    def test_non_owner_cannot_submit_for_review(self) -> None:
+        viewer = make_viewer("_voe")
+        flag = make_flag(suffix="_voe", default="d")
+        experiment = experiment_create(
+            flag=flag,
+            name="Viewer Experiment",
+            owner=viewer,
+            traffic_allocation=Decimal("100.00"),
+        )
+        other_user = make_experimenter("_voe2")
+
+        with self.assertRaises(ForbiddenError):
+            experiment_submit_for_review(
+                experiment=experiment, user=other_user
+            )
+
+
+class EventValidationIntegrationTest(TestCase):
+    @override
+    def setUp(self) -> None:
+        event_type_create(
+            name="neg_exposure",
+            display_name="Exposure",
+            is_exposure=True,
+        )
+        event_type_create(
+            name="neg_click",
+            display_name="Click",
+            requires_exposure=True,
+            required_fields=["screen"],
+        )
+        self.now = timezone.now().isoformat()
+
+    def test_batch_with_mixed_valid_and_invalid_events(self) -> None:
+        decision_create(
+            decision_id="neg_dec_1",
+            flag_key="test_flag",
+            subject_id="u1",
+            value="v",
+            reason="test",
+        )
+
+        process_events_batch(
+            [
+                {
+                    "event_id": "neg_exp_1",
+                    "event_type": "neg_exposure",
+                    "decision_id": "neg_dec_1",
+                    "subject_id": "u1",
+                    "timestamp": self.now,
+                    "properties": {},
+                }
+            ]
+        )
+
+        result = process_events_batch(
+            [
+                {
+                    "event_id": "neg_valid_click",
+                    "event_type": "neg_click",
+                    "decision_id": "neg_dec_1",
+                    "subject_id": "u1",
+                    "timestamp": self.now,
+                    "properties": {"screen": "home"},
+                },
+                {
+                    "event_id": "neg_invalid_type",
+                    "event_type": "nonexistent_type",
+                    "decision_id": "neg_dec_1",
+                    "subject_id": "u1",
+                    "timestamp": self.now,
+                    "properties": {},
+                },
+                {
+                    "event_id": "neg_missing_field",
+                    "event_type": "neg_click",
+                    "decision_id": "neg_dec_1",
+                    "subject_id": "u1",
+                    "timestamp": self.now,
+                    "properties": {},
+                },
+                {
+                    "event_id": "neg_missing_decision",
+                    "event_type": "neg_click",
+                    "decision_id": "",
+                    "subject_id": "u1",
+                    "timestamp": self.now,
+                    "properties": {"screen": "home"},
+                },
+                {
+                    "event_id": "neg_bad_ts",
+                    "event_type": "neg_click",
+                    "decision_id": "neg_dec_1",
+                    "subject_id": "u1",
+                    "timestamp": 12345,
+                    "properties": {"screen": "home"},
+                },
+                {
+                    "event_id": "neg_exp_1",
+                    "event_type": "neg_exposure",
+                    "decision_id": "neg_dec_1",
+                    "subject_id": "u1",
+                    "timestamp": self.now,
+                    "properties": {},
+                },
+            ]
+        )
+        self.assertEqual(result.accepted, 1)
+        self.assertEqual(result.duplicates, 1)
+        self.assertGreaterEqual(result.rejected, 3)
+
+    def test_non_string_event_type_rejected(self) -> None:
+        result = process_events_batch(
+            [
+                {
+                    "event_id": "neg_bad_type",
+                    "event_type": 999,
+                    "decision_id": "dec",
+                    "subject_id": "u1",
+                    "timestamp": self.now,
+                    "properties": {},
+                }
+            ]
+        )
+        self.assertEqual(result.rejected, 1)
+        self.assertEqual(result.accepted, 0)
+
+
+class VariantWeightValidationTest(TestCase):
+    def test_weights_matching_allocation_allows_submit(self) -> None:
+        owner = make_experimenter("_vwv")
+        flag = make_flag(suffix="_vwv", default="d")
+        experiment = experiment_create(
+            flag=flag,
+            name="Weight Validation",
+            owner=owner,
+            traffic_allocation=Decimal("30.00"),
+        )
+        variant_create(
+            experiment=experiment,
+            user=owner,
+            name="control",
+            value="a",
+            weight=Decimal("15.00"),
+            is_control=True,
+        )
+        variant_create(
+            experiment=experiment,
+            user=owner,
+            name="treatment",
+            value="b",
+            weight=Decimal("15.00"),
+        )
+
+        review_settings_update(
+            default_min_approvals=1,
+            allow_any_approver=True,
+        )
+        experiment = experiment_submit_for_review(
+            experiment=experiment, user=owner
+        )
+        self.assertEqual(experiment.status, ExperimentStatus.IN_REVIEW)
+
+    def test_weights_exceeding_allocation_rejected(self) -> None:
+        owner = make_experimenter("_vwe")
+        flag = make_flag(suffix="_vwe", default="d")
+        experiment = experiment_create(
+            flag=flag,
+            name="Weight Exceeds",
+            owner=owner,
+            traffic_allocation=Decimal("30.00"),
+        )
+        variant_create(
+            experiment=experiment,
+            user=owner,
+            name="control",
+            value="a",
+            weight=Decimal("15.00"),
+            is_control=True,
+        )
+
+        with self.assertRaises(ValidationError):
+            variant_create(
+                experiment=experiment,
+                user=owner,
+                name="treatment",
+                value="b",
+                weight=Decimal("20.00"),
+            )