Кросс-канальная оркестрация: атрибюция Paid + Email + Push

Пользователь кликает на объявление, два дня спустя открывает письмо, три дня спустя совершает покупку из push-уведомления. Какой канал победил? Классическая модель last-click отдаёт приоритет email, бюджет платной медии режется, команда lifecycle не может продемонстрировать влияние кампании. В 2026 году каждый канал выглядит победителем в собственном дашборде, но на встречах по бюджету никто другому не верит. Кросс-канальная оркестрация существует не для решения этой проблемы — её всё равно не решить — но хотя бы для того, чтобы показать, где тратятся впустую ресурсы.

Graph Идентичности: Отслеживание пользователя по каналам

Graph идентичности — это структура данных, которая объединяет устройства пользователя, email-адрес, customer_id, cookie ID в единый профиль. Pixel платной медии возвращает gcl_id, email-система ведёт email_id, мобильный SDK отправляет device_id — если их не смергить, один и тот же пользователь выглядит как три разных человека и атрибюция ломается.

Классический подход: каждый канал сообщает о собственном conversion event в собственную платформу, и в результате Google Ads показывает 100 конверсий, Klaviyo — 80, Braze — 50, итого 230, хотя уникальных покупателей всего 95. Без resolution идентичности на уровне CDP или warehouse эти цифры невозможно согласовать. Segment, mParticle, Rudderstack работают детерминированный merge по user_id, добавляют вероятностное сшивание по cookie и fingerprint. Самый простой вариант: raw event stream из серверного GTM в BigQuery, dbt-трансформация для SQL-based свёртки идентичности.

Пример flow: пользователь приходит из Meta-объявления → записывается fbclid + cookie _fbc → сGTM отправляет user_pseudo_id в Firebase Analytics → пользователь вводит email на checkout → в warehouse email мержится с _fbc → следующий push event записывается под тем же profile_id. Теперь платная медия, email и push — не три отдельные строки, а единая timeline одного пользователя.

Детерминированный vs вероятностный merge

Детерминированный: пользователь залогинен, есть customer_id — match на 100% уверен. Email, телефон, номер счёта дают точную связь. Вероятностный: вывод по IP + user-agent + timezone + canvas fingerprint — точность 80–90%, рисковано с GDPR. В production обычно комбинируют: детерминированный после логина, вероятностный fallback для анонимной сессии. Если посмотреть на ID sync log mParticle, видно, что merge rate варьируется по каналам — web 92%, мобильное приложение 96%, email 78% (потому что в email нет информации об устройстве).

Mapping жизненного цикла: какой touch на какой стадии

Кросс-канальная оркестрация — это не просто переход с "какой канал победил?" на "какой touch какую стадию жизненного цикла запустил?". Awareness, consideration, purchase, retention — используем традиционные funnel-термины, но здесь он не линейный, каждый пользователь проходит по-своему.

Логика mapping'а: присвойте каждому touch стадию жизненного цикла и сигнал намерения. Платная медия обычно — awareness + acquisition, email — retention + winback, push — re-engagement + abandoned cart. Если пользователь получает 8 touch'ей за три недели (2 платных impression, 1 email open, 3 push, 2 organic visit), какой touch ближайший к conversion? Position-based attribution даёт 40% first, 40% last, 20% middle — но это всё ещё эвристика. Реальное влияние измеряется тестом инкрементальности.

Сценарий: e-commerce сайт видит, что пользователи, конвертирующие за 30 дней, получают в медиане 4.2 touch (из Google Analytics 4 path exploration). Первый touch в 68% случаев — платная медия (Google Ads + Meta), последний touch — в 52% email. Середина — в основном push или organic. Если компания даст полный кредит email, урежет бюджет платной медии; если наоборот, lifecycle команда останется без ресурсов. Решение: data-driven attribution model — Shapley value в GA4 или warehouse SQL, измеряет маржинальный вклад каждого touch. В BigQuery функция ml.ATTRIBUTION запускает regression по path data, показывает, как каждый канал влияет на probability conversion.

Multi-touch attribution алгоритм

DDA модель GA4 обучается на conversion path'ях, вычисляет coefficient для каждого touch. Упрощённо: преобразуйте каждый path в бинарный feature vector (paid=1, email=0, push=1, ...), target conversion=1/0, подгоните logistic regression. Coefficient'ы показывают независимый эффект каждого канала. В production такую модель нужно переобучать еженедельно, потому что при смене микса кампаний распределение touch'ей сдвигается.

Альтернатива: Markov chain model — вычисляет transition probability для каждой пары каналов, типа "переход из paid в email повышает конверсию на 18%". В Python есть библиотека markov_model, принимает DataFrame path'ей, выдаёт матрицу removal effect. Markov надёжнее DDA, но дороже по compute (на 100k+ path нужен GPU).

Hold-out группы: измерить реальный lift

Какой бы изощрённой ни была модель атрибюции, она показывает корреляцию, не причинность. Пользователь всё равно бы купил, email просто оказался последним touch? Единственный способ это проверить — hold-out группа: показать кампанию контрольной группе, но не целевой, и смотреть на разницу в конверсии.

Facebook Conversion Lift, Google Ads Brand Lift работают по этому принципу: test group видит объявление, control группа не видит. Разница — это инкрементальность. Для кросс-канальной оркестрации hold-out нужно делать на уровне CDP, потому что если пользователь получает платную медию + email + push, контрольная группа должна исключиться из всех каналов. В Braze это делается тегом control_group, в Segment — trait'ом suppress.

Пример setup: из сегмента в 100k пользователей случайно выбираешь 5% (5k) в control, 14 дней не отправляешь им вообще никаких кампаний. Test группе идёт обычный flow платная медия + email + push. На 14-й день смотришь на purchase rate: test 3.2%, control 2.8% → инкрементальность 0.4% → lift 14.3%. Эти 0.4 пункта — реальный эффект кампании, остальные 2.8% — органический baseline. Теперь меняешь микс: отключаешь платную медию, оставляешь email + push. Lift упал? Значит, платная медия важна. Так изолируешь маржинальный вклад каждого канала.

Статистическая сила hold-out зависит от sample size. 5% control достаточно для 95% confidence interval, но если инкрементальность очень мала (<0.2%), теряется в noise. На Bayesian A/B test'е можно добавить prior belief, принять решение раньше — Python библиотека pymc показывает posterior distribution, даёт вероятность того, что lift больше 10%.

CDP интеграция: единый источник правды

Кросс-канальная атрибюция работает только если все event'ы идут через одну точку. Segment, mParticle, Rudderstack собирают client + server event'ы, обновляют граф идентичности, распределяют downstream (warehouse, платные платформы, lifecycle tools). Без такой архитектуры каждая команда смотрит свои данные, reconcile невозможна.

В работах Roibase по цифровому маркетингу архитектура сигналов строится на треугольнике CDP + сGTM + warehouse. Client-side — Segment SDK, server-side — сGTM, все raw event'ы идут в BigQuery. dbt делает identity stitching + sessionization, итоговая таблица sync'ится в GA4 + платные платформы. В этом стеке hold-out группа отмечается как Segment trait, downstream ко всем destination'ам идёт suppress=true — значит, платная медия, email и push все видят одного контрольного пользователя.

Альтернатива: warehouse-native CDP — Hightouch, Census читают из BigQuery, reverse-ETL в destination'ы. Граф идентичности пишешь сам в dbt, дешевле, но сложнее. Что выбрать? До 5 человек в команде — managed CDP, 10+ — warehouse-native. Средний масштаб — гибрид: Segment tracking, dbt transform, Hightouch sync.

Оптимизация бюджета по каналам: портфельный подход через MMM

Кросс-канальная атрибюция в итоге должна вывести на бюджетные решения. Какой канал финансировать? Multi-touch модель распределяет кредит по каждому touch, но revenue растёт нелинейно — есть убывающая отдача. Это измеряет Marketing Mix Modeling (MMM).

MMM — это регрессия: независимые переменные (weekly paid spend + email send count + push count), зависимая (revenue). После подгонки видишь elasticity каждого канала: paid spend вырос на 10% → revenue на 3%, email send на 10% → revenue на 1.2% — у paid'а выше ROI на марже. Но если paid уже в saturation (удвоили spend, revenue выросла только на 5%), пора переводить бюджет в email.

Библиотека Python pymc-marketing содержит Bayesian MMM, можешь моделировать saturation и adstock эффект. Adstock — это то, как бюджет, потраченный сегодня, влияет на будущие недели: ТВ-реклама даёт эффект на 4 недели, платный поиск — в тот же день. Для кросс-канальной системы каждому каналу нужна своя decay rate. Создаёшь недельную aggregated таблицу в BigQuery, feed'ишь в MMM, на выходе оптимальный диапазон spend для каждого канала.

Инкрементальность + MMM в гармонии

Hold-out test измеряет инкрементальность на короткую дистанцию (2 недели), MMM ловит long-term тренд (52 недели). Комбинировать оба — идеально: lift coefficient из hold-out'а становится prior в MMM, модель быстрее сходится. Пример: email hold-out показал lift 8%, в MMM email coefficient prior ~ Normal(0.08, 0.02) — модель ищет в этом диапазоне, posterior выходит уже.

Практика измерения: дашборды и alerting

Теория готова, как в production мониторить? Looker Studio или Tableau: cross-channel dashboard — сверху total revenue + ROAS, снизу канальный breakdown (paid, email, push), диаграмма Венна overlap'а. Каждую неделю hold-out результат обновляется, trend chart заполняется. Alert: если lift ниже 5%, Slack notification.

Пример структуры дашборда:

Верхняя панель: Total spend, total revenue, blended ROAS
Средняя панель: Channel-level ROAS (last-click, DDA, Shapley), overlap matrix
Нижняя панель: Hold-out summary (test vs control conversion rate, lift, p-value)
Правая панель: MMM оптимальные spend рекомендации, gap текущее vs оптимальное

Scheduled Query в BigQuery каждую неделю пулит новые path data, dbt модель делает identity merge + DDA coefficient update, Looker Data Studio автоматически refresh'ится. Alerting: IF(lift < 0.05 OR p_value > 0.1) THEN send_slack('Инкрементальность упала'). Такой flow убирает необходимость в ручной reconcile, команда смотрит на дашборд и принимает бюджетные решения.

Кросс-канальная оркестрация не кончает дискуссию "кто победил?" но переводит её на данные. Граф идентичности объединяет пользователя, lifecycle mapping контекстуализирует каждый touch, hold-out группа показывает причинность, CDP интеграция создаёт single source of truth, MMM оптимизирует бюджет. Если все пять компонентов не работают вместе, система неполная — даже сложная атрибюционная модель не убедит бюджетный комитет. Запустить work production stack кросс-канальной атрибюции — это 3–6