Bayesian Price Optimization в мобильных F2P

В мобильной F2P-экономике ценовая оптимизация по-прежнему работает по принципу «давайте поднимем самый продаваемый пакет с $4.99 на $5.99». В 2026 году студии, оптимизирующие ставки в Apple Search Ads с миллисекундной точностью, все еще теряют месяцы на классические A/B-тесты IAP-лестниц. Когда Bayesian estimation используется не просто для захвата нескольких процентов маржи, а для раннего принятия решений и построения сегмент-специфичных лестниц, LTV растет в среднем на 12–18% за тест. В этой статье мы разбираем логику posterior-обновления, как интегрировать сегментацию и почему Bayesian-фреймворк незаменим в мобильном контексте.

Почему классическое A/B-тестирование цен отстает

Во фреквентистском A/B-тесте доведение изменения цены до статистической значимости может потребовать 5000–10000 транзакций (p=0.05, мощность=0.80). В среднесегментной F2P-игре с 200–300 платящими пользователями в день это означает 25–30 дней ожидания на один вариант. За это время выходит новый Season Pass, меняется календарь событий, выходят обновления конкурентов — поддержание контрольной группы становится невозможным.

Вторая проблема классического подхода — бинарная структура решения: либо «прирост цены незначим, вернемся обратно», либо «значим, применяем». Но на мобильных устройствах каждая когорта имеет разную ценовую эластичность. Органические пользователи iOS конвертируют на $9.99, тогда как платные установки на Android на 40% чувствительнее. Единственное p-value вынуждает все сегменты в один вывод.

Третья сложность — невозможность раннего завершения. Фреквентистский тест обязан продолжаться до достижения размера выборки — даже если на 2-й неделе posterior-уверенность достигла 92%, нужно ждать еще 4 недели из-за недостатка данных. Это задержка упускает LTV-выгоду, которая уже могла быть применена к расписанию live ops.

Как работает Posterior-оценка в Bayesian-фреймворке

Bayesian-подход рассматривает изменение цены конверсии (или среднего дохода на платящего пользователя) не как фиксированное число, а как вероятностное распределение. До начала теста есть prior-убеждение: распределение CVR из старой цены. С каждой новой транзакцией posterior-распределение обновляется по теореме Байеса:

P(θ | data) ∝ P(data | θ) × P(θ)

Здесь θ = истинная конверсия (или ARPPU), data = наблюдаемые покупки. Обычно используется Beta(α, β) как prior (подходит для бинарных исходов в IAP). Ежедневно параметры α и β обновляются с учетом числа новых транзакций.

На практике это выглядит так: вы тестируете Starter Pack, подняв цену $4.99 на $5.99. Prior-убеждение: CVR ~2.8% (Beta(280, 9720) — выведено из 10000 impressions). За первые 3 дня вариант $5.99 получил 600 impressions, 14 конверсий. Posterior теперь Beta(294, 10306). Доверительный интервал сузился, средний CVR обновился до 2.78%. На 10-й день — 2000 impressions, 48 конверсий — posterior Beta(328, 11672), CVR 2.74%. Пока фреквентистский тест говорит «недостаточно выборки», Bayesian-подход заявляет: «Вероятность того, что новая цена имеет более низкий CVR, 87% — но компенсирует ли это увеличение ARPPU?»

Метрика решения: Expected Revenue Gain

Снижение CVR — не единственное основание для решения. В Bayesian-фреймворке ключевая метрика — expected revenue per impression (ERPI):

ERPI = E[CVR × Price]

Для обоих вариантов вы берете Monte Carlo-выборки из posterior-распределения (10000 итераций), в каждой итерации сравниваете CVR_new × $5.99 с CVR_old × $4.99. Если более 85% итераций благоприятны новой цене (т.е. P(ERPI_new > ERPI_old) > 0.85), решение — «масштабировать». Если менее 15% — откатываться.

Этот подход позволяет принимать решение за 10–12 дней на 1500–2000 транзакциях. Это на 60% быстрее, чем классический A/B за 4–5 недель.

Построение сегмент-специфичных ценовых лестниц

Реальная сила Bayesian-оценки проявляется при объединении с форматом многорукого бандита. Для каждого сегмента ведется отдельный posterior, каждый день Thompson Sampling динамически определяет, какой ценовой вариант получит трафик.

Конкретный сценарий: 4 сегмента — (1) Organic iOS, (2) Paid iOS, (3) Organic Android, (4) Paid Android. Вы тестируете 3 цены Starter Pack: $4.99, $5.99, $6.99. Итого 12 posterior-распределений (4 сегмента × 3 цены).

На первой неделе каждому сегменту распределяются все 3 варианта равномерно (exploration). Со 2-й недели включается Thompson Sampling: при каждом impression для того сегмента берется выборка из 3 posterior'ов, вариант с наибольшим ERPI получает трафик. Если на Organic iOS быстро лидирует $6.99, пользователи этого сегмента начинают видеть эту цену на 70%+ случаев. На Paid Android $5.99 оказывается оптимальным — трафик туда смещается.

Сегмент	Оптимальная цена (день 14)	Posterior-уверенность	Дневное распределение
Organic iOS	$6.99	91%	78%
Paid iOS	$5.99	88%	74%
Organic Android	$5.99	85%	71%
Paid Android	$4.99	82%	69%

Такая структура захватывает сегмент-специфичную ценовую эластичность, генерируя на 15–20% больше revenue, чем единая глобальная цена. При добавлении нового сегмента (например, «платящие пользователи Tier-2 GEO») вы для него создаете новый prior, и многорукий бандит автоматически начинает тестирование по этому направлению.

Механизм раннего решения и минимизация сожаления

Критальное преимущество Bayesian-фреймворка в мобильном контексте — последовательное принятие решений. Posterior обновляется ежедневно, проверяется правило решения. Если P(ERPI_new > ERPI_old) > 0.90, вы говорите: «Мы достаточно уверены, перенаправим оставшийся трафик на выигравший вариант». Фреквентистский тест ждет «пока не соберется sample size», а Bayesian-подход принимает решение на 7-й день, масштабируя выигравшую цену на оставшихся 3 недели.

Способность принимать ранние решения минимизирует cumulative regret (интегральное сожаление). Regret = «сколько мы заработали бы, зная оптимальную цену» − «что мы заработали во время теста». При классическом A/B половина трафика 30 дней идет на субоптимальный вариант; при Bayesian Thompson Sampling с 10-го дня 80% трафика переходит на победителя. Интеграл regret'а падает на 60–70%.

На практике, за 2–3 недельный цикл тестирования:

Классический A/B: 21 день × 50% субоптимальный трафик = 10.5 дневных эквивалентов потерь
Bayesian банdit: 7 дней exploration + 14 дней 15% субоптимальный = 2.1 дневных эквивалентов потерь

Эта разница трансформируется в десятки тысяч долларов дневного revenue-impact'а на высокой DAU.

Компромиссы и типичные ошибки

Bayesian price optimization не свободна от рисков. Выбор prior критичен: слишком узкий prior (например, Beta(5000, 195000) — «CVR однозначно 2.5%») медленно обновляется при новых данных. Слишком широкий prior (Beta(1, 1) — uniform) затягивает exploration. Здоровое начало: преобразовать последние 30 дней транзакций из старой цены в Beta-параметры (method of moments).

Вторая ошибка — с ростом числа сегментов convergence многорукого бандита замедляется. 4 сегмента × 3 цены = 12 рук; каждой нужно 200–300 выборок, итого 2400–3600 транзакций — на игре с 300 платящими пользователями в день это 10–12 дней. Если расширить до 8 сегментов × 4 цены = 32 рука, convergence растягивается на 4–5 недель. Решение: иерархический Bayes, позволяющий сегментам делиться информацией (например, prior-убеждение: «Tier-1 GEO имеют похожую эластичность»).

Третий момент внимания: IAP-лестница не тестируется изолированно, она переплетена с расписанием live ops. Ценовая эластичность меняется во время событий (эффект срочности). Нужно обновлять posterior быстрее в дни событий, но не сбрасывать prior после завершения события. Иначе информация «$6.99 оптимальна во время события» протекает в обычные дни, приводя к субоптимальным решениям.

Наконец: Bayesian-подход не дает фреквентистские гарантии. Вы говорите «P(θ > x) = 0.95», но это 95%-й credible interval, а не confidence interval. Если регулятор или юридические требования (например, регулирование loot box) требуют фреквентистские метрики, вам нужно подкреплять Bayesian результаты bootstrap'ом.

Привязка сегмент-специфичных ценовых лестниц к измерениям в Roibase

Для мобильных gaming-студий price optimization — это не изолированный тест, а часть всего конвейера App Store Optimization и attribution. Bayesian posterior'ы используются не только для решений о цене, но и для тестирования ASO-креативов: какая пользовательская страница приложения дает выше IPM для какого сегмента, какая оптимальная IAP-лестница для того сегмента — объединяя два потока данных, вы получаете на 30% более точные когорт-уровневые LTV-прогнозы.

Интеграция Bayesian-фреймворка в infrastructure измерений означает как раннее принятие решений, так и построение сегмент-специфичных ценовых лестниц. В 2026 году выигрывающие мобильные F2P-студии — это те, которые превратили ценовое тестирование из «ежемесячной оптимизации» в систему, которая ежедневно обновляет posterior-распределение, Thompson Sampling распределяет трафик и минимизирует regret.