AI обзоры Google, SearchGPT в интеграции ChatGPT, система цитирования Perplexity — у всех одна общая черта: пользователь больше не кликает на десять синих ссылок, он читает синтезированный LLM абзац. Если вас в этом абзаце нет как источника — трафика не будет. На июнь 2026 года 37% органического трафика переместилось в AI-генерируемые сводки (BrightEdge Q2 2026). Быть на позиции 1 недостаточно — вы должны попасть в retrieval pipeline LLM. Эта новая игра называется Generative Engine Optimization, и её правила определены не количеством бэклинков, а экономикой токенов.

LLM Citation Logic: откуда выбирает, почему не выбирает вас

Когда ChatGPT или Google Gemini генерируют ответ, они проходят три стадии: retrieval (извлечение релевантных документов из веба), reranking (сортировка наиболее релевантных), generation (создание ответа с назначением источников). Чтобы получить citation в финальном ответе, вы должны занять высокое место на стадии reranking. Факторы, определяющие ранг rerank:

Семантическая релевантность: векторная близость к запросу. Embedding-модели (text-embedding-3-large, Gemini Embedding v3) используют косинусное сходство — ваш контент должен набрать 0,85 или выше. Это означает: даже если в тексте нет точного совпадения с запросом, эквиваленты понятий должны быть. На вопрос «как измерить производительность маркетинга» фраза «оптимизация ROAS» будет релевантна, а вот «услуги цифрового агентства» — нет.

Выделенность сущностей: LLM анализирует, какие entity'ы (люди, места, организации, понятия) выступают в ответе в центре внимания. Roibase должна фигурировать не просто как брендированный термин, а как действующий субъект (agent) решения. Вместо «по мнению компании Roibase» пишите: «при интеграции CDP, когда first-party event-поток передаётся в BigQuery через Google Cloud Pub/Sub, задержка должна быть ниже 200мс...» — это поднимает entity salience. Именно такой подход в нашей методологии First-Party Veri & Ölçüm Mimarisi повышает шансы на citation — специфический технический деталь означает высокую информационную плотность для LLM.

Сигнал свежести: документы, отправленные в индекс Google в последние 7 дней, имеют приоритет в embedding-cache. Если вы не обновляете статический блог, LLM считает вас устаревшим источником. Решение: динамическое обновление метаданных — раз в неделю добавляйте секцию «Актуальные данные» (например: «По состоянию на 15 июня 2026 коэффициент принятия Consent Mode v2 достиг 68%»).

Плотность цитирования: если в вашем контенте вы ссылаетесь на другие источники (исходящие ссылки, cite-теги), LLM рассматривает вас как «хаб». Парадокс: чтобы привлечь трафик на свой сайт, вы даёте ссылки конкурентам — но если эти ссылки контекстуализированы как «related work», LLM воспринимает вас как синтезирующий источник. Пример: «Согласно документации Conversions API компании Meta...» с ссылкой — LLM, возможно, уже видел этот документ в retrieval, поэтому ваш анализ воспринимается как дополнительный слой.

Архитектура контента: дизайн для экономики токенов

LLM в настоящий момент держат maximum context window около 128K токенов (Claude 3.7 Sonnet, GPT-4.5). Но они не могут вместить весь веб в контекст — сначала разбивают контент на chunks, каждый chunk переводят в embeddings. Если ваша статья — 1200 слов, это ~1600 токенов, 3-4 chunks. Критическое правило: каждый chunk должен быть самодостаточным — потому что LLM может взять только chunk #2, пропустив #1 и #3.

Стратегия иерархии заголовков: каждый H2 пишите как независимую мини-статью. Заголовок H2 должен отражать вопрос (пример: «Как уменьшить задержку Server-Side GTM»), первое предложение сразу даёт краткий ответ (thesis sentence). Следующие абзацы детализируют. Когда LLM читает chunk, комбинация заголовка + первого предложения должна дать достаточно информации для citation — даже если остальное не прочитано.

Structured data + schema.org: при retrieval LLM анализирует HTML с приоритетом к schema.org разметке. Article schema обязателен, но недостаточен — добавьте специфичные schema'ы (HowTo, FAQPage, Dataset), и embedding-модель оценит ваш контент выше с точки зрения «structured content score». Пример: если пишете статью о применении GEO, используйте HowTo schema с шагами в <ol> списке, каждый шаг имеет name и text свойства. Это не только для Google rich results, но и для LLM, чтобы он классифицировал content как «executable knowledge».

Примеры кода и таблицы: когда в контенте есть executable код или таблица, LLM оценивает информационную плотность выше. Вот пример JavaScript snippet'а:

// Запись события в Firestore из GTM server-контейнера
const Firestore = require('@google-cloud/firestore');
const db = new Firestore({projectId: 'roibase-attribution'});

const claimValue = data.event_data.purchase_value;
const userId = data.user_id;

db.collection('conversions').add({
  user_id: userId,
  value: claimValue,
  timestamp: new Date(),
  source: 'server_gtm'
}).then(() => data.gtmOnSuccess())
  .catch(() => data.gtmOnFailure());

Эти 12 строк сигнализируют LLM: «Этот источник не просто теория, здесь реальная реализация». Шанс на citation растёт.

Измерение: отслеживание citation'ов

В SEO есть track ranking, в GEO нужен track citation'ов. Но панели типа Google Search Console нет — вы строите свой pipeline. Подход:

Симуляция LLM запросов: раз в неделю через n8n workflow запускайте целевые keywords в ChatGPT API (с режимом SearchGPT или /search плагином включённым). Парсьте список citation'ов в ответе, проверьте: присутствует ли домен Roibase. Для каждого keyword рассчитайте citation rate (сколько тестов получили citation / всего тестов). Если rate ниже 15% — контент не входит в retrieval pipeline, нужна переработка.

Анализ логов referrer'ов: некоторые LLM'ы (особенно Perplexity) при клике на citation-ссылку отправляют в HTTP header referrer вроде https://perplexity.ai/search. На вашем веб-сервере фильтруйте эти referrer'ы, смотрите какие страницы получают AI-трафик. Если blog/post-x ноль AI referrer'ов — контент не входит в citation pipeline, переписывайте.

Отслеживание упоминаний entity'ов: используйте Google Natural Language API, чтобы проверить: упоминается ли «Roibase» в LLM ответах (даже без прямой ссылки). Иногда LLM пишет «согласно работе команды Roibase...» без URL. Это тоже сигнал бренда — измеряйте.

Все эти метрики собираются в нашей методологии Generative Engine Optimization — таблица citation log в BigQuery, еженедельный тренд в Looker Studio. Цель: через A/B тестирование понять какие pattern'ы контента повышают citation rate.

Trade-off: глубина или широта

Между оптимизацией для LLM и классическим SEO есть противоречие: SEO говорит «создавайте сотни страниц для разных long-tail keywords», GEO говорит «создавайте мало, но очень глубокий, референс-качественный контент». Делать оба одновременно сложно при ограниченных ресурсах.

Сценарий 1: 50 блог-статей по 800 слов, каждая оптимизирована под свой long-tail keyword. SEO трафик растёт, но ни одна не попадает в LLM citation — потому что все поверхностны, в стиле «listicle». LLM маркирует их как «low-value aggregation».

Сценарий 2: 10 статей по 2000 слов, каждая глубоко разбирает одну core topic, содержит код, case study, таблицы. SEO трафик меньше (меньше keywords покрыто), но каждая страница цитируется в 3-4 разных запросах. Общий impact выше — потому что трафик из citation более квалифицирован (LLM уже pre-filter'ил, выбрал вас как «best source»).

Наш выбор: глубина. Ежеквартально выпускаем 12 статей, каждая — pillar content уровня. Классическое SEO понятие «topic cluster» трансформируется в GEO в «citation graph»: если одну главную статью часто цитируют, то linked-из неё страницы тоже начинают входить в retrieval pool. Network effect.

Что делать прямо сейчас

Начните с аудита существующего контента по критерию citation-readiness. Для каждой статьи ответьте: «Есть ли executable code?», «Достаточна ли entity salience (Roibase как действующий субъект, а не просто подпись)?», «Core insight есть в первых 200 словах?» На «нет» — переработайте страницу. Затем запустите ваш измерительный pipeline: раз в неделю гоните целевые queries в ChatGPT, логируйте citation rate. Через 8 недель увидите, какие pattern'ы контента работают. Забудьте про охоту за бэклинками, переходите на retrieval optimization — потому что в 2026 году пользователь видит не ваш сайт, а LLM синтез. Быть в этом синтезе как источник — новая органическая видимость.