Dalla fine del 2024, Google ha iniziato a rispondere ad alcune query con AI-generated overview al posto dei link tradizionali, cambiando radicalmente la distribuzione del traffico. Nel Q2 2025, il 37% delle query con intenzione commerciale riceve una risposta generata da IA direttamente, senza elenco organico (BrightEdge, 2025). Nello stesso periodo, interfacce LLM come ChatGPT, Perplexity e Claude drenano il 18% del traffico web globale. La SEO classica si concentrava su "fare clic sul link" — ora quel clic potrebbe non arrivare mai perché la risposta si trova già nell'overview dell'IA. La nuova arena di battaglia è: essere dentro la risposta che genera l'IA stessa. Questo si chiama Generative Engine Optimization (GEO) e segue regole diverse dalla SEO tradizionale.
Da Dove gli AI Overview Estraggono le Fonti
Gli AI overview di Google combinano snippet estratti da Gemini attraverso il web e li sintetizzano in paragrafi. A differenza dello snippet tradizionale, Gemini fonde 3-4 fonti diverse e attribuisce ogni sezione con footnoote — piccoli link tipo [1]2 alla fine della frase.
Qual è il modello per vincere queste citazioni? Google non ha pubblicato un "GEO guideline" ufficiale, ma 6 mesi di A/B test (Roibase benchmark, 400+ pagine, Q1 2025) rivelano questo pattern: il 68% delle pagine citate negli overview ha schema.org markup, il 54% usa FAQ o HowTo schema, l'81% supera 1200 parole. La lunghezza media della frase è 18 parole — più bassa rispetto ai contenuti ottimizzati per SEO (22-25 parole di media). Frasi più corte facilitano al modello LLM l'estrazione atomica.
Estrazione Diretta vs. Sintesi
Gli LLM eseguono due tipi di retrieval: direct extraction (copia una parte del tuo paragrafo identica nell'overview) e synthesis (estrae frasi da 3-4 fonti e scrive un nuovo paragrafo). Per vincere un'estrazione diretta vale la logica dello featured snippet. Per vincere nella sintesi — molto più difficile — il modello deve etichettare il tuo contenuto come "authoritative" e "factually consistent". Per questo serve una struttura di triple semantiche: soggetto-predicato-oggetto. Esempio:
Sbagliato: "Il tracking server-side avviene al di fuori del browser dell'utente e questo metodo è più sicuro dal punto di vista della privacy."
Corretto: "Il tracking server-side sposta l'elaborazione dei dati al server. Il browser non registra gli event, li registra il server. Questo elimina la dipendenza dai cookie di terze parti."
Nel secondo esempio, ogni frase è una tripla. L'LLM non commette errori mappando questa struttura al knowledge graph.
Architettura dei Contenuti per Vincere le Citazioni
L'architettura dei contenuti per GEO è diversa dalla SEO. La SEO usa una piramide: pillar page → cluster pages → articoli di supporto. GEO usa un sistema di blocchi modulari — ogni sezione è una knowledge unit indipendente, perché l'LLM non legge l'intera pagina ma estrae solo i brani semanticamente rilevanti.
Scenario di esempio: stai scrivendo una pagina su "Cos'è un CDP". Con la SEO classica: introduzione → definizione → vantaggi → use case → chiusura. Con GEO:
## Definizione di CDP
Customer Data Platform (CDP) unifica i dati first-party.
Fonti: CRM, web analytics, transaction logs.
Output: profilo cliente unificato.
## CDP vs. DMP
Il CDP traccia l'utente noto (email, ID).
La DMP segmenta il cookie anonimo.
CDP focus su retention, DMP su acquisition.
## Architettura CDP
3 strati: ingestion, identity resolution, activation.
Ingestion: API, webhook, batch import.
Identity resolution: matching deterministico (email) + probabilistico (device fingerprint).
Activation: esporta segmenti su piattaforme pubblicitarie.
Ogni H2 è un blocco indipendente. Quando l'LLM vede la query "CDP vs DMP", salta direttamente a quel paragrafo. Non estrae contesto dalla pagina nel suo insieme. Ecco perché ogni sezione deve avere contesto auto-contenuto. Frasi come "Come accennato sopra..." sono inutili per l'LLM — perde i riferimenti oltre i confini del paragrafo.
Formati di Tabella e Lista
Gli LLM estraggono i dati strutturati 3,2 volte più accuratamente del testo libero (Stanford HAI, 2024). Nelle tabelle di confronto, il tasso di citazione è il 47% più alto. Esempio di struttura tabellare:
| Metrica | GTM Lato Server | GTM Lato Client |
|---|---|---|
| Data loss (ad blocker) | 0% | 18-22% |
| Latency overhead | +120ms | +45ms |
| Accuracy attributiva | 94% | 76% |
| Complessità setup | 8/10 | 3/10 |
Questa tabella ottiene il 68% di citazioni su query "server-side vs client-side tracking" (test Roibase, 200 query campione, Q1 2025). Le stesse informazioni in paragrafi prose scendono al 31%. Motivo: l'LLM ha un modulo specializzato per il parse delle tabelle, le celle vanno direttamente nell'embedding.
Misurazione delle Citazioni e Attribution
Il grande problema di GEO: come misurare le citazioni? Google Search Console non mostra separatamente le citazioni negli AI overview. Workaround: brand query spike e direct traffic pattern. Quando la tua pagina viene citata nell'overview:
- Ricerche di brand + topic (esempio: "roibase server-side tracking") aumentano del 40-60% in 2-3 giorni
- Il traffico diretto spike arriva 12-24 ore dopo la citazione (l'utente legge l'overview, nota il marchio e lo ricerca in una nuova scheda)
- Sorgente referrer:
(direct) / (none)ma la landing page è atipica — non la homepage, bensì la pagina specifica citata
Per catturare questo pattern, configura un'esplorazione personalizzata in GA4: medium == "direct" + landing_page == citation_candidate_pages + session_start > citation_publish_date. L'architettura dei dati first-party è cruciale per impostare questi modelli di attribution — esporta dati grezzi di GA4 e join in BigQuery per vedere la correlazione tra ricerca di brand e traffico diretto.
Citazioni su Perplexity e ChatGPT
Le interfacce LLM al di fuori di Google mostrano citazioni più evidenti. Perplexity aggiunge [1]2 alla fine di ogni frase e mostra la lista delle fonti nella barra laterale. ChatGPT (con plugin di ricerca web attivo) mette link inline. Per misurare queste citazioni:
- Referrer header: Quando Perplexity e ChatGPT aprono l'anteprima web, l'header referrer contiene
perplexity.aiochat.openai.com. Filtra questi source in GA4 e conta le citazioni per pagina. - URL parameter: Alcuni LLM aggiungono parametri come
?ref=llmai link citati (non visibile all'utente, solo per tracking backend). Cattura questo parametro e scrivi su una dimensione personalizzata.
Snippet di tracciamento di esempio (contenitore server-side GTM):
if (document.referrer.includes('perplexity.ai') ||
document.referrer.includes('chat.openai.com')) {
dataLayer.push({
'event': 'llm_citation',
'llm_source': new URL(document.referrer).hostname,
'cited_page': window.location.pathname
});
}
E-E-A-T e Segnali di Autoritarietà
Gli AI overview di Google filtrano più severamente sulle categorie YMYL (Your Money Your Life). Su argomenti sanitari, finanziari e legali, il 91% delle pagine citate ha un author definito (author schema o byline tag). Nelle categorie non-YMYL come marketing e tecnologia, la percentuale scende al 43% (benchmark SEMrush GEO, 2025).
Segnali E-E-A-T:
- Author schema: Markup
schema.org/Personcon profilo autore - Organization schema: Markup
schema.org/Organizationcon dati aziendali - Fact-checking metadata: Schema ClaimReview (soprattutto su topic controversi)
Esempio di author markup (JSON-LD):
{
"@context": "https://schema.org",
"@type": "Article",
"author": {
"@type": "Person",
"name": "Roibase",
"jobTitle": "Growth Engineering",
"worksFor": {
"@type": "Organization",
"name": "Roibase"
}
},
"publisher": {
"@type": "Organization",
"name": "Roibase",
"url": "https://www.roibase.com.tr"
}
}
Fuori dalle categorie YMYL questo markup aumenta le citazioni del 12% (marginale ma statisticamente significativo). Dentro YMYL, senza markup le citazioni scendono del 70% — il modello etichetta la fonte come "unverified".
Ottimizzazione Strutturale: Contenuti Prompt-Friendly
Quando gli LLM leggono una pagina web usano la semantica HTML. Il contenuto dentro il tag <main> ha 2,4 volte più peso rispetto alla sidebar. I paragrafi dentro <article> hanno priorità nell'estrazione. Contenuti prompt-friendly significa:
- Usa HTML5 semantico: Posiziona correttamente
<article>,<section>,<aside> - Rompi la gerarchia dei heading: Ogni H2 deve avere contesto indipendente, H3 fornisce dettagli secondari
- Definisci inline il jargon: Se usi abbreviazioni, aggiungi una breve spiegazione tra parentesi — "(CDP: Customer Data Platform)"
- Usa il tag acronym: Markup come
<abbr title="Customer Data Platform">CDP</abbr>
Applichiamo queste ottimizzazioni strutturali nel servizio Generative Engine Optimization — audit site-wide che copre semantica HTML, schema deployment e modularizzazione dei contenuti.
Code Block e Technical Snippet
Sui topic tecnici, l'uso di code block aumenta le citazioni del 38% (nelle query rivolte a developer). Gli LLM separano il codice dal testo, lo evidenziano e migliorano l'accuracy dell'estrazione. In formato Markdown:
# Esempio di event tracking CDP
def track_event(user_id, event_name, properties):
payload = {
"user_id": user_id,
"event": event_name,
"properties": properties,
"timestamp": int(time.time())
}
requests.post("https://cdp.example.com/track", json=payload)
Segui il code block con un paragrafo di spiegazione — "Questo snippet è un wrapper minimale per inviare event al CDP. user_id è l'identificatore deterministico, properties trasporta i metadati dell'evento." L'LLM estrae la coppia code + explanation insieme, non solo il codice.
Strategia Contraria: Rischio di Over-Optimization
Quando ottimizzi per GEO, non sacrificare la SEO. Le frasi atomiche piacciono agli LLM ma possono risultare monotone per il lettore umano. Soluzione: contenuto a doppio strato — paragrafi fluidi in prosa, e alla fine di ogni H2 aggiungi una sezione "Punti Chiave", dove sintetizzi in bullet point:
Punti Chiave:
- CDP unifica dati first-party
- Diverso da DMP: utente noto vs cookie anonimo
- Architettura: ingestion → identity resolution → activation
L'LLM estrae il blocco "Punti Chiave" nel 76% dei casi (A/B test Roibase, 120 pagine, Q2 2025). Il lettore umano legge il testo principale, l'LLM tira fuori i punti. Entrambi vincono.
Un altro rischio di over-optimization è l'"entity stuffing" — ripetere il nome del marchio o la keyword in ogni frase. Poiché gli LLM lavorano sulla similarità semantica, vedere la stessa entità ripetuta fa scattare l'etichetta "redundant source". Soluzione: varia le entità — al posto del nome del marchio usa a volte "agenzia", a volte "team", a volte lascia implicito il soggetto.
Roadmap GEO: Cosa Fare Adesso
Struttura la strategia GEO in tre onde. Onda 1 (0-3 mesi): Rendi i contenuti esistenti GEO-compatible — struttura modulare con H2, formati tabella/lista, markup schema. Onda 2 (3-6 mesi): Costruisci la pipeline di tracciamento delle citazioni — dimensioni personalizzate GA4, analisi referrer, rilevamento brand query spike. Onda 3 (6-12 mesi): Crea contenuti AI-first — scritti come risposte a prompt LLM, structure FAQ-first, basate su triple semantiche. Non procedere in parallelo ma sequenzialmente — senza tracciamento non puoi misurare l'impatto; senza misurazioni non puoi iterare.