Hoe werken LLM-citaties: wat ChatGPT, Claude en Perplexity wel en niet citeren
Per AI-engine een uitleg van het citatie-mechanisme. Welke bronnen worden gebruikt, wat maakt content citeerbaar, en concrete voorbeelden van wel/niet geciteerde sites.
Als je weet hoe ChatGPT, Claude en Perplexity intern werken, snap je ook waarom de ene site wordt geciteerd en de andere niet. De verschillen zijn groter dan je denkt. Wat Perplexity verslindt, negeert ChatGPT vaak. Wat Claude graag oppakt, ziet Gemini niet.
Dit is wat ik per engine zie in onze audits en in de openbare research.
Het basismechanisme
Elke AI-zoekmachine werkt in drie stappen:
- Retrieval — een query gaat naar een index, die haalt 10-50 documenten op
- Re-ranking — de top-N (vaak 3-10) wordt geselecteerd op relevantie
- Synthesis — het model leest die N documenten en schrijft één antwoord, met citatielinks
Het model citeert alleen wat in stap 2 is overgebleven. Dus je gevecht is: in die top-N komen.
Welke index, welke re-ranking, welk model — daar zit het verschil per engine.
ChatGPT (OpenAI)
Index: Bing search index, plus eigen real-time fetches via ChatGPT-User
User-agents:
GPTBot— training (niet voor citaties)OAI-SearchBot— bouwt de search indexChatGPT-User— fetcht in real-time tijdens een chat
Wat ChatGPT graag citeert:
- Wikipedia, Reddit, YouTube (in volgorde van frequentie volgens 2026 data)
- Sites met sterke Bing-rankings voor de query
- Sites met FAQPage-schema en duidelijke Q&A-structuur
- Recente content (last 6-12 maanden voor news/tech queries)
Wat ChatGPT negeert:
- Sites die
OAI-SearchBotofChatGPT-Userblokkeren - Pagina's zonder duidelijke H1 of definitie-zin
- JavaScript-rendered content zonder server-side rendering
- Erg lange artikelen (>3000 woorden) — alleen het begin wordt vaak meegenomen
Markant detail: ChatGPT's Reddit-citatieshare daalde van ~60% naar ~10% in zes weken eind 2025, na één Bing-parameter wijziging. PR Newswire, Forbes en Medium namen de verschoven share over. Citaties zijn dus volatiel — verwacht weken-tot-maanden volatiliteit, geen jaren.
Claude (Anthropic)
Index: eigen search-laag (sinds 2025), met Brave als fallback in sommige contexten
User-agents:
ClaudeBot— trainingClaude-SearchBot— search index voor Claude.aiClaude-User— real-time fetch tijdens user query
Wat Claude graag citeert:
- Diepgaande, technisch onderbouwde content
- Documentatie en handleidingen (developer-content scoort hoog)
- Academische bronnen en whitepapers
- Sites met duidelijke author-bylines en bio's
- Lange-vorm content met heldere structuur (Claude leest hele documenten beter dan ChatGPT)
Wat Claude negeert:
- Marketing-fluff zonder concrete claims
- Sites zonder genoemde auteur
- Pages met thin content of low information density
- Geblokkeerde robots.txt voor Claude-bots
Markant detail: Claude wordt relatief vaak gebruikt door developers en B2B-gebruikers. Voor SaaS- en developer-tooling is een Claude-citatie soms waardevoller dan een ChatGPT-citatie qua intent.
Perplexity
Index: eigen index (hoofdbron) + Bing en Google APIs als ondersteuning
User-agents:
PerplexityBot— primaire crawlerPerplexity-User— real-time fetch
Wat Perplexity graag citeert:
- Recente content (Perplexity weegt freshness zwaarder dan andere engines)
- Sites met sterke topical authority
- News en research-bronnen
- Gestructureerde data (tabellen, lijsten, vergelijkingen)
- Niche-bronnen die direct antwoord geven op een specifieke vraag
Wat Perplexity negeert:
- Outdated content zonder duidelijke datum
- Vage marketing-content
- Content die enkel SEO-spam is
Compliance-let-op: Perplexity is meerdere keren betrapt op het negeren van robots.txt via stealth-crawlers (Wired, augustus 2024 onderzoek). Anno 2026 is Perplexity zichtbaarder, maar als je écht alleen voor de hoofdcrawler wilt openstaan: gebruik Cloudflare WAF met user-agent-validatie, niet alleen robots.txt.
Google AI Overviews
Index: Google search index (dezelfde als organic)
Wat AI Overviews graag citeert:
- Reddit (#1 met 2.2% van alle citaties)
- YouTube (#2)
- Quora, LinkedIn, Wikipedia
- Sites die rank in de top-10 voor de gerelateerde query
- Content met duidelijke E-E-A-T signalen (auteur, expertise, autoriteit, trust)
Markant detail: 88% van AI Overviews citeert 3+ bronnen, slechts 1% citeert maar 1 bron. Top-20 domeinen vangen 66% van alle citaties. Het is dus zwaar geconcentreerd.
Gemini
Index: Google search index
Veel overlap met Google AI Overviews qua sourcing. Gemini gebruikt aanvullend YouTube-transcripts en Google Books waar beschikbaar.
Bing Copilot
Index: Bing
Copilot citeert vaak vergelijkbaar met ChatGPT (logisch — zelfde index), maar weegt official-domain bronnen (gov, edu, eigen sites) zwaarder.
Wat maakt content écht citeerbaar — patronen die overal werken
Na 100+ audits zie ik vier patronen die over alle engines heen werken:
1. Definitie-eerste structuur
Open elke pagina met een directe definitie of antwoord. Niet "in dit artikel..." maar "X is Y dat Z doet, doordat...". Modellen gebruiken deze openingszin verrassend vaak letterlijk in hun antwoord.
2. Concrete claim met bron
Vage claims worden geparafraseerd of weggegooid. Concrete claims met bron worden geciteerd. Vergelijk:
❌ "Veel mensen gebruiken AI-zoekmachines" ✅ "ChatGPT verwerkt 250-500 miljoen wekelijkse zoekopdrachten (Similarweb, Q1 2026)"
3. Genoemde auteur met externe presence
Anonieme content of "team Priso" werkt niet. Een auteur met naam, functie, en LinkedIn-/Wikipedia-link wordt zwaarder gewogen. Dit signaal komt direct uit de E-E-A-T research van Google en is overgenomen door de meeste AI-systemen.
4. Consistentie over het web
Modellen bouwen entiteit-graphs. Als jouw merk op je site "Priso" heet, op LinkedIn "Priso BV" en in een nieuwsartikel "Priso AI" — dan verwart dat het model. Houd je naam, beschrijving en URL consistent in alle structured data, social profielen en PR.
Anti-cloaking: laat dezelfde content zien aan bot en mens
Een fout die ik te vaak zie: sites die "AI-friendly" content tonen aan bots en commerciële versies aan gebruikers. Of vice versa. Zowel Google als Anthropic en OpenAI straffen cloaking af. Houd het simpel: dezelfde HTML voor alle bezoekers, server-side rendered indien mogelijk, geen verborgen tekst.
Voorbeelden uit de praktijk
Wel geciteerd in onze testqueries (Priso audit-data):
- Een Nederlandse SaaS-startup met blog-posts in vraag-formaat, FAQ-schema, en een founder-byline met LinkedIn-link → consistent geciteerd in ChatGPT en Claude voor "X tool Nederland" queries
- Een e-commerce site met uitgebreide productspecs en gestructureerde vergelijkingstabellen → opduikt in Perplexity voor "beste X" zoekopdrachten
Niet geciteerd:
- Een grote Nederlandse retailer met sterke organic SEO maar zonder author-info, waarvan de homepage volledig client-side rendered is → genegeerd door alle AI-engines
- Een blog-heavy SaaS-site die per ongeluk GPTBot en ClaudeBot blokkeert via Cloudflare → onzichtbaar voor ChatGPT en Claude, terwijl Perplexity wel citeert
Het tweede geval is herstelbaar in 5 minuten. Het eerste is een herstelproject van een paar weken.
Wat je vandaag kunt doen
- Test je site op 5 hoofdqueries in ChatGPT, Claude en Perplexity. Word je geciteerd?
- Check je robots.txt: open je site voor
OAI-SearchBot,Claude-SearchBot,PerplexityBot - Zet definitie-eerst structuur op je top-5 pagina's
- Voeg author-bio's met LinkedIn-link toe
- Run een audit op Priso — we testen alle bovenstaande signalen automatisch
Check je citatie-readiness in 60 seconden
Check je citatie-readiness in 60 secondenVeelgestelde vragen
Hoe vaak update ChatGPT zijn index? Continu, maar zichtbare effecten van site-changes verschijnen meestal binnen 1-3 weken voor populaire pagina's. Less-trafficked pagina's kunnen 4-8 weken duren.
Geeft een citatie altijd een klik? Nee. Veel citaties leiden niet tot een klik (zero-click answers). Maar de brand mention zelf heeft waarde — vergelijkbaar met een vermelding in een traditioneel medium.
Werkt het ook voor Nederlandse content? Ja, alle grote engines spreken vloeiend Nederlands. ChatGPT en Claude scoren goed op nuance, Perplexity is wat letterlijker maar prima.
Moet ik per AI-engine apart optimaliseren? 80% van de signalen werkt overal. De resterende 20% is engine-specifiek (bv. freshness telt extra zwaar bij Perplexity, structured data extra bij Google AI Overviews).
Geschreven door Richard van Leeuwen, founder van Priso. Bouwt sinds 2022 met AI-tools, sinds 2024 AI-agents in productie.