Skip to content
Terug naar blog

Hoe werken LLM-citaties: wat ChatGPT, Claude en Perplexity wel en niet citeren

Per AI-engine een uitleg van het citatie-mechanisme. Welke bronnen worden gebruikt, wat maakt content citeerbaar, en concrete voorbeelden van wel/niet geciteerde sites.

Geschreven door
Richard van Leeuwen

Founder van Priso. 30+ jaar webdev en e-commerce, fulltime AI-tools sinds 2022.

·6 min lezen

Als je weet hoe ChatGPT, Claude en Perplexity intern werken, snap je ook waarom de ene site wordt geciteerd en de andere niet. De verschillen zijn groter dan je denkt. Wat Perplexity verslindt, negeert ChatGPT vaak. Wat Claude graag oppakt, ziet Gemini niet.

Dit is wat ik per engine zie in onze audits en in de openbare research.

Het basismechanisme

Elke AI-zoekmachine werkt in drie stappen:

  1. Retrieval — een query gaat naar een index, die haalt 10-50 documenten op
  2. Re-ranking — de top-N (vaak 3-10) wordt geselecteerd op relevantie
  3. Synthesis — het model leest die N documenten en schrijft één antwoord, met citatielinks

Het model citeert alleen wat in stap 2 is overgebleven. Dus je gevecht is: in die top-N komen.

Welke index, welke re-ranking, welk model — daar zit het verschil per engine.

ChatGPT (OpenAI)

Index: Bing search index, plus eigen real-time fetches via ChatGPT-User

User-agents:

  • GPTBot — training (niet voor citaties)
  • OAI-SearchBot — bouwt de search index
  • ChatGPT-User — fetcht in real-time tijdens een chat

Wat ChatGPT graag citeert:

  • Wikipedia, Reddit, YouTube (in volgorde van frequentie volgens 2026 data)
  • Sites met sterke Bing-rankings voor de query
  • Sites met FAQPage-schema en duidelijke Q&A-structuur
  • Recente content (last 6-12 maanden voor news/tech queries)

Wat ChatGPT negeert:

  • Sites die OAI-SearchBot of ChatGPT-User blokkeren
  • Pagina's zonder duidelijke H1 of definitie-zin
  • JavaScript-rendered content zonder server-side rendering
  • Erg lange artikelen (>3000 woorden) — alleen het begin wordt vaak meegenomen

Markant detail: ChatGPT's Reddit-citatieshare daalde van ~60% naar ~10% in zes weken eind 2025, na één Bing-parameter wijziging. PR Newswire, Forbes en Medium namen de verschoven share over. Citaties zijn dus volatiel — verwacht weken-tot-maanden volatiliteit, geen jaren.

Claude (Anthropic)

Index: eigen search-laag (sinds 2025), met Brave als fallback in sommige contexten

User-agents:

  • ClaudeBot — training
  • Claude-SearchBot — search index voor Claude.ai
  • Claude-User — real-time fetch tijdens user query

Wat Claude graag citeert:

  • Diepgaande, technisch onderbouwde content
  • Documentatie en handleidingen (developer-content scoort hoog)
  • Academische bronnen en whitepapers
  • Sites met duidelijke author-bylines en bio's
  • Lange-vorm content met heldere structuur (Claude leest hele documenten beter dan ChatGPT)

Wat Claude negeert:

  • Marketing-fluff zonder concrete claims
  • Sites zonder genoemde auteur
  • Pages met thin content of low information density
  • Geblokkeerde robots.txt voor Claude-bots

Markant detail: Claude wordt relatief vaak gebruikt door developers en B2B-gebruikers. Voor SaaS- en developer-tooling is een Claude-citatie soms waardevoller dan een ChatGPT-citatie qua intent.

Perplexity

Index: eigen index (hoofdbron) + Bing en Google APIs als ondersteuning

User-agents:

  • PerplexityBot — primaire crawler
  • Perplexity-User — real-time fetch

Wat Perplexity graag citeert:

  • Recente content (Perplexity weegt freshness zwaarder dan andere engines)
  • Sites met sterke topical authority
  • News en research-bronnen
  • Gestructureerde data (tabellen, lijsten, vergelijkingen)
  • Niche-bronnen die direct antwoord geven op een specifieke vraag

Wat Perplexity negeert:

  • Outdated content zonder duidelijke datum
  • Vage marketing-content
  • Content die enkel SEO-spam is

Compliance-let-op: Perplexity is meerdere keren betrapt op het negeren van robots.txt via stealth-crawlers (Wired, augustus 2024 onderzoek). Anno 2026 is Perplexity zichtbaarder, maar als je écht alleen voor de hoofdcrawler wilt openstaan: gebruik Cloudflare WAF met user-agent-validatie, niet alleen robots.txt.

Google AI Overviews

Index: Google search index (dezelfde als organic)

Wat AI Overviews graag citeert:

  • Reddit (#1 met 2.2% van alle citaties)
  • YouTube (#2)
  • Quora, LinkedIn, Wikipedia
  • Sites die rank in de top-10 voor de gerelateerde query
  • Content met duidelijke E-E-A-T signalen (auteur, expertise, autoriteit, trust)

Markant detail: 88% van AI Overviews citeert 3+ bronnen, slechts 1% citeert maar 1 bron. Top-20 domeinen vangen 66% van alle citaties. Het is dus zwaar geconcentreerd.

Gemini

Index: Google search index

Veel overlap met Google AI Overviews qua sourcing. Gemini gebruikt aanvullend YouTube-transcripts en Google Books waar beschikbaar.

Bing Copilot

Index: Bing

Copilot citeert vaak vergelijkbaar met ChatGPT (logisch — zelfde index), maar weegt official-domain bronnen (gov, edu, eigen sites) zwaarder.

Wat maakt content écht citeerbaar — patronen die overal werken

Na 100+ audits zie ik vier patronen die over alle engines heen werken:

1. Definitie-eerste structuur

Open elke pagina met een directe definitie of antwoord. Niet "in dit artikel..." maar "X is Y dat Z doet, doordat...". Modellen gebruiken deze openingszin verrassend vaak letterlijk in hun antwoord.

2. Concrete claim met bron

Vage claims worden geparafraseerd of weggegooid. Concrete claims met bron worden geciteerd. Vergelijk:

❌ "Veel mensen gebruiken AI-zoekmachines" ✅ "ChatGPT verwerkt 250-500 miljoen wekelijkse zoekopdrachten (Similarweb, Q1 2026)"

3. Genoemde auteur met externe presence

Anonieme content of "team Priso" werkt niet. Een auteur met naam, functie, en LinkedIn-/Wikipedia-link wordt zwaarder gewogen. Dit signaal komt direct uit de E-E-A-T research van Google en is overgenomen door de meeste AI-systemen.

4. Consistentie over het web

Modellen bouwen entiteit-graphs. Als jouw merk op je site "Priso" heet, op LinkedIn "Priso BV" en in een nieuwsartikel "Priso AI" — dan verwart dat het model. Houd je naam, beschrijving en URL consistent in alle structured data, social profielen en PR.

Anti-cloaking: laat dezelfde content zien aan bot en mens

Een fout die ik te vaak zie: sites die "AI-friendly" content tonen aan bots en commerciële versies aan gebruikers. Of vice versa. Zowel Google als Anthropic en OpenAI straffen cloaking af. Houd het simpel: dezelfde HTML voor alle bezoekers, server-side rendered indien mogelijk, geen verborgen tekst.

Voorbeelden uit de praktijk

Wel geciteerd in onze testqueries (Priso audit-data):

  • Een Nederlandse SaaS-startup met blog-posts in vraag-formaat, FAQ-schema, en een founder-byline met LinkedIn-link → consistent geciteerd in ChatGPT en Claude voor "X tool Nederland" queries
  • Een e-commerce site met uitgebreide productspecs en gestructureerde vergelijkingstabellen → opduikt in Perplexity voor "beste X" zoekopdrachten

Niet geciteerd:

  • Een grote Nederlandse retailer met sterke organic SEO maar zonder author-info, waarvan de homepage volledig client-side rendered is → genegeerd door alle AI-engines
  • Een blog-heavy SaaS-site die per ongeluk GPTBot en ClaudeBot blokkeert via Cloudflare → onzichtbaar voor ChatGPT en Claude, terwijl Perplexity wel citeert

Het tweede geval is herstelbaar in 5 minuten. Het eerste is een herstelproject van een paar weken.

Wat je vandaag kunt doen

  1. Test je site op 5 hoofdqueries in ChatGPT, Claude en Perplexity. Word je geciteerd?
  2. Check je robots.txt: open je site voor OAI-SearchBot, Claude-SearchBot, PerplexityBot
  3. Zet definitie-eerst structuur op je top-5 pagina's
  4. Voeg author-bio's met LinkedIn-link toe
  5. Run een audit op Priso — we testen alle bovenstaande signalen automatisch

Check je citatie-readiness in 60 seconden

Check je citatie-readiness in 60 seconden

Veelgestelde vragen

Hoe vaak update ChatGPT zijn index? Continu, maar zichtbare effecten van site-changes verschijnen meestal binnen 1-3 weken voor populaire pagina's. Less-trafficked pagina's kunnen 4-8 weken duren.

Geeft een citatie altijd een klik? Nee. Veel citaties leiden niet tot een klik (zero-click answers). Maar de brand mention zelf heeft waarde — vergelijkbaar met een vermelding in een traditioneel medium.

Werkt het ook voor Nederlandse content? Ja, alle grote engines spreken vloeiend Nederlands. ChatGPT en Claude scoren goed op nuance, Perplexity is wat letterlijker maar prima.

Moet ik per AI-engine apart optimaliseren? 80% van de signalen werkt overal. De resterende 20% is engine-specifiek (bv. freshness telt extra zwaar bij Perplexity, structured data extra bij Google AI Overviews).


Geschreven door Richard van Leeuwen, founder van Priso. Bouwt sinds 2022 met AI-tools, sinds 2024 AI-agents in productie.