En bref
- ChatGPT Search et Perplexity crawlent votre site via des bots IA ; ils doivent être autorisés dans votre robots.txt et votre WAF.
- Les moteurs génératifs extraient des passages, pas des pages entières : chaque paragraphe doit être lisible hors contexte.
- Les affirmations citées ont trois caractéristiques : nettes, datées, sourcées.
- L'autorité de domaine reste le filtre de premier niveau : sans bon SEO, le GEO pur est inefficace.
- Il n'existe pas de placement payant dans les réponses organiques de ces moteurs en 2026.
Comment fonctionnent ChatGPT et Perplexity quand ils répondent
Avant d'optimiser, comprendre le mécanisme. Quand un utilisateur pose une question à Perplexity ou à ChatGPT Search, le système opère en deux temps :
- Retrieval. Le moteur découpe le web (ou son index) en morceaux (chunks) et sélectionne les passages les plus pertinents pour la requête.
- Génération. Le modèle de langage rédige une réponse en s'appuyant sur les passages retenus, qu'il cite en source.
Optimiser pour ce système, c'est optimiser pour les deux étapes : d'abord être trouvé lors du retrieval (technique, crawlabilité, autorité), ensuite être choisi lors de la génération (passage clair, affirmation nette, sourcing crédible).
Règle fondamentale : un passage cité est un passage que le modèle peut reproduire avec confiance. S'il est ambigu, flou ou dépendant du contexte environnant, il ne sera pas sélectionné.
Conditions préalables : votre site doit être accessible
Avant toute optimisation éditoriale, vérifiez que les bots de recherche IA peuvent accéder à votre site. C'est la cause numéro un des sites absents des réponses IA alors qu'ils auraient les contenus pertinents.
Vérifier que les bots IA sont autorisés
Les bots de recherche en temps réel sont distincts des bots d'entraînement. Pour être visible dans les réponses de ChatGPT Search et Perplexity, les bots suivants doivent pouvoir crawler votre site :
| Moteur | Bot de recherche (temps réel) | Bot d'entraînement |
|---|---|---|
| ChatGPT Search | OAI-SearchBot | GPTBot |
| Perplexity | PerplexityBot | PerplexityBot |
| Google AI Overviews | Googlebot | Google-Extended |
| Claude (recherche) | ClaudeBot, Claude-Web | anthropic-ai |
Le piège fréquent : Cloudflare et les WAF cloud bloquent parfois les bots IA par défaut (option « Block AI scrapers »). Vérifiez vos règles avant toute autre action.
À vérifier en priorité : testez aveccurl -A 'PerplexityBot' https://votresite.fr/pageetcurl -A 'OAI-SearchBot' https://votresite.fr/page. Si vous obtenez un 403, le bot est bloqué.
Contenu accessible sans JavaScript
Les bots IA exécutent rarement le JavaScript. Si votre site est une SPA (React, Vue, Angular) qui rend son contenu côté client, les bots ne voient qu'une page vide. Vérifiez que le contenu critique est présent dans le HTML statique renvoyé par le serveur (SSR ou SSG). Testez avec curl https://votresite.fr/page sans exécuter de JavaScript.
Optimisation éditoriale : rendre votre contenu citable
La technique donne accès au site. L'éditorial détermine si votre contenu est cité plutôt que celui du concurrent.
Paragraphes autoportants
Chaque paragraphe doit répondre à une question de manière autonome. Testez : copiez un paragraphe et lisez-le indépendamment. Si quelqu'un qui n'a pas lu le reste comprend le message, le paragraphe est autoportant.
- Évitez les pronoms orphelins : « il permet » sans référent explicite est faible.
- Renommez les entités en début de section : « ChatGPT Search » plutôt que « le moteur ».
- Datez les affirmations temporelles : « en avril 2026 », pas « récemment ».
- Définissez les acronymes localement, pas seulement en haut de page.
Affirmations nettes et sourcées
Un modèle cite ce qu'il peut exhiber avec confiance. Une affirmation citable a trois attributs : nette (« Perplexity a dépassé 10 millions d'utilisateurs actifs journaliers en 2025 » plutôt que « Perplexity croît vite »), située dans le temps (date ou période précise) et vérifiable (source nommée).
Structure de titres orientée requêtes
Chaque H2 doit correspondre à une intention de recherche distincte. Les systèmes de retrieval découpent les documents en chunks, et les frontières HTML (H2, paragraphes) influencent ces coupes.
- H2 descriptifs : « Comment vérifier si vos bots IA sont bloqués » vaut mieux que « Vérification ».
- Une intention par section, pas deux sujets mélangés sous un même H2.
- H2 sans superlatifs : « Outils de monitoring des citations IA en 2026 » est citable, « Les meilleurs outils » ne l'est pas.
Parts de marché des moteurs IA en 2026
Avant d'optimiser, savoir où vous êtes vu. Selon l'étude Goodie Wave 2 (publiée le 21 mai 2026, 41 marques B2B, données mars-avril 2026, 25,77 milliards de visites SimilarWeb) :
| Moteur IA | Part des référents IA | Évolution vs mai-août 2025 |
|---|---|---|
| ChatGPT Search | 62,6 % | Recul depuis 89,1 % |
| Claude (Anthropic) | 18,5 % | +17 points depuis 1,4 % |
| Gemini | 10,6 % | Stable |
| Perplexity | 7,3 % | Léger recul |
| Microsoft Copilot | ~4 % | Stable |
Google AI Overviews n'apparaît pas dans ces chiffres car son trafic est comptabilisé dans la recherche organique Google. En volume d'impressions brutes sur les requêtes informationnelles, c'est la surface la plus importante. Pour comprendre les mécanismes de sélection spécifiques à chaque moteur, voir le guide GEO complet.
Spécificités de chaque moteur
ChatGPT Search (OpenAI)
ChatGPT Search est activé automatiquement quand OpenAI juge la requête « web-dépendante » (informations récentes, actualités, comparatifs, prix). Le bot OAI-SearchBot crawle les pages en temps réel et sélectionne des passages.
- Privilégie les sources à forte autorité de domaine dans Google ; ChatGPT Search s'appuie sur l'index Bing et ses propres signaux.
- Les pages aux dates de mise à jour récentes sont mieux représentées sur les requêtes d'actualité.
- La hiérarchie de titres est directement exploitée pour la découpe en passages.
- Les citations apparaissent avec le titre de page et le domaine : un H1 précis améliore le taux d'affichage.
Perplexity
Perplexity est né comme moteur de recherche IA, plus agressif sur le sourcing que ChatGPT. Il affiche systématiquement des sources numérotées.
- Crawle en temps réel pour toutes les requêtes, pas seulement celles jugées « web-dépendantes ».
- Ses réponses incluent souvent 3 à 6 sources distinctes : il y a plus de places à prendre que sur les AI Overviews.
- La fraîcheur est un critère fort : re-dater une page existante suffit parfois à récupérer des citations perdues.
- Référence volontiers des blogs et sites spécialisés à côté des grands médias, une ouverture pour les sites de niche.
Google AI Overviews
Les AI Overviews apparaissent en haut des résultats Google pour certaines requêtes, avant les liens classiques, et citent 3 à 8 sources.
- S'appuient sur l'index Google classique : être bien positionné dans Google est un prérequis fort.
- Les schemas FAQPage et HowTo augmentent la probabilité d'être sélectionné.
- Déclenchés surtout sur les requêtes informationnelles (« comment », « qu'est-ce que », « différence entre »).
- Utilisez Google Search Console (rapport AI Overviews) pour suivre vos impressions sur cette surface.
Claude (Anthropic)
Claude effectue aussi des recherches web via ClaudeBot et Claude-Web. Son comportement est similaire : il sélectionne des passages lors du retrieval et les cite. Le bot doit être autorisé dans le robots.txt.
L'entité de marque : l'élément sous-estimé
Les LLMs associent votre contenu à une entité. Si votre marque est floue, mal définie ou confondue avec une autre du même nom, le modèle ne vous citera pas de manière consistante, même si votre contenu est excellent.
- Nommez systématiquement votre organisation sur chaque page, pas seulement la page d'accueil.
- Publiez une page À propos avec dates, lieux, activités, secteur, membres d'équipe clés.
- Utilisez
sameAsdans votre schema Organization vers Wikipedia, LinkedIn, Wikidata, Crunchbase. - Maintenez la cohérence cross-canal : même nom, même description, même secteur partout.
L'autorité de domaine reste le filtre de premier niveau
Tous les moteurs IA avec recherche temps réel utilisent un index web existant (Bing, leur propre crawl) et appliquent des filtres de qualité. Un site sans liens entrants, sans trafic organique, sans historique d'indexation a très peu de chances d'être sélectionné, même avec un contenu parfaitement structuré.
Le SEO classique et le GEO ne sont pas en compétition : un bon classement dans Google augmente directement la probabilité d'être cité par les moteurs IA. Backlinks, maillage interne, éditorial de qualité et fréquence de publication restent la base.
Un site récent (moins de 6 mois, sans backlinks notables) doit construire son autorité SEO avant de voir des résultats significatifs dans les réponses IA. Pas de raccourci ici.
Erreurs fréquentes
- Optimiser l'éditorial sans vérifier les bots : si OAI-SearchBot ou PerplexityBot est bloqué, tout le reste est inutile.
- Croire que publier un llms.txt suffit : utile mais mineur, ce n'est pas un ticket d'accès aux réponses IA.
- Contenu généré par IA non révisé : les modèles dévalorisent les formulations vides. Un article de 2 000 mots bien révisé bat 10 articles IA non retravaillés.
- Copier le contenu concurrent : les modèles favorisent les sources originales. Apportez données, retours d'expérience, angles inédits.
- Publier sans fraîcheur : une page non mise à jour depuis 18 mois perd en pertinence sur les requêtes temporellement sensibles. Re-datez les contenus stratégiques tous les 6 mois.
- Viser des requêtes trop génériques : ciblez des questions précises (« comment optimiser robots.txt pour les bots IA ») où peu de sites ont une réponse structurée.
Plan d'action en 4 semaines
- Semaine 1, diagnostic. Vérifiez que OAI-SearchBot, PerplexityBot et ClaudeBot ne sont pas bloqués. Testez 10 requêtes clés sur Perplexity et ChatGPT Search. Notez qui est cité.
- Semaine 2, technique. Corrigez le robots.txt et le WAF si nécessaire. Vérifiez le rendering (HTML statique). Validez vos schemas (Organization, Article, FAQPage).
- Semaine 3, éditorial. Prenez vos 3 pages les plus pertinentes et réécrivez chaque paragraphe pour l'autoportance. Ajoutez chiffres, dates, sources. Restructurez les H2 en intentions de requêtes.
- Semaine 4, autorité et mesure. Publiez ou mettez à jour une page À propos complète. Ajoutez sameAs dans le schema Organization. Soumettez vos URLs via IndexNow. Re-testez les 10 requêtes.
Checklist : suis-je visible ?
- OAI-SearchBot, PerplexityBot et ClaudeBot autorisés dans robots.txt.
- Aucune règle WAF ou Cloudflare ne bloque les bots IA.
- Contenu critique présent dans le HTML statique (sans JavaScript).
- Chaque paragraphe clé lisible hors contexte.
- Chaque affirmation chiffrée est datée et sourcée.
- Schema Organization avec sameAs vers profils officiels.
- Page À propos avec dates, activités, contacts, référençable.
- H2 descriptifs orientés intentions de requêtes.
- Date de mise à jour visible et authentique sur les pages stratégiques.
- Site positionné sur des mots-clés de longue traîne dans Google (signal d'autorité).
Foire aux questions
Peut-on payer pour apparaître dans ChatGPT ou Perplexity ?
Non. Aucun de ces moteurs ne propose de placement payant dans ses réponses organiques en 2026. OpenAI, Perplexity et Google n'acceptent pas de rémunération pour favoriser des sources dans leurs réponses génératives. La seule voie est l'optimisation éditoriale et technique. Certains moteurs proposent des formats publicitaires distincts des réponses : c'est une surface différente, clairement labelisée.
ChatGPT visite-t-il mon site en temps réel ?
Cela dépend du mode. En mode standard (sans navigation), ChatGPT s'appuie sur ses données d'entraînement et ne crawle pas votre site en direct. En mode ChatGPT Search, OAI-SearchBot crawle les pages en temps réel. Les deux bots OpenAI (GPTBot pour l'entraînement, OAI-SearchBot pour la recherche) doivent donc être autorisés dans votre robots.txt et non bloqués par votre WAF.
Combien de temps faut-il pour apparaître dans les réponses IA ?
Il n'y a pas de délai garanti, et c'est une différence fondamentale avec le SEO classique. La visibilité IA dépend du crawl (quelques jours à semaines pour les bots de recherche temps réel), de l'entraînement (mois à années pour les modèles de base) et de la pertinence de la requête. Sur Perplexity et ChatGPT Search, des améliorations sont parfois perceptibles en 2 à 8 semaines après la publication d'un contenu structuré.
Faut-il créer du contenu différent pour chaque moteur IA ?
Non. Un bon contenu GEO est optimisé une fois et fonctionne sur tous les moteurs, parce qu'ils partagent les mêmes critères : passage autoportant, affirmation nette, sourcing. Les différences entre ChatGPT Search et Perplexity sont marginales au niveau éditorial. L'essentiel est un contenu structuré, frais et citable, pas une adaptation du fond par moteur.
Mon concurrent est cité à ma place, que faire ?
Analysez d'abord pourquoi : son passage est-il plus court, plus direct, mieux sourcé ? Sa page est-elle structurée en sections H2 claires ? A-t-il une autorité de domaine plus forte ? La réponse est presque toujours éditoriale. Créez un contenu qui répond plus directement à la requête, avec des chiffres, des dates, des affirmations nettes. Vérifiez aussi que votre site n'est pas bloqué pour les bots de recherche IA.
Le fichier llms.txt aide-t-il à apparaître dans ChatGPT ?
Marginalement. Le fichier llms.txt est une convention récente (2024) qui signale aux LLMs les sections de votre site. Son adoption par ChatGPT et Perplexity reste limitée en 2026. Il est recommandé de le publier (effort négligeable), mais ce n'est pas un levier décisif pour la visibilité dans les réponses à court terme.
À lire ensuite : le guide GEO complet (leviers Princeton, parts de marché 2026), la méthode complète en 6 étapes, l'optimisation technique (robots.txt, bots IA, rendering), la structure de contenu (chunking, autoportance) et le guide llms.txt.