Aller au contenu
llmoptimisation.fr

Contenu

Structure de contenu pour les LLMs

Un bon contenu pour les moteurs IA n'est pas plus court ni plus long qu'un bon contenu pour un humain. Il est mieux découpé, mieux sourcé, mieux autoportant. Voici la grammaire de ce content design.

Mise à jour : 14 avril 2026 10 min de lecture

Principe central : écrire pour le retrieval

Les moteurs IA en mode recherche (ChatGPT Search, Perplexity, AI Overviews) fonctionnent en deux temps : un retrieval qui récupère des passages pertinents dans un corpus, puis une génération qui synthétise une réponse en citant ces passages. Optimiser pour le retrieval, c'est rendre chacun de vos paragraphes lisible hors contexte.

Chunking : la granularité qui compte

Les systèmes de retrieval découpent les documents en chunks de quelques centaines à quelques milliers de caractères. Les frontières de chunk suivent souvent la structure HTML (titres, paragraphes).

Composant HTMLRôle dans le chunkingBonne pratique
H2Frontière forteUn H2 = une intention distincte, avec sa requête de longue traîne implicite.
H3Frontière secondaireSous-question ou sous-aspect, jamais décoratif.
ParagrapheUnité de chunk typique3 à 6 lignes. Une idée par paragraphe.
ListeChunk quasi-extractible tel quelItems autoportants, pas de renvoi à "voir ci-dessus".
TableauTrès bien extraitEn-têtes clairs, cellules courtes, éviter les cellules fusionnées.

Autoportance : tester chaque passage

Test simple : copiez n'importe quel paragraphe de votre page et collez-le dans un message vide à un collègue. Si le paragraphe reste compréhensible, il est autoportant.

Contenu citation-friendly

Un passage cité est un passage que le modèle peut exhiber avec confiance. Il a trois caractéristiques :

  1. Une affirmation nette — "Google AI Overviews a été généralisé en France en 2025" est citable. "L'IA change le SEO" ne l'est pas.
  2. Un contexte minimum — qui, quoi, quand. Pas d'ambiguïté sur le sujet.
  3. Une vérifiabilité — une source externe, une donnée publiée, un auteur.

Entités et désambiguïsation

Les LLMs relient vos contenus à des entités. Si votre marque partage son nom avec autre chose (plante, personnalité, autre entreprise), la désambiguïsation est prioritaire. Techniques :

Anatomie d'une page GEO

  1. H1 — requête principale, 6 à 12 mots, sans superlatifs.
  2. Lede — 2 à 4 phrases qui répondent déjà à la question. Première phrase autoportante.
  3. Dates — publication + dernière mise à jour, visibles.
  4. H2 "En bref" — 3 à 5 puces, chacune citable telle quelle.
  5. Corps — 5 à 8 sections H2 couvrant les sous-intentions.
  6. Tableau ou checklist — au moins un élément dense et extractible.
  7. FAQ contextuelle — 3 à 6 questions locales, pas génériques.
  8. Maillage sortant — 3 à 6 liens internes contextuels, 1 à 3 liens externes sources.
  9. Auteur et organisation — schema.org Article + Organization.

Longueur, format, densité

Il n'y a pas de longueur magique. Une page doit couvrir son sujet, pas un quota de mots. Points repères :

Erreurs fréquentes observées

Checklist express

  • Chaque H2 porte une intention claire et reformule une requête.
  • Chaque paragraphe peut être lu isolément.
  • Chaque affirmation chiffrée est datée et sourcée.
  • Chaque acronyme est défini en première occurrence.
  • La page contient au moins un tableau ou une checklist.
  • La page porte une date de mise à jour visible.
  • Le maillage interne sort vers au moins 3 autres pages du site.
  • Les schemas schema.org sont validés.

À lire ensuite