📚 Glossaire français GEO - LLM - IA

Glossaire GEO & IA
le dictionnaire de référence

Plus de 120 termes définis : Generative Engine Optimization, LLM, IA générative, outils et stratégies. La ressource la plus complète en français.

120+termes définis
6catégories
2026mis à jour
A

AEO (Answer Engine Optimization)

CLÉGEOSEO

Discipline précurseur du GEO, l’AEO optimise le contenu pour répondre directement aux questions des utilisateurs. L’objectif : apparaître dans les featured snippets, les réponses vocales et les panneaux de connaissances. C’est le pont entre le SEO traditionnel et le GEO moderne.

Agent IA

IALLM

Programme autonome basé sur un LLM capable de planifier et exécuter des tâches complexes en enchaînant des actions (navigation web, exécution de code, appels API) sans intervention humaine continue. Ex. : GPT-4o avec plugins, Devin, AutoGPT.

AI Overview (AIO)

CLÉGEOSEO

Fonctionnalité de Google qui génère une réponse synthétique affichée en haut des SERP. Produite par IA à partir de sources sélectionnées, l’AIO est l’un des principaux enjeux du GEO : être cité comme source.

Anthropic

IAOutil

Entreprise américaine d’IA fondatrice de Claude. Spécialisée dans la recherche sur la sécurité des IA (AI safety), elle développe des LLM constitutionnels visant à aligner l’IA sur les valeurs humaines.

Attention (mécanisme d’)

TechLLM

Composant clé de l’architecture Transformer permettant au modèle de pondérer l’importance de chaque token. C’est ce mécanisme qui permet à un LLM de comprendre le contexte et les relations sémantiques entre les mots.

Autorité thématique (Topical Authority)

CLÉGEOSEO

Niveau de reconnaissance d’une source comme référence dans un domaine précis. Les LLM privilégient les sites couvrant exhaustivement un sujet plutôt que ceux qui l’effleurent. En GEO, construire une autorité thématique est fondamental pour être cité.

Autorisation crawlers IA

GEOTech

Configuration explicite du robots.txt autorisant les robots IA (GPTBot, ClaudeBot, PerplexityBot, Anthropic-AI, Googlebot). Sans cette autorisation, votre contenu peut être invisible des LLM qui respectent le fichier robots.

B

Bard

OutilIA

Ancien nom de l’assistant IA de Google, renommé Gemini en février 2024. Basé sur les modèles LaMDA puis PaLM, il a été l’un des premiers concurrents directs de ChatGPT.

Biais de confirmation (IA)

IA

Tendance d’un LLM à privilégier des informations confirmant des patterns vus en entraînement, même si des données contradictoires existent. Important pour anticiper comment les LLM présentent une marque.

Bing Chat / Microsoft Copilot

Outil

Assistant conversationnel de Microsoft intégré à Bing, propulsé par GPT-4, rebaptisé Microsoft Copilot en 2023. Nécessite une stratégie GEO adaptée car il indexe via Bing.

Bot crawling (crawl IA)

TechGEO

Processus par lequel les robots des moteurs IA parcourent et indexent le web. GPTBot (OpenAI), ClaudeBot (Anthropic), PerplexityBot et GoogleBot sont les principaux agents à autoriser dans le robots.txt.

C

ChatGPT

CLÉOutilLLM

Assistant conversationnel d’OpenAI basé sur GPT-4o. L’une des interfaces IA les plus utilisées au monde. Depuis 2024, ChatGPT dispose d’une recherche web en temps réel, rendant l’optimisation GEO cruciale pour y être référencé.

Chunking sémantique

CLÉTechGEO

Découpage intelligent du contenu en blocs sémantiques cohérents que les systèmes RAG peuvent traiter et récupérer. Un bon chunking structure le contenu en unités autonomes, augmentant les chances d’être sélectionné comme passage source.

Citation IA

CLÉGEO

Mention explicite d’une marque, d’un site ou d’un auteur par une IA générative dans sa réponse. En GEO, obtenir des citations est l’objectif central : cela traduit autorité, pertinence et fiabilité aux yeux des LLM.

Claude (Anthropic)

CLÉOutilLLM

Assistant IA d’Anthropic, disponible en versions Haiku, Sonnet et Opus. Claude se distingue par sa fenêtre de contexte très large (jusqu’à 200 000 tokens) et ses principes d’alignement constitutionnel. Son crawler ClaudeBot indexe le web.

ClaudeBot

TechGEO

Crawler officiel d’Anthropic qui indexe le contenu web pour alimenter Claude. À autoriser dans le robots.txt : User-agent: ClaudeBot / Allow: /.

Clustering thématique

SEOGEO

Organisation du contenu en silos thématiques cohérents (page pilier + sous-pages satellites). En GEO, un cluster bien structuré signale aux LLM une couverture exhaustive d’un sujet, renforçant l’autorité thématique.

Contenu généré par IA (AIGC)

IAGEO

Textes, images, vidéos produits automatiquement par un modèle d’IA générative. Google l’accepte si le contenu apporte de la valeur réelle, mais sanctionne la production en masse sans expertise humaine.

Contenu YMYL (Your Money Your Life)

SEOGEO

Catégorie de contenus à fort impact (santé, finance, droit) soumis à des critères d’E-E-A-T très stricts par Google et les LLM. Ces contenus requièrent une expertise démontrée et des sources citées.

Context Window (fenêtre de contexte)

CLÉLLMTech

Quantité maximale d’information (en tokens) qu’un LLM peut traiter en une seule interaction. GPT-4 Turbo : 128K tokens, Claude : 200K, Gemini 1.5 Pro : 1M+. Les contenus concis sont favorisés car ils consomment moins de tokens.

Conversational Search

GEOSEO

Paradigme où l’utilisateur interagit via un dialogue en langage naturel plutôt que des mots-clés isolés. Les contenus GEO doivent adopter une structure Q&R et un vocabulaire naturel pour répondre à ce mode de recherche.

Copilot (Microsoft)

Outil

Assistant IA de Microsoft intégré dans Windows, Edge, Bing et Office 365. Basé sur GPT-4, il est l’un des moteurs génératifs majeurs à considérer dans une stratégie GEO ciblant les utilisateurs Microsoft.

Corpus d’entraînement

LLMTech

Ensemble massif de données textuelles sur lesquelles un LLM est entraîné. Les modèles modernes sont entraînés sur des centaines de milliards de tokens issus du web, de livres et de bases de données spécialisées.

Core Web Vitals

SEOTech

Métriques de performance UX de Google (LCP, INP, CLS). Facteur de classement SEO et signal indirect de qualité pour les LLM, qui favorisent les sources rapides et stables.

Crawl budget

SEOTech

Nombre de pages qu’un robot est prêt à crawler dans un laps de temps donné. Une architecture propre et un robots.txt bien configuré optimisent le crawl budget pour les bots IA.

D

DALL-E (OpenAI)

IAOutil

Modèle de génération d’images d’OpenAI à partir de descriptions textuelles. Intégré à ChatGPT, DALL-E 3 représente l’extension multimodale de l’IA générative au-delà du texte.

Date de coupure (Training Cutoff)

LLM

Date à partir de laquelle les données d’entraînement d’un LLM s’arrêtent. Après cette date, le modèle n’a plus de connaissances internes. Le RAG permet de contourner cette limitation.

Deepfake

IA

Contenu médiatique (vidéo, image, audio) généré ou manipulé par IA. Représente un risque majeur de désinformation à l’ère des IA génératives.

DeepL

OutilIA

Service de traduction automatisée basé sur l’IA, connu pour sa qualité linguistique supérieure. Utilisé en GEO pour produire du contenu multilingue optimisé.

DeepSeek

LLMOutil

LLM open source développé par une entreprise chinoise, ayant créé une forte surprise en 2025 par ses performances comparables à GPT-4 à moindre coût.

Dense Passage Retrieval (DPR)

TechLLM

Technique de recherche sémantique dense utilisée dans les systèmes RAG. Contrairement à la recherche par mots-clés, le DPR compare des représentations vectorielles pour trouver les passages les plus proches sémantiquement.

Domain Authority (DA)

SEOGEO

Score prédictif de la capacité d’un domaine à se classer en recherche organique. Un DA élevé augmente la probabilité d’être cité par les LLM comme source autoritaire.

Données premières (First-Party Data)

SEOGEO

Données collectées directement auprès de vos utilisateurs. En GEO, les contenus basés sur des données exclusives (enquêtes, études) sont très cités car ils apportent une information unique.

Données structurées (Structured Data)

CLÉTechGEOSEO

Balisage sémantique standardisé (JSON-LD, Microdata) utilisant Schema.org pour décrire le contenu d’une page aux moteurs et aux LLM. Les types Article, FAQ, HowTo, Person sont particulièrement efficaces pour le GEO.

E

E-E-A-T

CLÉGEOSEO

Cadre d’évaluation Google (Experience, Expertise, Authoritativeness, Trustworthiness). Adopté par les LLM pour juger la qualité des sources. Un contenu signé par un auteur identifié, avec biographie et liens externes, maximise l’E-E-A-T.

Embeddings (vecteurs)

CLÉTechLLM

Représentations numériques (vecteurs mathématiques) de mots, phrases ou concepts permettant aux LLM de mesurer la proximité sémantique. Fondamentaux pour les systèmes RAG : « voiture" et « automobile" auront des embeddings proches.

Entity Salience

TechGEO

Importance relative d’une entité dans un texte, évaluée par les LLM. Plus une entité est saillante (fréquemment mentionnée, associée à des concepts clés), plus elle a de chances d’être citée.

Entité nommée (Named Entity)

CLÉTechGEO

Personne, lieu, organisation, produit ou concept que les LLM reconnaissent comme une entité unique. Plus votre marque est reconnue dans le Knowledge Graph, plus elle a de chances d’être citée spontanément.

F

Featured Snippet

SEOGEO

Encadré Google affichant une réponse directe en haut des résultats. Précurseur des AI Overviews, il reste un signal fort de crédibilité pour les LLM qui l’utilisent souvent comme source prioritaire.

Fine-tuning

LLMTech

Ajustement d’un LLM pré-entraîné sur un corpus spécialisé. Différent du RAG : le fine-tuning modifie les poids du modèle, le RAG enrichit les entrées en temps réel.

Freshness Signals

GEOSEO

Indicateurs de mise à jour du contenu pris en compte par les LLM pour privilégier les informations récentes. Mettre à jour les articles et afficher une date explicite améliore les signaux de fraîcheur.

Flux RSS

TechGEO

Format de syndication de contenu permettant aux crawlers IA de suivre les nouvelles publications. Un flux RSS actif signale une source régulièrement mise à jour, améliorant les freshness signals.

G

Gemini (Google)

CLÉOutilLLM

Famille de LLM de Google (Nano, Flash, Pro, Ultra). Successeur de Bard, il alimente Google AI Overviews et Google Search. Sa fenêtre de contexte (1M+ tokens pour Pro) est l’une des plus grandes du marché.

Gemini Advanced

OutilLLM

Version premium de Gemini basée sur Gemini Ultra. Offre des capacités de raisonnement avancées, une longue fenêtre de contexte et des fonctionnalités de création de contenu supérieures.

GEO (Generative Engine Optimization)

CLÉGEO

Ensemble de stratégies et techniques visant à optimiser un contenu web pour qu’il soit découvert, compris et cité comme source fiable par les moteurs IA (ChatGPT, Perplexity, Google AI Overviews). Le GEO complète le SEO sans le remplacer.

Google AI Overviews

CLÉGEOSEOOutil

Fonctionnalité de Google Search générant une synthèse IA en tête de page. Lancé progressivement depuis 2024, il capte une part croissante des clics et représente l’enjeu GEO le plus stratégique pour les marques.

GPT (Generative Pre-trained Transformer)

CLÉLLM

Famille de LLM d’OpenAI : GPT-3.5, GPT-4, GPT-4o, GPT-4.5. GPT-4o (omni) traite texte, images et audio. Moteur de ChatGPT et de nombreux outils tiers.

GPT-4o (omni)

LLMOutil

Version multimodale de GPT-4 capable de traiter et générer du texte, des images et de l’audio. Modèle principal de ChatGPT depuis 2024.

GPTBot

TechGEO

Crawler officiel d’OpenAI utilisé pour indexer le web. À autoriser dans le robots.txt : User-agent: GPTBot / Allow: /.

Grok (xAI)

LLMOutil

LLM développé par xAI (Elon Musk). Intégré à la plateforme X (ex-Twitter), Grok a accès aux données en temps réel de X.

GSO (Global Search Optimization)

GEOSEO

Stratégie globale combinant SEO, GEO, réseaux sociaux et tous les leviers de visibilité digitale. Le GSO vise à diffuser le bon contenu au bon endroit pour être présent partout où un utilisateur peut chercher.

H

Hallucination (IA)

CLÉLLMIA

Tendance d’un LLM à générer des informations factuellement fausses mais présentées avec assurance. Les systèmes RAG réduisent ce phénomène en ancrant les réponses dans des sources vérifiables.

Horizon GEO

GEOOutil

Premier blog français spécialisé dans le GEO et les LLM, publié par Digital-m. Ressource de référence pour comprendre l’optimisation pour les moteurs génératifs en langue française.

HuggingFace

OutilIA

Plateforme open source référente dans l’écosystème IA, hébergeant des milliers de modèles et datasets. Connue pour sa bibliothèque Transformers et son Hub de modèles pré-entraînés.

I

IA générative (Generative AI)

CLÉIA

Branche de l’intelligence artificielle capable de créer de nouveaux contenus (texte, image, audio, code, vidéo) à partir de patterns appris. Les LLM comme GPT, Claude et Gemini en sont les représentants les plus connus.

Index LLM

LLMGEO

Ensemble des informations intégrées dans un LLM lors de son entraînement ou récupérées via RAG. Être présent dans l’« index" d’un LLM signifie que celui-ci connaît votre entité et peut la citer spontanément.

Indexabilité GEO

GEOTech

Capacité d’un contenu à être exploré, compris et intégré par les LLM. Elle dépend de l’autorisation des crawlers, de la structure HTML, des données structurées et de la vitesse de chargement.

Inférence

LLMTech

Phase d’utilisation d’un modèle entraîné pour générer une réponse. Contrairement à l’entraînement, l’inférence n’implique pas de mise à jour des paramètres du modèle.

Intention de requête (Search Intent)

SEOGEO

Objectif réel derrière une requête (informationnelle, transactionnelle, navigationnelle). Les LLM analysent finement l’intention pour sélectionner les meilleures sources : aligner son contenu sur l’intention est fondamental en GEO.

Interface conversationnelle

IAOutil

Application permettant à un utilisateur de dialoguer avec une IA en langage naturel (ChatGPT, Le Chat, Perplexity). Porte d’entrée principale de l’ère GEO.

J

JSON-LD

CLÉTechSEOGEO

Format de balisage sémantique recommandé par Google, inséré dans