Comment Google génère ses AI Overviews ?

Table des matières

La différence entre les chatbots LLM et des moteurs IA de type AI Overviews (ex-SGE), c’est que ces derniers sont reliés à l’index de Google.

Non seulement le LLM fournit une réponse mais il se nourrit des meilleurs résultats de recherche, grâce à une technique de RAG.

Nous l’avons vu précédemment, cela permet de réduire les risques d’hallucinations

Pourtant le géant de Mountain View reste prudent et avertit les utilisateurs sur son Search Labs.

Avertissement Google qualité réponses IA

Et il a de bonnes raisons de le faire. Les polémiques et les sujets de moqueries se sont multipliés au lancement officiel des AI Overviews en mai 2024. Ceci est particulièrement préoccupant dans les domaines YMYL (Your Money Your Life), comme la santé ou le droit.

Dans des exemples devenus célèbres, les réponses proposées par le nouveau moteur de recherche IA ont par exemple proposé de « manger un caillou par jour » ou encore « d’ajouter de la colle sur la pizza ».

Source : Twitter

La qualité des réponses proposées dans les encart IA de Google s’est progressivement améliorée depuis et les polémiques ont largement disparu. Voyons comment les réponses fournies par les AI Overviews sont construites d’un point de vue technique.

Le fonctionnement de Google SGE et des AI Overviews

Google est le moteur de recherche prédominant en Europe comme aux Etats-Unis, et de très loin. Dans le cadre de mon mémoire de MBA, j’ai effectué une étude quantitative qui confirme qu’il est le moteur de recherche par défaut de plus de 90% des utilisateurs.

Autant dire que l’impact potentiel des AI Overviews sur les marques et les professionnels du SEO peut être très important. Quand aux marques, elles s’inquiètent de ne plus recevoir de trafic organique.

C’est la raison pour laquelle nous allons nous concentrer sur le principe technique utilisé par Google. Nous verrons qu’il est assez proche des autres moteurs IA comme Perplexity, ChatGPT Search ou encore Bing Copilot.

Source : Enquête quantitative mémoire MBA DMB Efap

Google Search Generative Experience : un bon exemple de RAG

Annoncée lors de la conférence Google I/O en mai 2023, la Search Generative Experience (SGE) est « l’ancêtre » des encarts Google IA. Cette technologie a été proposée dans Search Labs jusqu’en mai 2024.

Son principe consistait à proposer des réponses générées par IA dans les résultats de recherche. L’objectif : fournir des réponses synthétiques et contextualisées à l’internaute selon ses requêtes.

Déployée dans plus de 120 pays, c’est un test à grande échelle qui n’était pas accessible par défaut. L’internaute devait activer l’option dans son Search Labs et Google restait très prudent quant aux réponses proposées. 

« Attention, on vous a bien dit que c’est une expérience, OK ? » 😉

Source : Google Search Labs

Nous avons vu précédemment comment fonctionne la Retrieval-Augmented Generation. Un texte est généré par une IA sur des informations récupérées en temps réel dans une base spécifique de connaissances.

C’est exactement le principe des moteurs IA de type SGE ou AI Overviews. A la différence des chatbots LLM (comme Claude, ChatGPT, Le Chat etc), ils sont reliés à l’index de Google. Non seulement l’outil fournit une réponse en langage naturel, mais il se nourrit des meilleurs résultats de recherche, grâce à une technique de RAG.

Voici ce que cela donne très schématiquement.

Google SGE AI Overviews principe de base

SGE utilisait principalement ces modèles d’intelligence artificielle pour générer ses réponses : 

  • LaMDA : Idéal pour les interactions conversationnelles et la compréhension du contexte dans les dialogues. C’est la partie intention de recherche.
  • PaLM 2 : Excellent pour traiter de grands volumes de données textuelles et effectuer des tâches linguistiques variées. Son architecture flexible facilite aussi la résolution de problèmes.
  • MUM : Capable de traiter et d’intégrer des informations multimodales et multilingues. Il offre des réponses enrichies et détaillées.

Les différences avec Google AI Overviews

Les réponses AI Overviews se basent sur une version adaptée de Gemini. Lancé fin 2023, Gemini est un modèle multimodal formé sur des données textuelles, des images, de l’audio et des vidéos.

Les fameuses données d’entraînement dont nous parlions dans l’article sur le fonctionnement des IA génératives.

Cela lui confère une capacité à comprendre et générer des réponses à partir de plusieurs types de données. Cette capacité multimodale enrichit sa compréhension contextuelle et sa puissance de raisonnement.

En revanche, la fonctionnalité « follow-up », qui permettait de relancer un échange conversationnel dans la SERP avec SGE, n’est plus disponible dans AI Overviews.

[edit mai 2025] Cette fonctionnalité est revenue sous une autre forme avec le AI Mode annoncé lors du Google I/O.

Simuler les réponses fournies par AI Overviews

Dans Google Cloud, il est possible d’aller sur Vertex AI et de simuler des réponses IA à des requêtes, que l’on va comparer aux réponses fournies par SGE ou les AI Overviews.

Généralement ces réponses sont très similaires.

Simulateur Gemini sur Vertex AI Google Cloud
Source : test Vertex AI

Comme Bard, Gemini est un modèle factuel, contrairement à GPT qui est un modèle génératif. Cela signifie que Google s’appuie sur des faits pour répondre.

Par exemple, si on demande quelque chose de particulier sur un sujet sensible, AI Overviews ne se déclenchera pas.

Il est possible de créer un agent autonome qui permettra de simuler Bard / Gemini et de se sourcer sur l’index de Google. Pour aller plus loin sur ces questions, je vous recommande l’excellente formation de Vincent Terrasi.

Google n’est pas le seul à proposer des réponses basées sur l’IA dans son moteur de recherche. La concurrence s’est accélérée avec l’essor de l’IA générative et le géant de Mountain View a décidé de riposter. Un bouleversement est en marche dans le Search Marketing.