Un des éléments fondamentaux du SEO technique est le sitemap. Il s’agit d’un fichier qui vous permet de guider les moteurs de recherche sur votre site, de lister à leurs robots les liens menant vers les contenus de votre site. Si vous n’en avez pas encore pour votre site, ou souhaitez connaître les erreurs à éviter, je vous invite à lire cet article.
Définition du sitemap
Le sitemap, qu’on appelle aussi « plan de site » en français, est un fichier qui répertorie toutes les URL de votre site web. C’est une sorte de carte routière qui indique aux moteurs de recherche comme Google ou Bing les pages existantes sur votre site internet.
Ce fichier peut prendre deux formats principaux : le format XML (destiné aux robots d’indexation) ou le format HTML (pensé pour les visiteurs humains), même si depuis quelques années, on retrouve aussi le format TXT, bien que rare. Dans les deux cas, l’objectif reste le même : faciliter la navigation et l’exploration de votre contenu.
Concrètement, un sitemap XML ressemble à un fichier texte structuré qui liste vos pages avec des informations complémentaires : la date de dernière modification, la fréquence de mise à jour, ou encore la priorité de chaque page. Le sitemap HTML, lui, se présente plutôt comme une page web classique avec des liens organisés de manière hiérarchique.
Pour les propriétaires de sites, c’est un outil gratuit qui joue un rôle déterminant dans le processus d’indexation. Sans sitemap, les crawlers doivent explorer votre site uniquement via les liens internes, ce qui peut poser problème si votre maillage interne n’est pas optimal.
Pourquoi créer un sitemap pour son site web ?
Le sitemap a beaucoup d’avantages pour le référencement naturel d’un site web. Bien évidemment, je ne vais pas tous les présenter ici, juste quelques-uns, notamment ceux du format XML, donc destiné aux crawlers.

Faciliter le travail des robots d’indexation
Les robots des moteurs de recherche, qu’on appelle aussi crawlers ou spiders, parcourent le web en permanence pour découvrir et indexer les pages. Le Googlebot, par exemple, suit les liens de page en page pour comprendre la structure de votre site.
Le problème, c’est que Sans sitemap, certaines pages peuvent passer inaperçues. Si vous avez des pages profondes dans l’arborescence de votre site, ou des pages avec peu de liens entrants, le robot d’indexation risque de ne jamais les trouver. Le sitemap XML résout ce problème en indiquant directement toutes les URL à explorer.
Accélérer l’indexation des nouvelles pages
Quand vous publiez du nouveau contenu sur votre site, vous voulez qu’il apparaisse rapidement dans les résultats de recherche. Le sitemap permet justement de soumettre rapidement vos nouvelles pages aux moteurs de recherche.
Dès que vous mettez à jour votre fichier XML avec les nouvelles URL, vous pouvez le soumettre via la Search Console. Les bots vont alors découvrir ces pages beaucoup plus vite que si vous attendiez qu’ils tombent dessus par hasard lors d’un crawl classique.
Cette rapidité d’indexation est particulièrement importante pour les sites d’actualité, les blogs qui publient régulièrement, ou les sites e-commerce qui ajoutent fréquemment de nouveaux produits. Chaque jour de retard dans l’indexation, c’est du trafic de recherche potentiel perdu.
Améliorer le référencement naturel de son site
Le sitemap contribue indirectement à votre SEO en optimisant le crawl de votre site. Quand les robots d’indexation comprennent mieux votre structure, ils peuvent allouer leur budget de crawl plus efficacement.
Le budget de crawl, c’est le nombre de pages que Googlebot va explorer sur votre site lors de chaque visite. Pour les gros sites avec de nombreuses pages, ce budget est limité. Un sitemap bien conçu aide à prioriser l’exploration des pages importantes, celles qui génèrent du trafic ou qui ciblent vos mots-clés principaux.
Sitemap XML ou Sitemap HTML : lequel choisir pour son site ?
Les deux formats de sitemap ont des objectifs différents et, idéalement, vous devriez avoir les deux sur votre site internet, comme c’est le cas sur mon site. Ils ne sont pas en concurrence, mais complémentaires.
Qu’est-ce que le sitemap XML ?
Le sitemap XML est celui qui intéresse directement le référencement. C’est un fichier au format texte encodé en UTF-8 que les robots lisent pour indexer votre contenu. Vous le placez généralement à la racine de votre domaine (exemple : https://romariconel.com/sitemap_index.xml) et vous le soumettez via la Google Search Console ou Bing Webmaster Tools.
Ce fichier sitemap contient des balises spécifiques qui donnent deux informations capitales aux moteurs de recherche :
- la balise <loc> pour l’URL de la page,
- <lastmod> pour la date de dernière modification.
Dans certains sitemaps, vous pouvez voir encore des balises comme le <changefreq> ou le <priority>, mais Google les ignore désormais. Dans d’autres, vous verrez également la balise image:image, comme c’est mon cas ; elle inclut seulement les images sur la page pour faciliter leur indexation.
Qu’est-ce que le sitemap HTML ?
Le sitemap HTML, lui, s’adresse aux visiteurs humains. C’est une page web classique, accessible via un lien, qui présente l’organisation de votre site de manière claire et hiérarchique. Elle aide vos utilisateurs à naviguer et à trouver rapidement l’information qu’ils cherchent.
Personnellement, dans le footer de chaque page de mon propre site, j’ai mis le lien vers ce sitemap HTML pour faciliter la navigation. Les visiteurs qui se sentent perdus peuvent cliquer dessus et avoir une vue d’ensemble de tout le contenu disponible. C’est particulièrement utile pour les gros sites avec beaucoup de rubriques.
La différence fondamentale, c’est que le sitemap XML vise l’optimisation technique pour les moteurs de recherche, tandis que le sitemap HTML améliore l’expérience utilisateur.
Comment créer un sitemap pour son site web ?
La méthode pour créer un fichier sitemap dépend principalement de votre CMS et de la taille de votre site. Si vous êtes sous WordPress, Prestashop ou Magento, la tâche est grandement simplifiée grâce aux extensions disponibles.
Pour WordPress, plusieurs plugins permettent de générer automatiquement votre sitemap XML. Yoast SEO et Rank Math sont les plus populaires. Une fois le plugin installé, il génère le fichier et le met à jour automatiquement à chaque fois que vous publiez ou modifiez du contenu. Vous n’avez rien à faire manuellement. Le fichier est accessible à l’adresse monsite.com/sitemap_index.xml pour Yoast, par exemple.
Ces outils gèrent aussi la pagination, les balises canoniques, et peuvent exclure certaines pages que vous ne souhaitez pas indexer. Vous pouvez configurer le plugin pour ne pas inclure les pages d’archives, les tags, ou certaines catégories dans le sitemap. C’est particulièrement utile pour éviter les duplications de contenu.
Si vous n’utilisez pas de CMS ou si vous avez un site développé sur mesure, vous devrez alors créer le fichier manuellement ou utiliser un générateur en ligne. Pour les petits sites avec peu de pages, un éditeur de texte suffit. Vous créez un fichier .xml avec la structure appropriée, en respectant le format défini par le protocole sitemap.org.
Voici la structure minimale à suivre pour chaque sous-sitemap que vous indiquerez par la suite dans le sitemap index :
<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="//romariconel.com/main-sitemap.xsl"?>
<urlset
xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:image="http://www.google.com/schemas/sitemap-image/1.1"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd
http://www.google.com/schemas/sitemap-image/1.1 http://www.google.com/schemas/sitemap-image/1.1/sitemap-image.xsd">
<url>
<loc>https://romariconel.com/</loc>
<lastmod>2025-04-09T17:30:37+00:00</lastmod>
<image:image><image:loc>https://romariconel.com/wp-content/uploads/2025/03/Romaric-Onel-Hounsinou-Sniper-du-SEO-.webp</image:loc></image:image>
</url>
<url>
<loc>https://romariconel.com/blog/</loc>
<lastmod>2025-09-06T13:36:00+00:00</lastmod>
<image:image><image:loc>https://romariconel.com/wp-content/uploads/2024/12/blog-sur-le-seo.webp</image:loc></image:image>
</url>
</urlset>
Si vous avez un gros site, un générateur automatique devient nécessaire. Des outils comme Screaming Frog peuvent crawler votre site et créer le fichier XML automatiquement. Vous pouvez aussi développer un script qui interroge votre base de données pour lister toutes les URL et générer le fichier.
Une fois le fichier créé, vous devez le placer à la racine de votre site (dans le répertoire root accessible via FTP) et référencer son emplacement dans votre fichier robots.txt. Ajoutez simplement la ligne : Sitemap: https://monsite.com/sitemap.xml.
Pour le sitemap HTML, la démarche est différente. Vous créez une page classique avec votre code HTML habituel, et vous organisez vos liens de manière logique avec des listes à puces ou une structure hiérarchique. Vous pouvez utiliser des balises <ul> et <li> pour présenter les différentes sections de votre site, puis lier cette page depuis votre menu ou votre footer.
Quelles sont les erreurs à ne pas commettre lors de la création de son sitemap ?
Pour la création de votre sitemap XML, il existe quelques erreurs que vous ne devez pas commettre afin de faciliter la tâche aux algorithmes des moteurs de recherche.
Inclure des URL bloquées par le fichier robots.txt
Le fichier robots.txt indique aux robots d’indexation quelles parties de votre site ils peuvent ou ne peuvent pas explorer. Si vous bloquez une URL via robots.txt avec la directive « Disallow », mais que vous l’incluez dans votre sitemap, vous envoyez des signaux contradictoires aux moteurs de recherche.
Cette incohérence crée de la confusion pour les crawlers. Google ou Bing vont voir l’URL dans votre sitemap et essayer de l’indexer, mais le robots.txt leur interdit d’y accéder. Ces pages apparaîtront donc dans la Search Console comme « URL soumise, mais bloquée par robots.txt ». Elles ne seront pas indexées et vous gaspillez du budget de crawl.
Dépasser la limite de taille du fichier
Un sitemap XML ne peut pas contenir plus de 50 000 URL et ne doit pas dépasser 50 Mo une fois décompressé. Si votre site comporte plus de pages, vous devez créer plusieurs fichiers sitemap et les référencer dans un fichier d’index.
Le fichier d’index (sitemap_index.xml) fonctionne comme un sommaire qui liste tous vos sitemaps individuels. Vous pouvez par exemple créer un sitemap pour vos articles de blog, un autre pour vos pages produits, un troisième pour vos catégories. Chaque fichier respecte la limite des 50 000 URL, et l’index les regroupe tous.
Une autre limite au moment de la rédaction de cet article est la taille de l’URL dans la balise <loc>, qui ne doit pas dépasser 2048 caractères, avec « https:// » y compris. Cette limite de Google est en réalité pour lutter contre les URL dynamiques avec trop de paramètres, comme c’est le cas de certaines boutiques qui mettent leurs robots en ‘spider trap’.
Négliger la mise à jour régulière du sitemap
Un sitemap obsolète perd de son utilité. Si vous ajoutez régulièrement du contenu mais que votre fichier n’est pas actualisé, les moteurs de recherche ne découvriront pas vos nouvelles pages via ce canal. À l’inverse, si vous supprimez des pages mais qu’elles restent dans le sitemap, les robots vont perdre du temps à essayer de les crawler.
Les erreurs 404 générées par des URL supprimées mais toujours présentes dans le sitemap sont particulièrement néfastes. Elles apparaissent dans la Search Console comme « URL soumise introuvable (404) » et signalent un mauvais entretien de votre site. Trop d’erreurs de ce type peuvent affecter négativement la perception de qualité de votre site par Google.
Si vous utilisez un CMS avec un plugin, la mise à jour est normalement automatique. Mais si vous gérez manuellement votre fichier, mettez en place un processus régulier de vérification. À chaque fois que vous publiez, modifiez ou supprimez une page importante, pensez à mettre à jour le sitemap en conséquence.
La balise <lastmod> est particulièrement importante. Elle indique aux moteurs de recherche la date de dernière modification de la page. Si cette date est récente, le robot va comprendre que la page a été mise à jour et pourra la recrawler en priorité. Mais attention à ne pas mettre à jour cette date sans raison valable ; sinon, les robots vont perdre confiance dans ces informations.
Comment soumettre son sitemap à Google ?
La soumission de votre sitemap à Google passe par la Google Search Console (anciennement appelée Google Webmaster Tools). Si vous n’avez pas encore de compte, vous devrez d’abord vérifier la propriété de votre site via différentes méthodes : upload d’un fichier HTML, ajout d’une balise métatag dans votre code, connexion via Google Analytics, ou modification de vos DNS.
Une fois connecté à la Search Console, la première étape consiste à récupérer l’URL exacte de votre sitemap. Si vous utilisez WordPress avec Yoast ou Rank Math, cette information se trouve dans les réglages du plugin. L’URL est généralement quelque chose comme : https://monsite.com/sitemap_index.xml.
Copiez cette URL complète. Rendez-vous ensuite dans votre console Google, sélectionnez la propriété correspondant à votre domaine, puis naviguez dans le menu latéral. Dans la section « Indexation », vous trouverez l’option « Sitemaps ». Cliquez dessus pour accéder au tableau de bord dédié.
Vous verrez une barre de soumission avec le texte « Ajouter un sitemap ». Collez l’URL de votre sitemap dans cette barre et cliquez sur « Envoyer ». Google va alors traiter votre demande et commencer à explorer les URL listées dans le fichier.
Le traitement n’est pas immédiat. Il peut s’écouler quelques heures, voire quelques jours selon la taille de votre site, avant que Google n’ait parcouru toutes les pages. Vous verrez l’évolution dans le dashboard : le nombre de pages découvertes, le nombre de pages indexées, et les éventuelles erreurs détectées.
Si votre site contient plusieurs sitemaps (un sitemap_index avec plusieurs fichiers,), comme c’est le cas sur mon site, je vous recommande, en plus de soumettre le sitemap index, de soumettre les autres pour faciliter le crawl.
Conclusion
En conclusion, le sitemap est un fichier récapitulatif de toutes les pages, images et autres fichiers d’un site web qu’on souhaite indexer. Avec WordPress, vous avez des plugins qui vous permettent de le générer automatiquement et même de le mettre à jour selon les normes de Google. Dans le cas d’un site sur mesure, mettez en place un processus pour cela.
FOIRE AUX QUESTIONS
Avez-vous une question sur le sitemap en SEO ? Je vous réponds dans cette section.
Comment créer un plan du site ?
Le plan d’un site est une page HTML destinée aux internautes qui récapitule toutes les pages du site. Sur WordPress, Rank Math vous permet de le faire avec une mise à jour à chaque nouvel article ou page publiée.
C’est quoi un fichier sitemap ?
Le fichier sitemap est un fichier généralement au format XML, ou TXT dans de rares cas, qui est placé à la racine du site et censé fournir aux robots d’exploration la liste de toutes les URL à chaque visite.
Où trouver le sitemap d’un site ?
S’il s’agit de votre site, le fichier sitemap est toujours à la racine du site. S’il s’agit du site d’un concurrent, le lien sitemap est généralement accessible au slug sitemap_index.xml ou dans le robots.txt à la ligne Sitemap.
Sitemap generator : comment générer un sitemap pour son site ?
Si vous êtes sur WordPress, il existe déjà des plugins qui, même en plan gratuit, vous permettent de créer un sitemap. C’est le cas de Rank Math ou Yoast SEO. Si c’est un site sur mesure, vous pouvez créer des tâches cron pour questionner la base de données et le faire.


