Depuis sa mise à jour Panda en 2011, Google s’efforce d’être le moteur de recherche qui satisfait au mieux l’intention de recherche des internautes. Pour cela, plusieurs filtres et critères de sélection ont été mis en place pour mettre en avant les sites ayant la meilleure qualité de contenu, parmi lesquelles le contenu non dupliqué. Dans cet article, j’ai donc décidé de vous présenter ce qu’est le duplicate content en détail, ainsi que les bonnes pratiques pour éviter de tomber dans les mailles de Google.
Définition du duplicate content en SEO
Le terme “duplicate content” est utilisé dans le domaine du marketing digital pour désigner un contenu dupliqué ou plagié. En SEO, on parle de duplicate content lorsqu’une page de blog reprend le contenu d’une autre page ou la copie intégralement.
Un contenu est donc qualifié de dupliqué lorsqu’il est publié sur le web sans aucune authenticité ou apport. En d’autres mots, les contenus dupliqués sont des contenus qui ne vous appartiennent pas et que vous plagiez et publiez sur votre site.
Il convient de préciser que, dans certains cas, il arrive que la duplication ne soit pas forcément par rapport à un autre site. En effet, même sur votre propre site, tant que deux URLs différentes pointent vers deux pages, toutes deux avec le même contenu, il s’agit d’une duplication.
Quelles sont les conséquences du duplicate content sur le SEO ?
Si une telle pratique est déconseillée, c’est parce que son impact est très négatif, tant pour le référencement du site que pour votre crédibilité (ou celle de votre agence).
Le duplicate content nuit au référencement d’un site
L’objectif de Google a toujours été de présenter à l’internaute le contenu qui répond le mieux à ses besoins et qui lui apporte le plus de valeur ajoutée. De ce fait, si, sur votre site, il remarque du contenu déjà présent sur un autre site, il n’a aucun intérêt à mettre cette page web en avant. Votre article sombrera le plus longtemps possible au fin fond de sa base de données, sans vous apporter le moindre trafic.
De plus, Google est très strict en matière d’authenticité du contenu. Il privilégie toujours les webmasters qui luttent au mieux pour satisfaire leur audience. Ainsi, en remarquant sur un site du contenu volé, il se voit en droit de sanctionner ce dernier. Cette page dupliquée ne sera donc pas la seule à être blacklistée, mais votre site en général.
Le duplicate content nuit à la réputation en ligne
Jamais, vous n’encouragerez un peintre ou un artiste qui s’approprie une œuvre qui n’est pas la sienne. Il en est de même pour votre audience.
Une audience, quel que soit son niveau d’engagement, ne vous incitera jamais à publier du contenu volé sur votre site web. Vous passerez plutôt pour l’amateur, la personne inexpérimentée qui a besoin de violer des copyrights pour se faire une place.
Le content duplicate est passible d’une poursuite judiciaire
Tout contenu publié sur un site web est protégé par des droits d’auteur, communément appelés “copyrights”. Ainsi, en publiant le contenu d’un autre webmaster ou blogueur sur votre site, ce dernier peut décider de saisir la justice pour une poursuite. Dans ce cas, les conséquences de votre acte ne se limiteront pas à des sanctions sur le SEO ou à la ruine d’une image en ligne. Vous risquez ici de lourdes sanctions, telles que des amendes ou même des peines de prison, selon la gravité du vol et des lois en vigueur.
Quels outils pour détecter le duplicate content ?
Il existe désormais sur le web une multitude d’outils pour détecter le duplicate content : des gratuits comme des payants. Bien évidemment, ils ne sont pas fiables à 100 % et ne remplaceront pas l’expertise d’un consultant SEO en la matière, mais constituent tout de même un coup de pouce énorme, surtout si vous n’avez pas le budget pour en employer un.
Parmi les nombreux outils que j’ai testés sur le marché, les cinq suivants ont été les meilleurs. Ils sont fiables, avec des retours positifs et possèdent surtout un plan gratuit qui peut faire l’affaire.
- Copyscape
- Siteliner
- Screaming Frog
- Duplichecker
- Kill Duplicate
Les pénalités de Google face au contenu dupliqué en SEO
Les sanctions que Google peut vous infliger dépendent de la gravité de votre acte. Par exemple, deux ou trois paragraphes copiés ne méritent pas la même peine que toute une page dupliquée. Voici trois exemples de sanctions de Google selon les circonstances.
Les avertissements dans la Google Search Console
En cas de contenu dupliqué, Google peut décider de vous envoyer un avertissement à travers son outil : la Search Console. Pour le constater, rendez-vous dans les erreurs d’indexation, puis explorez les diverses raisons au cours de la période sélectionnée. Si vous avez des pages techniquement au propre, qui ont été explorées, mais pas enregistrée dans la base de Google, il se peut que ce soit une page dupliquée sans URL canonique indiqué par le webmaster.
La non-indexation de la page
Une des pénalités de Google peut être de ne pas indexer votre page. Ainsi, votre page sera certes explorée par les crawlers (ici, le Googlebot), mais ne sera pas présentée dans la SERP. Dans ce cas, l’idéal est de revoir le contenu de la page, la modifier puis demander une nouvelle indexation.
Le déclassement du site
Ici, c’est la pire pénalité de Google : le déclassement de votre site. En cas d’un fort taux de duplication sur votre site, Google se voit dans l’obligation de la déclasser, d’autant plus qu’il n’apporte plus rien aux utilisateurs. Cela se manifeste par une perte de position brute et une perte soudaine en position moyenne. Dans ce cas, il est préférable de faire appel à un expert pour un audit SEO sur votre site et détecter les contenus ayant conduit à un tel drame.
Comment éviter le duplicate content sur son site web ?
Pour éviter d’avoir du contenu dupliqué sur votre site, il existe des astuces très simples que je pratique au quotidien et que je vous invite à essayer.
L’utilisation des synonymes et paraphrases
Google prohibe la reprise des contenus textuels, mais n’a pas d’avis tranché sur les contenus paraphrasés. En modifiant le contenu repris sur d’autres sites, que ce soit manuellement ou à l’aide d’une intelligence artificielle, vous véhiculerez le même message sans le recopier.
Alerte ! Cela reste du vol et ne contribue en rien à votre notoriété, car les contenus paraphrasés ne sont qu’une synthèse des contenus déjà publiés, sans apport de valeur à l’internaute.
L’utilisation des URL canoniques
Lorsque vous avez sur votre site des articles de blog présents sur plusieurs pages, soit à cause des tags ou catégories, ou des diverses variantes de liens générés par votre CMS, vous pouvez indiquer aux crawlers quelle est la bonne URL. Pour cela, il vous suffit d’insérer une balise canonique dans le code HTML de votre site afin que les robots sachent quelle page visitée pour éviter de tomber sur des duplications.
L’utilisation des outils anti-plagiat
Il existe désormais sur le marché plusieurs outils pour vous aider à détecter les parties plagiées dans votre contenu en les comparant aux articles déjà présents sur le web. Le processus est simple : vous importez votre article ou fournissez son lien, puis l’outil surligne les paragraphes où les duplications sont détectées. Certains vont même plus loin en vous fournissant des statistiques sur taux de contenus plagiés et le taux de contenus uniques.
Conclusion
En conclusion, le contenu dupliqué désigne la publication sur son site d’un contenu déjà présent ou trop similaire sur le web. Il est à éviter à tout prix, car ses conséquences à long terme sont très néfastes. Pour éviter de tomber dans le panneau, vous disposez d’une panoplie d’outils pour détecter le plagiat.
FOIRE AUX QUESTIONS
Avez-vous des questions relatives au duplicate content en SEO ? J’y réponds dans cette section.
Quel est le meilleur outil de duplicate content checker gratuit ?
Je ne pense pas qu’il existe un outil meilleur qu’un autre pour vérifier les duplications dans un contenu. Toutefois, si vous envisagez de publier un article de blog, je vous conseille d’utiliser les outils comme Grammarly et * pour vérifier le taux de duplication. Ils ne sont pas fiables à 100 %, comme tous les outils d’ailleurs, mais peut vous aider à éviter les duplications.
Comment vérifier le contenu en double dans Google ?
Avec Google, il existe plusieurs façons de vérifier si vous avez du contenu en double. Par exemple, vous pouvez vous servir des erreurs d’indexation dans la Google Search Console ou lancez des requêtes sur le web en utilisant des opérateurs de recherche spécifiques.
Comment vérifier le contenu en double dans Semrush ?
Semrush est un outil tout-en-un qui permet aux webmasters d’auditer leur site web en quelques clics. Suite à ces audits, il recense et explique toutes les erreurs et avertissements sur un site web, y compris les contenus dupliqués.
Le contenu dupliqué est-il mauvais ?
Oui, le contenu dupliqué est très néfaste en référencement naturel. Certes, vous gagnez du temps dans votre stratégie de contenu, mais vos articles ne seront pas mis en avant et pénalisés par les algorithmes des moteurs de recherche.