Lorsque vous commencez à vous intéresser de plus près au SEO, vous êtes tôt ou tard confronté au problème du contenu dupliqué. Ce problème n’est pas nouveau, il existe depuis longtemps, ce qui signifie qu’il y a un certain nombre de façons de traiter la duplication. En voici quelques-unes :
Blocage à l’aide du fichier Robots.txt
- Il s’agit de la méthode la plus ancienne et la plus utilisée. L’idée est que le fichier robot.txt bloque le domaine ou la page, de sorte que le moteur de recherche de Google ne puisse pas le trouver et l’indexer. L’inconvénient de cette solution est que si quelqu’un crée un lien vers votre page, Google ne pourra pas non plus le suivre. Ce n’est donc pas la méthode idéale pour l’optimisation, mais vous pouvez l’utiliser si vous souhaitez simplement bloquer le contenu, qu’il soit dupliqué ou non.
Balise Meta Robots Noindex/Follow
-
<meta name=”robots” content=”noindex,follow” />
- Avec cette balise (noindex), vous pouvez faire en sorte que le moteur de recherche n’indexe pas la page, ce qui vous permet d’éviter la duplication. La valeur “follow” indique au moteur de recherche de suivre les liens de la page. Cette solution est plus efficace pour les blogs, où le contenu principal à indexer est le blog lui-même, et le contenu secondaire est le contenu archivé, qui est un contenu plus ancien mais qui peut être utile s’il peut être indexé par les moteurs de recherche.
Redirect 301
- Dans la plupart des cas, la solution optimale au contenu dupliqué consiste à utiliser la redirection 301 pour rediriger le moteur de recherche de la page dupliquée vers la page d’origine. Lorsque vous fusionnez des pages qui ont potentiellement un bon classement en une seule page, elles ne seront plus en concurrence les unes avec les autres, mais gagneront en pertinence, ce qui aura un effet positif sur le référencement. La redirection 301 doit être utilisée dans les cas où la redirection n’a pas d’impact négatif sur l’expérience de l’utilisateur. Il s’agit par exemple de rediriger un contenu sans adresse IP, sans fichier d’index, sans www ou avec www.
Canonical tag
- Une autre manière de gérer le contenu dupliqué est d’utiliser la balise rel=canonical. Cette balise peut permettre d’obtenir le même classement qu’une redirection 301, mais elle est plus simple à mettre en œuvre. Elle se place dans l’en-tête HTML du site web et peut ressembler à ceci :
<link href=”hxxp://www.exemple.fr/souspage/” rel=”canonical” />
Cette balise indique aux moteurs de recherche de traiter la page comme s’il s’agissait d’une copie de l’URL spécifiée, et que tous les liens et le contenu de la copie appartiennent en fait à la page d’origine. Elle est particulièrement utile pour les sites web qui présentent plusieurs catégories et sous-catégories dont les chemins d’accès diffèrent alors que le contenu reste identique.
Alternate link tag
- Cette solution est semblable à la balise canonical, mais elle est typiquement utilisée dans le cadre d’un référencement international ou multilingue. Par exemple :
<link rel=”alternate” hreflang=”en” href=”hxxp://www.exemple.com/page” /> <link rel=”alternate” hreflang=”en” href=”hxxp://www.exemple.co.uk/page” /> <link rel=”alternate” hreflang=”en” href=”hxxp://www.exemple.de/page” />
La balise alternate aide Google à identifier le contenu le plus pertinent pour un pays spécifique. Cependant, son inconvénient est que Google peut considérer certaines pages comme du contenu dupliqué. Elle est recommandée pour les pages ciblant plusieurs pays.
Google Search Console
- Les outils disponibles via Google Search Console permettent de définir le domaine préféré pour votre site web et de gérer différents paramètres d’URL. Le principal inconvénient de cette méthode est qu’elle ne fonctionne qu’avec Google. Bing et d’autres moteurs de recherche ne seront pas influencés par ces paramètres.
Il est crucial de noter que les solutions décrites peuvent être employées non seulement pour le contenu dupliqué, mais aussi de manière générale pour gérer la visibilité des sous-pages de votre site web. Si vous ne souhaitez pas qu’une sous-page soit indexée par les moteurs de recherche, des mesures appropriées doivent être prises pour éviter que la page ne soit traiter la page comme une erreur 404.