Rel=canonical et les erreurs à ne pas faire
La mise en place de balises canonical sur votre site est un très bon moyen de combattre le contenu dupliqué.
Mais attention, son installation peut parfois être compliquée. Retrouvez les détails dans notre article.
L’attribut rel= »canonical »
Cet attribut est à utiliser si plusieurs pages de votre site comportent un contenu fortement similaire (un listing de produit classé par couleur ou par prix par exemple, qui aurait le même contenu mais affiché dans un ordre différent).
L’intégration d’un attribut rel= »canonical » aura donnera l’indication suivante aux moteurs de recherche : « Nous avons plusieurs pages au contenu identique, mais c’est cette page qui est la plus utile. Elle est à prendre en priorité dans les résultats de recherche ».
Plus d’informations sur le fonctionnement du rel= »canonical »
Bonnes pratiques pour le rel=canonical
Google recommande plusieurs bonnes pratiques pour l’utilisation de l’attribut rel=canonical :
- Une grande partie du contenu de la page dupliquée doit être présente sur la version canonique.
- Vérifiez que l’URL ciblée pour le rel=canonical existe (pas d’erreur ou de « soft 404″).
- Vérifiez que l’URL du rel=canonical ne contient pas de noindex (par le robots.txt ou les meta tag).
- Assurez-vous que l’URL utilisée dans le rel=canonical est bien celle que vous voulez afficher dans les résultats des moteurs de recherche.
- Insérez le rel=canonical dans le <head> de la page ou encore dans le Header HTTP.
- Ne renseignez qu’une seule rel=canonical par page. Si plusieurs sont présentes, elles seront toutes ignorées par les moteurs de recherche.
Les erreurs à ne pas faire avec le rel=canonical
Erreur 1 : rel=canonical sur une série de pages paginées
Placer un rel=canonical de la page 2 sur la page 1 n’est pas une utilisation correcte de cet attribut, car ces pages n’ont pas un contenu dupliqué. Utiliser le rel=canonical dans cette situation ne ferait que bloquer l’indexation du contenu des pages 2 et des suivantes.
En cas de contenu paginé, Google recommande de placer le rel=canonical sur les pages individuelles de contenu, ou encore d’intégrer des attributs rel=”prev” et rel=”next”.
Erreur 2 : URLs absolues et relatives
L’attribut rel=canonical est contenue dans un tag <link>, et comme la plupart des tags HTML, il accepte les URLs relatives et absolues.
L’URL relative « partira » à partir du répertoire actuel, alors que l’URL absolue va contenir le chemin entier (avec les http:// ).
Le risque ici est d’utiliser une URL relative qui serait mal interprétée et qui rendrait le rel=canonical défectueux. Préférez donc l’utilisation d’URL absolues qui présentent moins de risques.
Erreur 3 : Déclaration multiple ou non intentionnelle
Il se peut qu’un rel=canonical se retrouve sur vos pages sans que cela soit voulu, par exemple en créant une nouvelle page à partir d’un modèle en oubliant qu’il y avait un rel=canonical sur ce modèle.
Il se peut également que plusieurs rel=canonical soient présents sur la même page, générés par des plugins SEO un peu trop zélés (Dans ce cas, Google ignorera tous les rel=canonical présents).
Vérifiez donc bien le code source de vos pages, surtout au niveau de la section <head> ou les liens rel=canonical peuvent être dispersés.
Erreur 4 : rel=canonical dans le <body>
Le lien rel=canonical doit toujours apparaitre dans la section <head> du code html, le plus tôt possible. Si un rel=canonical est présent dans la section <body>, il ne sera pas pris en compte.
Conclusion
Pour faire en sorte que votre rel=canonical soit bien utilisé et pris en compte sur votre site :
- Vérifiez que la majorité du contenu textuel de la page dupliqué soit présent sur la page canonique.
- Vérifiez que le rel=canonical n’est présent qu’une seule fois et dans la section <head> de la page.
- Vérifiez que le rel=canonical pointe une URL existante et qui possède le bon contenu.
Qu'est-ce qu'une page canonique ?
Une page canonique correspond à la version préférée d'un ensemble de pages au contenu fortement similaire.
Pourquoi devrais-je définir une page canonique ?
Il arrive souvent qu'un site comporte plusieurs pages répertoriant la même gamme de produits. Par exemple, sur une page donnée, les produits peuvent être triés par ordre alphabétique, tandis que sur d'autres, ils sont répertoriés par prix ou par note. Par exemple :
example.com/produit.php?item=poisson_suedois&trackingid=1234567&sort=alpha&sessionid=5678asfasdfasfd
example.com/produit.php?item=poisson_suedois&trackingid=1234567&sort=prix&sessionid=5678asfasdfasfd
Lorsque Google sait que ces pages présentent le même contenu, nous pouvons en indexer une seule version pour nos résultats de recherche. Nos algorithmes sélectionnent la page qui, selon nous, correspond le mieux à la requête de l'utilisateur. Les utilisateurs ont toutefois la possibilité de définir une page canonique pour les moteurs de recherche en ajoutant un élément avec l'attribut rel="canonical" à la section de la version non canonique de la page. L'ajout de ce lien et de cet attribut permet aux propriétaires de sites d'identifier les ensembles de contenu identique et d'indiquer à Google : "Parmi toutes ces pages au contenu identique, cette page est la plus utile. Merci de la prendre en considération en priorité dans les résultats de recherche".
Comment puis-je définir une URL canonique ?
Vous pouvez définir une URL canonique de deux manières :
Ajoutez un lien rel="canonical" à la section de la version non canonique de chaque page HTML.
Pour spécifier un lien canonique vers la page example.com/produit.php?item=poisson_suedois, créez un élément tel qu'illustré ci-dessous :
Copiez ce lien dans la section de toutes les versions non canoniques de la page, telles que example.com/produit.php?item=poisson_suedois&sort=prix.
Si vous publiez du contenu sur les deux pages example.com/produit.php?item=poisson_suedois et example.com/produit.php?item=poisson_suedois, vous pouvez définir la version canonique de la page. Créez l'élément :
Ajoutez ce lien dans la section de la page example.com/produit.php?item=poisson_suedois.
Indiquez la version canonique d'une URL en répondant à l'aide de l'en-tête HTTP Link rel="canonical". Le fait d'ajouter rel="canonical" à la section head d'une page est utile pour du contenu HTML, mais pas pour des PDF et autres types de fichiers indexés par la Recherche sur le Web Google. Dans ces cas-là, vous pouvez indiquer une URL canonique en répondant à l'aide de l'en-tête HTTP Link rel="canonical", comme suit (notez que pour utiliser cette option, vous devez pouvoir configurer votre serveur) :
Link: ; rel="canonical"
Pour le moment, Google n'accepte ces éléments d'en-tête "Link" que pour la Recherche sur le Web Google.
L'attribut rel="canonical" constitue-t-il une suggestion ou une consigne ?
Cette nouvelle option permet aux propriétaires de sites de suggérer la version d'une page que Google devrait considérer comme canonique. Google prend ce paramètre en considération, parallèlement à d'autres signaux, lorsqu'il s'agit de déterminer quels ensembles d'URL présentent du contenu similaire et d'évaluer quelles pages sont les plus pertinentes afin de les afficher dans les résultats de recherche.
Le lien doit-il être relatif ou absolu ?
rel="canonical" peut être utilisé avec des liens relatifs ou absolus, mais nous vous conseillons d'utiliser des liens absolus afin de minimiser les risques de confusion ou de problèmes éventuels. Si votre document définit un lien de base, tous les liens relatifs le seront par rapport à ce lien de base.
Le contenu d'un ensemble de pages doit-il être similaire au contenu de la version canonique ?
Oui. L'attribut rel="canonical" devrait uniquement être utilisé dans le but de définir la version préférée d'un grand nombre de pages au contenu similaire (notez que de légères différences sont tout à fait acceptables).
Par exemple, lorsqu'un site contient un ensemble de pages pour le même modèle de chaussures de danse, chacune de ces pages ayant pour seule différence la couleur de la chaussure illustrée, il peut s'avérer utile de définir la page présentant la couleur la plus populaire comme version canonique. Google est ainsi plus susceptible d'inclure cette page dans les résultats de recherche. Néanmoins, l'attribut rel="canonical" ne serait pas approprié si le même site souhaitait simplement positionner une page sur des semelles en gel avant la page de la chaussure dans le classement des résultats de recherche.
Qu'arrive-t-il lorsque l'attribut rel="canonical" renvoie vers une page inexistante ? Ou qu'arrive-t-il lorsque plusieurs pages de l'ensemble sont définies comme version canonique ?
Nous faisons de notre mieux pour déterminer de façon algorithmique la page canonique appropriée, comme nous l'avons toujours fait.
Est-ce que Google est en mesure de suivre une chaîne de dénominations rel="canonical" ?
Oui, jusqu'à un certain point. Néanmoins, afin d'assurer la mise en forme canonique, nous vous conseillons vivement de mettre à jour les liens afin qu'ils pointent vers une seule page canonique.
rel="canonical" peut-il être utilisé dans le but de suggérer une URL canonique pour un domaine totalement différent ?
Dans certaines situations, la mise en place de redirections n'est pas chose facile. Imaginez, par exemple, que vous ayez besoin de migrer vers un nouveau nom de domaine et que vous utilisiez un serveur Web qui ne peut pas créer de redirections côté serveur. Dans ce cas, vous pourriez utiliser l'élément link rel="canonical" pour spécifier l'URL exacte correspondant au domaine à indexer. Même si l'élément link rel="canonical" reste une indication et non une consigne absolue, nous essayons toutefois d'en tenir compte lorsque cela est possible.