Qu’est-ce qu'une URL canonique ?

rel="canonical", souvent appelé URL canonique, est un élément HTML qui aide à prévenir des problèmes avec le contenu dupliqué en indiquant aux moteurs de recherche quelle version d’un document il faut indexer (s’il y en a plusieurs identiques ou similaires). Si une page A a un lien canonique menant à une page B, on dit que la page B est canonique.

La canonisation est un processus par lequel une version préférée de la page est choisie parmi d’autres.

Synonymes d’URL canonique

Même si leur sens n’est pas tout à fait identique avec celui de l’URL canonique, ces termes sont souvent utilisés comme ses synonymes : lien canonique, balise canonique, rel canonical ou rel="canonical". Pour des raisons de simplicité nous allons dorénavant utiliser seulement le terme URL canonique.

L’objectif de cet article

Cet article a pour objectif d’expliquer quand et comment il faut utiliser les URL canoniques afin que les visiteurs de votre site web aient une bonne expérience et que les moteurs de recherche ne rencontrent pas de problèmes d’indexation. Nous allons parler aussi des meilleures pratiques et répondre des questions fréquentes sur l’URL canonique.

Pourquoi avez-vous besoin d’une URL canonique ?

En utilisant des URL canoniques vous pouvez prévenir des problèmes avec le contenu dupliqué (les internes aussi bien que les externes). Le contenu dupliqué interne se trouve à l’intérieur de votre site web. Le contenu dupliqué externe se produit quand il y a des pages avec un contenu identique ou similaire sur plusieurs domaines.

Les URL canoniques évitent les problèmes de contenu dupliqué.
Les URL canoniques évitent les problèmes de contenu dupliqué.

Une URL canonique communique à Google, Bing et Yahoo quelles pages devraient être affichées dans les résultats de recherche et quelles en devraient être exclues. Bien que les moteurs de recherche puissent ignorer complètement les URL canoniques, celles-ci vous donnent un certain pouvoir de contrôle sur la présence en ligne de votre site web.

Quelle est la forme d’une URL canonique ?

Les utilisateurs ne voient pas les URL canoniques en visitant votre site web. Une URL canonique peut être incorporée soit dans le code source d’une page soit dans l’entête HTTP.

Code source

L’URL canonique doit être placée dans la section <HEAD> du code source de la page. Voici un exemple de l’URL canonique de notre page d’accueil :

<HTML> <HEAD> <link rel="canonical" href="https://www.contentkingapp.com/" /> </HEAD>

Entête HTTP

L’URL canonique est souvent placée dans l’entête HTTP quand il s’agit des documents différents de HTML, par exemple des fichiers PDF.

Voici un exemple d’une URL canonique placée dans l’entête HTTP :

HTTP/1.1 200 OK Server: nginx Date: Thu, 28 Apr 2016 11:54:25 GMT Content-Type: application/pdf Content-Length: 23629 Last-Modified: Fri, 29 Apr 2016 17:47:17 GMT Link: <http://www.exemple.fr/downloads/whitepaper.pdf>; rel="canonical"

Les URL canoniques sont souvent placées dans l’entête HTTP quand un contenu est disponible au format HTML et en même temps au format PDF.

Important : actuellement, l’utilisation de l’URL canonique dans l’entête HTTP n’est supporté que par Google. Néanmoins, Google ne le supporte pas pour les images.

Quand faut-il utiliser une URL canonique ?

Il n’y a pas de situation où l’utilisation d’une URL canonique soit une mauvaise idée. Google, Bing et Yahoo les utilisent beaucoup pour comprendre quelles pages devraient présenter dans les résultats de recherche et quelles en devraient exclure. Une URL canonique peut mener soit à soi-même soit à une autre page.

URL canonique menant à soi-même

S’il y a seulement une version d’une page, son URL canonique devrait mener à soi-même.

Cela communique aux moteurs de recherche : « Je suis la seule version de cette page, il ne faut donc indexer que moi. »

URL canonique menant à une autre page

S’il y a plusieurs versions d’une même page, il faut que les URL canoniques mènent à une seule version que vous voulez avoir indexée par les moteurs de recherche.

Voici quelques situations courantes où une URL canonique peut résoudre des problèmes avec le contenu dupliqué :

  • Lorsque la requête de recherche comprend des paramètres utilisés aussi dans l’URL
  • Lorsque des pages sont seulement légèrement différentes
  • Lorsqu’il y a intentionnellement plusieurs versions d’une même page

Paramètres de la requête compris dans une URL canonique

Des URL peuvent parfois comprendre des paramètres de la requête de recherche.

Voici un exemple :

www.example.com/shoes/nike?lang=uk&id=101

  • La variable lang=uk indique que la langue de la page est l’anglais britannique (UK).
  • La variable id=101 indique que le numéro de la page requise est 101.
  • Entre ces variables, il y a le caractère &, ce qui signifie que nous voulons la version anglaise de la page 101.

Des paramètres de la requête sont pratiques à la différence des URL comprenant ces paramètres qui ne sont pas très compréhensibles. www.example.com/shoes/nike?id=101&lang=uk demande la même page que www.example.com/shoes/nike?lang=uk&id=101, mais ces pages ont des URL différentes. Ce type de contenu dupliqué peut facilement être corrigé à l’aide d’une URL canonique.

Pages légèrement différentes

Les pages ne doivent pas être tout à fait identiques, elles peuvent avoir de petites différences. Un bon exemple sont des magasins en ligne qui vendent des chaussures. Prenons comme exemple les chaussures Nike Air Max, taille 38, disponibles en couleurs rouge, bleu et noir. Quand nous choisissons des couleurs différentes, les URL changent, mais 99% du contenu restent le même.

  • General Nike Air Max size 38 : www.example.com/shoes/nike/men-38/
  • General Nike Air Max size 38 en rouge : www.example.com/shoes/nike/men-38-red/
  • General Nike Air Max size 38 en bleu : www.example.com/shoes/nike/men-38-blue/
  • General Nike Air Max size 38 en noir : www.example.com/shoes/nike/men-38-black/

Comme le contenu de ces quatre pages est très similaire, il faut avoir une URL canonique sur www.example.com/shoes/nike/men-38-red/, www.example.com/shoes/nike/men-38-blue/ et  www.example.com/shoes/nike/men-38-black/ menant à www.example.com/shoes/nike/men-38/.

Plusieurs versions intentionnelles d’une même page

Il y a possiblement des raisons pour créer plusieurs versions d’une même page. Voici deux exemples :

  1. Pages de destin des campagnes personnalisées
  2. En faisant des tests d’optimisation de taux de conversion, vous examinez à la fois trois versions différentes d’une même page avec un contenu très similaire.

Quand il y a plusieurs versions d’une page, il faut que l’URL canonique mène à une version préférée de cette page que vous voulez avoir indexée. Si l’URL canonique mène à une autre page, cela veut communiquer aux moteurs de recherche :

« Cette page a plusieurs versions qui sont soit identiques soit très similaires. Pour assurer que votre index soit clair, il faut indexer la page que je vous signale. »

Versions différentes pour les ordinateurs et pour les téléphones portables

Si vous avez des versions différentes pour les ordinateurs et pour les téléphones portables, il est convenable d’utiliser une URL canonique et une URL alternative afin de communiquer aux moteurs de recherche la relation entre ces deux pages. Néanmoins, actuellement cette implementation n'est supporté que par Google.

Ordinateur

Voici un exemple de l’URL canonique et de l’URL alternative dans la section <HEAD> de la version pour les ordinateurs :

<HTML> <HEAD> <link rel="canonical" href="https://www.exemple.fr/" /> <link rel="alternate" href="https://m.exemple.fr/" /> </HEAD>

Téléphone portable

Voici un exemple de l’URL canonique dans la section <HEAD> de la version pour les téléphones portables :

<HTML> <HEAD> <link rel="canonical" href="https://www.exemple.fr/" /> </HEAD>

De cette manière les moteurs de recherche présentent dans chaque appareil la version appropriée.

URL canonique inter-domaines

Une URL canonique peut être utilisée pour prévenir des problèmes avec le contenu dupliqué quand ils touchent plusieurs sites web. Si un contenu est publié sur plusieurs domaines, une URL canonique inter-domaines peut être utilisée pour signaler aux moteurs de recherche quelle version de cette page devrait être indexée.

Fusion des pages inutiles par redirections

Si l’existence de plusieurs versions d’une même page n’est pas indispensable, une meilleure solution que l’URL canonique est de rediriger toutes les versions redondantes de la page à une seule version préférée. Voici quelques exemples où la redirection fonctionne mieux que l’URL canonique :

  • Si la page est disponible via les protocoles HTTP et HTTPS.
  • Si la page est disponible sur plusieurs domainess (www.exemple1.fr, www.exemple2.fr, www.exemple3.fr) ou sur plusieurs sous-domaines (www.exemple.fr, www2.exemple.fr, www3.exemple.fr) sans justification.

Il convient de noter que si vous utilisez des redirections dans les cas mentionnés ci-dessus, il est toujours recommandé d’utiliser à la fois des URL canoniques. Si les redirections cessent de fonctionner, vous avez toujours les URL canoniques pour prévenir des problèmes de l’indexation.

Quelles sont les meilleures pratiques autour des URL canoniques ?

Une URL canonique est un outil puissant pour chaque webmaster. Il est essentiel de suivre les meilleures pratiques ci-dessous en travaillant avec des URL canoniques pour prévenir des problèmes de l’indexation :

  • Utilisez une URL absolue - les moteurs de recherche doivent savoir exactement quelle page il faut indexer. Utilisez donc une URL complète avec un protocole (HTTP ou HTTPS), un sous-domaine et un domaine.
  • Utilisez seulement une URL canonique par page - il faut que chaque page ait seulement une URL canonique.
  • Placez votre URL canonique dans la section <HEAD> ou dans l’entête HTTP - l’URL canonique doit toujours être placée dans la section <HEAD> ou dans l’entête HTTP.
  • L’URL canonique doit mener à une page indexable - il faut que l’URL canonique mène à une page indexable par les moteurs de recherche.
  • Incluez seulement une version préférée de la page dans votre sitemap XML - il faut que votre sitemap XML comprenne seulement une version de chaque page.

Utilisez des URL absolues

Il faut utiliser seulement des URL absolues pour les URL canoniques, comme par exemple :

<link rel="canonical" href="https://www.exemple.fr/services/reparations/">

En utilisant cette URL comme l’URL canonique, il n’y a pas de doute sur son emplacement.

Comparez maintenant l’URL ci-dessus avec une URL ambiguë ci-dessous :

<link rel="canonical" href="reparations/">

Il y a des serveurs web configurés incorrectement par défaut qui font votre site web accessible via tous les domaines et tous les sous-domaines. Cela cause une quantité énorme du contenu dupliqué. Il faut donc éviter cette situation.

Avoir des URL absolues pour des URL canoniques prévient cette sorte des problèmes avec le contenu dupliqué.

Chaque page doit avoir seulement une URL canonique

Une page ne peut avoir qu’une seule URL canonique. Avoir plus d’une URL canonique sur une page pose des problèmes pour les moteurs de recherche. Google a publié qu’il ignorerait complètement vos URL canoniques s’il y en a plus d’une sur la page. La manière de traiter cette situation par Bing et Yahoo n’est pas connue, mais ils aussi recommandent de ne pas utiliser plus d’une URL canonique par page.

Mettez des URL canoniques dans la section <HEAD>

Une URL canonique devrait toujours être placée dans la section <HEAD> de la page. Si elle n’est pas là, les moteurs de recherche ne pourront pas la trouver et traiter, ce qui peut causer des problèmes avec le contenu dupliqué.

URL canonique doit mener à une page indexable

Chaque URL canonique devrait mener à une page indexable. Si elle mène à une page avec la redirection 301 ou à une page qui a un lien canonique vers une autre page, cela peut causer des problèmes pour les moteurs de recherche.

Incluez seulement une version préférée de la page dans votre sitemap XML

Toutes les pages incluses dans le sitemap XML devraient être indexables par les moteurs de recherche. Si vous avez plusieurs versions d’une page, il est donc important inclure dans le sitemap XML seulement une version préférée de cette page.

Où sont les limites des URL canoniques ?

Même si les URL canoniques sont un outil puissant pour chaque webmaster, elles ont aussi leurs limites.

Transmission partielle de l’autorité des liens

Nous allons l’expliquer à travers un exemple : une page A a des liens retour très puissants. Cette page a une URL canonique menant à une page B. Les moteurs de recherche indexeront probablement la page B et omettront la page A.

Chaque lien apporte une autorité à la page. Cela s'appelle autorité de lien. L’autorité des liens retour sur la page A n’est transmise que patiellement sur la page B. Nous avons mis partiellement en italique, parce que c’est une zone peu claire dont les moteurs de recherche ne parlent pas beaucoup. Il n’y a pas de recherche qui prouve que l’URL canonique transmet toute l’autorité des liens. Il faut aussi prendre en considération que cet outil a été créé pour communiquer aux moteurs de recherche quelles pages devraient être affichées sur les pages de résultats de recherche et qu’elles en devraient être omises et pas pour transmettre l’autorité des liens. Notre avis sur ce sujet est : les URL canoniques ne transmettent pas toute l’autorité des liens.

Matt Cutts de Google a dit que : « il n’y a pas vraiment une grande différence entre eux [la redirection 301 et l’URL canonique] ».

Si vous voulez transmettre autant d’autorité des liens que possible, nous vous recommandons d’utiliser la redirection 301.

Les URL canoniques ne préviennent pas de problèmes de l’optimisation d’exploration

Les URL canoniques devraient résoudre des problèmes avec le contenu dupliqué. Elles signalent aux moteurs de recherche quelles pages devraient être indexées, mais pas quelles pages devraient être explorées. Il faut bien différencier ces deux choses.

Si les moteurs de recherche ne passent pas leur temps sur des pages utiles et importantes, cela signifie que vous avez des problèmes avec l’optimisation d’exploration. Il y a plusieurs raisons possibles d’un tel comportement. Les moteurs de recherche peuvent être attrapés dans des boucles de redirections infinies, passer trop de temps sur des pages que vous ne voulez pas voir indexées en premier lieu ou finir trop souvent en impasses de votre site web (les pages qui n’ont pas de liens vers d’autres pages). C’est un gaspillage, surtout depuis que les moteurs de recherche ont un budget d’exploration (le temps imparti pour l’exploration d’un site web) pour chaque site web. Les problèmes de l’optimisation d’exploration peuvent être résolus en utilisant le fichier robots.txt.

Questions fréquentes sur les URL canoniques

  1. Les URL canoniques transmettent-elles une autorité des liens ?
  2. Puis-je forcer les moteurs de recherche à utiliser mon URL canonique ?
  3. L’URL canonique est-elle meilleure que la redirection 301 ?
  4. Est-il possible de contaminer un site web avec des URL canoniques ?
  5. Tous les moteurs de recherche supportent-ils les URL canoniques ?
  6. Comment les moteurs de recherche traitent-ils plusieurs URL canoniques sur une page ?
  7. Les URL canoniques empêchent-elles l’exploration des pages ?
  8. Devrais-je utiliser des URL canoniques pour les pages paginées ?

1. Les URL canoniques transmettent-elles une autorité des liens ?

Nous pensons qu’une autorité des liens est transmise en canonisant des pages.

Comme nous l'avons écrit dans la section Transmission partielle de l’autorité des liens, nous ne pouvons pas dire avec certitude si les URL canoniques transmettent une autorité des liens. Les URL canoniques n’ont pas été créées pour cet objectif. Ce sont les redirections 301 qui devraient transmettre l’autorité des liens.

2. Puis-je forcer les moteurs de recherche à utiliser mon URL canonique ?

Non, l’URL canonique est plutôt un conseil qu’une directive pour les moteurs de recherche.

3. L’URL canonique est-elle meilleure que la redirection 301 ?

L’URL canonique et la redirection 301 sont des moyens tout à fait différents.

L’URL canonique est utilisée si toutes les versions d’une page doivent être accessibles pour les visiteurs, mais seulement une d'entre elles devrait être indexée par les moteurs de recherche.

La redirection 301 redirige les visiteurs aussi bien que les moteurs de recherche d’une URL à une autre. L’URL redirigée n’est accessible ni pour les visiteurs ni pour les moteurs de recherche.

4. Est-il possible de contaminer un site web avec des URL canoniques ?

Si les URL canoniques ne sont pas utilisées correctement, elles peuvent causer de graves problèmes pour le site web.

Imaginez la situation, par exemple, où toutes vos pages ont une URL canonique menant à la page d’accueil. Comme l’URL canonique est un signal très fort pour les moteurs de recherche, ils suppriment probablement ces pages de leurs index.

Bien qu’il faille être prudent en utilisant les URL canoniques, nous recommandons de le faire pour signaler aux moteurs de recherche quelles pages devraient être indexées et lesquelles non.

5. Tous les moteurs de recherche supportent-ils les URL canoniques ?

Nous savons avec certitude que Google, Bing et Yahoo les supportent.

Yandex et Badoo probablement aussi, mais DuckDuckGo n’est pas clair avec cette question.

6. Comment les moteurs de recherche traitent-ils plusieurs URL canoniques sur une page ?

Google a écrit qu’il ignorerait les URL canoniques complètement s’il y en a plus d’une sur une page.

Il n’est pas clair comment les autres moteurs de recherche traitent cette situation. Nous vous recommandons donc d’utiliser seulement une URL canonique par page.

7. Les URL canoniques empêchent-elles l’exploration des pages ?

Non, elles ne l’empêchent pas. Les moteurs de recherche continuent à explorer vos pages sans égard si vous y avez des URL canoniques menant à d’autres pages ou non. L’URL canonique est seulement un signal pour les moteurs de recherche indiquant quelle version d’une page devrait être affichée dans les résultats de recherche. Voyez aussi la section « Les URL canoniques ne préviennent pas de problèmes de l’optimisation d’exploration ».

8. Devrais-je utiliser des URL canoniques pour les pages paginées ?

Généralement, il n’est pas recommandé d’utiliser des URL canoniques pour les pages paginées, parce que ces pages ne comprennent pas habituellement un même contenu. Il est plutôt recommandé d’utiliser les éléments rel="next" and rel="prev". C’est une bonne façon de signaler aux moteurs de recherche que les pages paginées sont des séries des pages suivant un ordre logique.

Vous pouvez pourtant utiliser une URL canonique pour une page paginée, mais seulement si celle-ci inclut la page ‘Voir tout’ qui se charge rapidement. Dans ce cas, vous ajoutez sur chacune de vos pages paginées une URL canonique menant à la page ‘Voir tout’. Regardez aussi :
https://support.google.com/webmasters/answer/1663744?hl=fr

Commencer votre essai gratuit de 14 jours

Vous pouvez commencer en 20 secondes

Insérez un nom de domaine valide, s'il vous plaît (www.exemple.fr).
  • La carte de crédit n'est pas requise
  • Aucune installation requise
  • Sans engagement