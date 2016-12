Au fil de sa vie, un site évolue, les autres sites aussi, ce qui fait qu'au bout d'un moment il est fréquent de cumuler les erreurs 404 (page inexistante). Ceci peut être provoqué par des URL qui ont changé ou disparu sur votre site, mais aussi par ces mêmes changements sur vos liens externes.

Voyons pourquoi et comment corriger les erreurs 404.

Pourquoi corriger les erreurs 404 ?

Pour vos visiteurs : Quoi de plus désagréable que d'arriver sur une page 404 quand on clique sur un lien ? Cela donne une mauvaise image de votre site qui est de suite perçu comme n'étant pas mis à jour. Accessoirement, ceci peut vous faire perdre des ventes sur un e-commerce par exemple.

Pour Google : Un site qui contient trop d'erreurs 404 externes (liens vers des pages externes inexistantes) n'est sans doute pas perçu comme très à jour. Mais surtout, il est possible que des sites externes fassent des liens vers vous et que ceux-ci pointent sur des pages en erreur. Et là, vous perdez tout, le visiteur, et le « jus » des liens qui améliorait votre classement.

Comment corriger ces erreurs ?

Les erreurs 404 internes

Le premier réflexe à avoir est de voir si on ne créé pas nous-mêmes ces erreurs.

Pour cela, on peut utiliser un logiciel comme Screaming Frog. C'est un crawler qui va parcourir votre site et vous remonter beaucoup d'infos, notamment vos liens internes en erreur.

La version gratuite ne crawl que 500 URL de votre site, mais c'est déjà ça.

1/ je saisis l'url de mon site et je clique sur « Start » puis je laisse mouliner

2/ je clique sur l'onglet « internal »

3/ Je clique sur la colonne « status code » pour trier les codes.

4/ Quand je vois une 404, je clique sur la ligne

5/ Je choisis l'onglet « Inlink » dans le tableau du bas.

6/ Le détail m'indique sur quelle page est mon lien brisé et vers quelle page il pointe.

Je peux alors aller corriger sur la page de mon site le lien qui pointe vers une erreur. C'est sans doute le cas, car la page liée n'existe plus ou a changé d'URL. Voir en détail l'exemple ci-dessous.

J'insiste lourdement sur cette étape, car il sera bien plus facile de passer aux suivantes s’il n'existe plus d'erreur 404 générées par notre propre site.

Dans la pratique, en cliquant sur l'onglet « External » vous verrez que de la même manière vous afficherez le détail des liens que votre site fait vers des pages qui n'existent plus sur des sites externes.

Ce que Google voit de nos erreurs 404.

Parce que Google est généralement le premier moteur qui nous intéresse et qu'il nous propose un outil pour cela, nous allons l'utiliser (même s'il n'est pas parfait), il s'agit de la console Google Webmaster tools. Ceci va nous permettre de connaitre les liens entrants externes qui pointent vers des pages de notre site qui n'existent plus.

1/ Connectez-vous à votre compte Google et allez sur Google Webmaster Tools. Choisissez le site concerné si vous en avez plusieurs sur votre compte.

2/ Dans la colonne de gauche, cliquez sur « Exploration » puis « Erreurs d'exploration ».

Google va vous afficher une liste des erreurs qu'il a repérées.

3 / Cliquez sur une ligne d'erreur pour en afficher le détail

4/ Cliquez sur l'onglet « Référencée sur ».

C'est à partir d'ici que tout se joue.

Nous avions vu les erreurs internes.

On se rend compte que Google affiche 2 types d'erreurs 404. Celles issues du site lui-même, les erreurs internes (dans l'exemple : babystock.fr) et celles issues de sites externes.

Souvenez-vous, en amont, vous avez corrigé toutes vos erreurs internes, ce qui veut dire que le problème les concernant va se régler de lui-même. Si Google ne vous présente que des erreurs 404 internes, vous pouvez cliquer sur « Marquer comme corrigées », si l'erreur revient, Google vous la ressortira.

Reste les erreurs en provenance de sites externes.

Dans l'exemple, on voit que des liens à partir du site jumeaux-et-plus.fr pointent vers des pages qui n'existent plus sur le site.

En cliquant sur les URL, on pourra afficher le site externe pour voir ce qu'il en est. Voir l'image ci-dessous.

À vous de rediriger en 301 les URLs inexistantes pour les faire pointer vers la page de votre choix sur votre site (un article similaire, la catégorie supérieure...)

Dans le framework des sites que nous développons, une interface simple permet de gérer cela. Si vous utilisez des CMS, certains proposent des solutions plus ou moins bien foutues. Il existe aussi des plugins conçus pour divers CMS du marché.

Si ce n'est pas le cas, vous devrez effectuer vos redirections en allant les intégrer dans votre fichier .htaccess, j'admets que c'est un peu plus compliqué et risqué si on ne sait pas ce que l'on fait...

Pour aller plus loin

Si j'ai pris l'exemple de babystock, c'est que nous venons d'effectuer une énorme refonte de ce site. Toutes les URL initiales n'ayant pu être conservées, un gros travail a été fait sur les redirections pour éviter les erreurs 404.

Dans ce cadre, le blog qui est actuellement un sous domaine va passer en interne prochainement, mais en attendant, plusieurs liens se sont retrouvés à pointer vers des pages redirigées en 301.

Dans la mesure ou la cliente à la main sur ce blog, nous avons préféré faire pointer les liens vers les bonnes URL plutôt que de les faire transiter par une 301.

J'ai utilisé pour cela un petit outil simple que m'avait fait découvrir Cheapsitelab. Il s'agit de l'outil http://www.brokenlinkcheck.com/

Très simple à utiliser, il vous permet d'identifier facilement vos liens sortants brisés.

Une fois lancé, il m'a identifié ceci, voir image ci-dessous :

En cliquant sur le petit lien « URL », j'ai facilement identifié les pages ou se trouvaient les liens brisés qui pointaient vers babystock.fr pour pouvoir les corriger sur le blog.

Erreurs 404 sur un site e-commerce.

Sur un site e-commerce, il est très fréquent d'avoir des erreurs 404, car des produits disparaissent au fil du temps. J'ai publié récemment sur le site de l'agence l'infographie d'un arbre de décision pour gérer les ruptures de stock. Celle-ci pouvant vous être utile, je vous la propose à nouveau ci-dessous.

Pour conclure :

Que ce soit pour l'expérience utilisateur ou pour votre référencement, les erreurs 404 sont à éviter. J'espère que cette méthode et ces outils vous seront utiles pour régler le problème sur votre site. Désolé pour ceux à qui je pourris le dimanche car il vont le passer à corriger leurs erreurs...

D'autres astuces pour le référencement de votre site :