Je ne vais pas forcément détailler la technique, mais plutôt vous alerter sur certains points spécifiques qui peuvent provoquer des problèmes de duplication de contenu sous WordPress.
Au fil du temps, les éléments que je détaille perdent parfois de leur importance, mais lors du lancement d'un blog, ils peuvent se révéler catastrophiques et plonger vos pages au fond du trou. Ces quelques astuces vous permettront de vous en prémunir.
Rappel sur le contenu dupliqué interne
Google n'aime pas les pages qui se ressemblent. Lorsqu'il en trouve sur un même site, il a tendance à renvoyer celles-ci dans son index complémentaire. Une fois dans ce trou, elles n'ont quasiment aucune chance d'apparaitre dans les résultats de recherche.
Vous ne le savez pas, mais vous avez sans doute déjà flirté avec l'index complémentaire. Notamment les fois où Google vous a affiché "Pour limiter les résultats aux pages les plus pertinentes...etc. Vous pouvez relancer la recherche en incluant les pages ignorées"
Il a mis ces pages à la trappe, car elles lui paraissaient trop similaires à d'autres pages.
Pour mieux comprendre :
- Voici toutes les pages que Google connait de ce blog index primaire + complémentaire (environ 463)
- Et voici celles qui sont
dans le premier index(édité car ce requetage n'est plus possible sur google) et qui ont donc une chance d'apparaitre dans les résultats de recherche (environ 375)
Vu qu'à ce jour ce blog comprend 305 articles (donc les pages les plus importantes à référencer) on voit qu'il n'y a pas de souci, mais il peut être utile de contrôler cela sur votre blog WordPress, surtout si vous le lancez avec peu d'articles.
Mais voyons où peuvent se cacher les problèmes de duplication.
La non-utilisation des extraits en page d'accueil
WordPress vous permet d'afficher vos derniers articles en page d'accueil (10 par défaut en paramétrage initial). Mais surtout, il vous permet de faire une coupure de vos articles pour n'en afficher qu'un extrait sur cette page (le titre et les premières lignes).
Ne pas utiliser cette coupure vous expose à dupliquer les pages individuelles des articles avec votre page d'accueil.
Sur un blog qui démarre et qui n'a que peu d'articles, la sanction est quasi inévitable. À moins d'obtenir dès le début de nombreux baclinks de qualité vers vos articles individuels et votre page d'accueil, mais avouons-le, c'est rarissime !
La micro duplication
La micro duplication est sans doute la plus pernicieuse car elle est très fréquente. On pourrait penser que Google n'y fait pas trop attention, mais je me suis vu pénalisé lors du lancement de petits blogs pour cette raison.
On rencontre la microduplication sur des pages possédant très peu de contenu différencié, mais partageant une partie commune.
Le cas le plus fréquent, c'est ce petit texte que vous avez mis en haut de page et qui présente votre blog. Ces quelques lignes sont présentes sur toutes vos pages.
Pour limiter les dégâts lors du lancement, vous pouvez mettre ce texte en dur sur la page d'accueil par exemple, mais le mettre en image sur toutes les pages internes. Vous verrez un exemple concret sur ce blog sur l'ameublement qui n'a que quelques jours d'existence.
La microduplication ne fait pas nécessairement disparaître vos pages de l'index, mais peut pénaliser leur positionnement.
La duplication sur les pages de catégories.
Quand on est ordonné, on range sa chambre ses articles par catégories. Ceci permet aux visiteurs de consulter plus précisément la liste des articles sur un sujet précis.
Le problème de ces catégories, c'est qu'elles peuvent reprendre une liste d'articles dans le même ordre que la page d'accueil, si les derniers articles sont tous dans le même catégorie. Pire ! Le début de la page d'accueil et le début de la page de catégorie auront exactement le même texte ! Google risque de ne pas aimer.
La solution consiste à créer un texte d'introduction pour chacune de ses catégories. D'une part, c'est agréable pour le visiteur qui se sent guidé, mais surtout, ce principe permet d'avoir un début de page dont le texte est bien différencié.
Attention ! Au fil du temps, une pagination va apparaître sur vos pages de catégories.
Ce texte d'intro ne doit apparaître que sur la première page, pas sur les suivantes. En effet, ce que l'on cherche, c'est à référencer la 1ère page de catégorie (pour une expression-clé), les suivantes peuvent passer dans l'index complémentaire, ce n'est pas grave.
Un exemple sur ce blog, lorsque vous cliquez sur la catégorie "Référencement" dans la colonne de gauche. Le petit texte d'intro permet d'avoir une première page de catégorie qui sera bien distincte des autres pages du blog.
Le gros avantage de procéder de la sorte est de permettre d'indexer votre site sur ses noms de catégories. On en voit l'effet concret sur la requête "test SEO".
Pour ceux qui veulent s'y mettre
1 / Renseignez une description pour chacune de vos catégories. C'est natif dans WodPress, vous y accédez par le menu "Tous les articles / catégories"
2 / Renseignez le code suivant à l'emplacement ou s'affichent les catégories (sur Twentyten, c'est dans la page catégory.php
Remplacez
if ( ! empty( $category_description ) )
par
if (!empty($category_description) && $paged == 0)
Ce code évite d'avoir la description de la catégorie sur les pages suivantes en cas de pagination.
Le contenu dupliqué sur les pages de "tags" ou "mots-clés"
Le plus gros piège de WordPress en terme de duplication se trouve sans doute ici.
En effet, ce que l'on appelle communément les "tags" peut être d'une efficacité redoutable avec WordPress, je l'admets volontiers. Le principe est le même que celui des catégories puisque vous allez pouvoir classer vos articles d'une manière différente en y associant des mots-clés.
En revanche, cette efficacité est très dangereuse si elle est mal utilisée (un peu comme la nitroglycérine, ça fera tout péter de manière fantastique, mais potentiellement vous avec, alors que la bonne vieille pioche limite les dégâts).
En effet, à l'utilisation, on se rend compte que les auteurs ont le sale réflexe d'ajouter de nouveaux tags à qui mieux mieux. On multiplie donc les pages qui regroupent les articles. Parfois, certains tags ne regroupent qu'un article ! Un comble.
On assiste alors à la création d'une profusion de pages qui ont toutes les chances de partir dans l'index complémentaire. En effet, une page qui ne contient qu'un extrait d'article a toutes les chances d'être dupliquée avec celle de l'article en lui-même.
À titre d'exemple, sur ce blog, il n'y a que trois tags. Ils permettent de classer les articles par niveau de compréhension (débutant, initié, expert). Je les ai avant tout mis en œuvre pour les utilisateurs, bien plus que pour les moteurs. Mais pour ne pas prendre de risque, j'ai aussi appliqué la méthode utilisée sur les catégories, c'est-à-dire un petit texte d'intro différencié.
Pour ceux qui voudraient utiliser ces tags (mots-clés), je vous conseille.
- De vous faire une liste initiale qui recense bien les thématiques que vous traitez.
- De bien différencier ces tags de vos catégories (il serait bête d'avoir exactement la même liste d'articles dans une catégorie et un regroupement par mots-clés).
- De tenter de vous limiter à cette liste créée initialement et de ne pas créer trop de nouveaux tags au fil du temps.
- A lire : bien gérer les tags WordPress
En conclusion
WordPress est un excellent outil de publication d'articles. Plutôt bien conçu initialement, il permet à ceux qui n'y connaissent pas grand-chose en référencement d'avoir quelques résultats sans trop d'efforts.
En revanche, WP a aussi quelques petits défauts initiaux. Les conseils ci-dessus vous permettront d'en éliminer une partie pour ce qui concerne les problèmes de duplication de contenu.
Ps : Je sais, ce blog n'est pas parfait 🙂 Nous avons encore des bricoles que nous pourrions optimiser en SEO, c'est prévu pour... un jour...
... en attendant nous vous proposons dans l'article suivant et en téléchargement :
un thème enfant complet pour Twentyten de WordPress
Salut sylvain,
Merci pour ces règles. J'ai mis en place sur mon blog des descriptions ne s'affichant que sur la première page des catégories, idem sur la page d’accueil.
Par contre j'ai une question:
Dans mon blog, j'ai souvent des articles qui vont dans plusieurs catégories. Ainsi je me retrouve donc avec des articles qui vont jusque dans 10 catégories (un exemple concret sur la page que j'ai linké) c'est donc une forme de DC.
Comment limiter cela ? Google en tient compte ? Dois je limiter le nombre de catégories pour chaque article ?
Bref c'est grave docteur ? 🙂
Bonjour et merci pour ces recommandations. Je suis loin d'être un utilisateur averti de WordPress (mais je m'y met petit à petit) et ces conseils me semblent excellents.
J'avoue faire partie de ces utilisateurs qui utilisent de nombreux tags pour la simple et bonne raison que je ne m’étais jamais réellement posé la question de la réelle pertinence de celle-ci.
Toutefois ayant constaté que ces pages n’étaient pas toujours très "intéressantes" et/ou au contenu dupliqué alors j'ai demandé quelles ne soient pas indexées (via un plugin SEO qui s'occupe de ces questions 🙂 ).
Mais du coup effectivement ... si je ne les indexe pas alors pourquoi les créer ...
Merci, encore un article bien utile. Je dois bien avouer être complètement tombé dans le piège des tag. Maintenant, au travail...
J’émets une hypothèse. Il y a longtemps, et pour certains blogs pas longtemps du tout, je faisais tout l’inverse de ce que tu décris dans ton article. C’était par ignorance au début, et par flemme de refaire les blogs pour d’autres.
Aucune optimisation donc, ou alors à l’insu de mon plein grès, et c’est certainement à cette époque la que mes blogs avaient le meilleur rendement (que se soit en visiteurs et/ou en terme de revenu adsense)
Si je suis à 100% d’accord avec toi, je me demande si le premier conseil qu’on pourrait donner à un débutant, et pourquoi pas aux autres, c’est de bloguer avec passion, régulièrement, avec une organisation de blog comme on le souhaite et surtout sans se soucier d’optimisation.
Pour finir, je me demande dans quelle mesure Google ne saurait pas dire « Tiens, lui il optimise, je lui colle un petit drapeau »
Merci encore une fois pour cet article intéressant. Lors de la création d'un blog avec wordpress, il m'avait créé des tas de pages relatives aux tags, alors que je ne voulais pas les utiliser. Je les ai fait désindexer. Sinon pour le duplicate content, as-t'on une idée de la taille du texte à partir de laquelle google prend ça pour du contenu dupliqué ? Les images sont certainement prises en compte je suppose. J'ai pas mal de pages "qui se ressemblent" sur mon site, faut que je regarde si elles sont dans l'index complémentaire ou non.
La section sur les tags est primordiale. Je dois avouer que je les ai longtemps laissés de côté, les considérant justement comme un nid à DC. Puis je me suis rendu compte que s'ils génèrent du DC c'est que c'est moi qui ai merdé quelque part. Aujourd'hui je recommence à les utiliser parce que finalement, bien utilisés, ils permettent d'avoir plus de pages (pertinentes) et donc plus de chances pour nous d'être positionnés.
et si au lieu de defigurer wp on utilisait le fichier robot pour dire a goolge de ne pas suivre les pages tag et categorie? Ca eviterait la duplication... Ceci dit google reconait que cest un wp, nest il pas asser malin pour le savoir tout seul ?
Bonjour Richard,
Merci de ces astuces, ainsi appliquer l' attribut no-follow et/ou no index, sur les sous-pages des archives, ainsi que sur tags et catégories ne suffit pas pour endiguer le contenu dupliqué?
Cet article me donne une idéée d'évolution du plugin WordPress de recherche et d'identification du contenu dupliqué, No-Duplicate que j'ai développé.
En effet ce plugin effectue un contrôle de duplicité par rapport au "Web" mais il serait intéressant de mesurer automatiquement la duplicité interne au site suivant les critères indiqués dans ton article.
Une façon de diminuer le risque de duplication gênante est de faire de longs et beaux articles étoffés selon moi.
Sur un blog le risque c'est de lasser le lecteur mais si le contenu est utile le lecteur pro lira les 1200 mots quitte à bookmarker et le lire plus tard à un moment plus propice.
Les tags et catégories peuvent être maîtrisés par des plug-in efficaces et gratuits. Le temps d avoir une bonne dizaine d articles par tags ou categories pour ôter le risque de duplicate et les sanctions qui vont avec.
Merci beaucoup pour ces conseils avisés.
Je n'aurai jamais pensé qu'il était possible d'être victime de duplicate content à cause d'un seul et même article. En général lorsque l'on écrit un contenu unique on pense être hors de cause !
Il est alors assez facile de se faire avoir pour une duplication sur les pages de Tags et de catégories !!!
Hello,
Je suis absolument d'accord sur tous les points. Moi le premier je me suis fait avoir avec de la duplication en utilisant WordPress. Me retrouver à utiliser beaucoup de tags sans réelle utilité. Du coup beaucoup de page vide, et boum....
Comme on dit, "on apprend de ses erreurs" et bah c'est le cas, maintenant je fait bien attention, et je n'utilise presque plus les tags vu que bien souvent seule la catégorie m'est utile.
Le plugin SEO de Yoast est pas mal pour lutter contre la duplication sur WordPress, Il permet de mettre certain type de page en noindex, follow comme par exemple des pages auteurs, ou des archives...
Hello
Petite question : sur mon blog mes pages de tag quoique souvent dupliquées sont vraiment très bien référencées et ce depuis un bon paquet de mois, un début d'explication ?
@ Nicolas
Au delà du DC, à quoi bon faire des catégories d'articles si tes articles peuvent se retrouver dans 10 catégories ? Cela donne plutôt l'impression d'une catégorisation totalement inutile, non ?
@ Xavier
Si tes pages de tags ne sont pas indexable, en effet elles ne servent à rien en SEO. Mais peut-être sont-elles utiles pour le visiteurs ?
@ Littelbuz
Les meilleurs blogs sont avant tout ceux ou le contenu est intéressant, il n'y a pas photo.
Après, l'optimisation sert à donner un coup de pouce en terme de positionnement.
Sinon, pour le côté « drapeau rouge » de Google, je pense qu'il applique simplement les mêmes règles et filtres que sur n'importe quel site, et la duplication génère l'application de filtres négatifs.
Mais bon, il faut aussi mettre en regard de cela l'autorité du site.
@ Pierre
Tu as ta réponse, regarde dans quel index sont tes pages.
@ Sylvain
Tut à fait d'accord. Les tags sont une excellente arme, mais qui peut vite se retourner contre son utilisateur. A manier avec précaution et en connaissance de cause.
@ Tilto
Bonne idée... quand Google respecte le robots.txt
Mais dans ce cas, ces pages ne servent plus à rien pour le SEO.
@ Fabrice
Même réponse que pour Tilto.
Ok si ces pages sont utiles au visiteur, mais elles ne seront plus d'aucune utilité en référencement.
@ Lemoussel
Pas bête du tout ton idée !
@ Philippe
Les bons articles sont le premier gage de réussite !
@ Alexande
Tu dis quelque chose de très juste « Le temps d avoir une bonne dizaine d articles par tags ou categories »
@ Fabien
Comme je l'indique, l'ancienneté joue car l'autorité du site a eu le temps de se construire.
Les problèmes que je cite sont surtout néfastes aux jeunes blogs comprenant peu d'articles car la duplication entre pages est flagrante.
C'est drôle, j'aurai pensé que les pages d'auteurs peuvent aussi être source de duplicate interne.
@Sylvain
Merci pour la réponse. En fait comme tu l as peut être vu, ce blog recense des idées cadeaux, mais un cadeau peu très rentré dans plusieurs catégories car je range mes articles "Par type" et "Par occasion". Ainsi un cadeau de noël peut être aussi un cadeau d'anniversaire.
Alors que faire ? Refaire une gestion par les tags dans un menu perso ? Si je fais ça je vais avoir des redirections à foison!
Wow un gros merci Sylvain pour cette article plein d'excellents conseils, j'avais faux sur plein de points (les tags et les extraits en page d'acceuil), je vais corriger tout ça merci !
Je suppose que c'est la même chose pour la reprise de son flux rss en homepage colonne de droite qui propose un aperçu des articles ?
@ Yann
Si la bio de l'auteur est suffisamment consistante en haut de page pour la différencier d'autres pages, il n'y a pas de raison.
@ Nicolas
Je comprends, mais du coup, avoue que la catégorisation ne sert pas à grand chose...
Il aurait sans doute été plus efficace de mieux différencier les catégories au départ.
Dans ton cas, il aurait pu y avoir des catégories très différenciées, par exemple, cadeaux homme, cadeaux femme, cadeaux enfants (normalement, ils sont distincts) et ensuite justement des tags pour "anniversaire, noël, etc.
Mais comme tu dis, si tu fais cela maintenant, tu vas t'amuser avec les 301.
C'est bien pour cela que je dis toujours qu'il ne faut pas hésiter à passer beaucoup de temps sur l'architecture d'un site en amont, parce que lorsque l'on souhaite faire de grosses modifs ensuite, ce n'est pas simple. Comme pour la construction d'une maison en fait.
@ Simon
Et donc, ne pas faire comme sur ce blog 🙂
En fait, le principe est de placer les contenus dupliqués le plus bas possible dans la page pour avoir le contenu le plus différencié en haut de page.
Après, il faut relativiser, si toutes les pages reçoivent pas mal de liens externes, ce problème de duplication est sans doute pas mal minimiser par Google.
Salut Sylvain,
Pour le texte en haut à droite qui se répète sur toutes les pages, et que tu as mis en image, une solution peut être dans certains cas d'en faire une sorte de menu avec des liens profonds vers des pages qui développent le propos.
Les menus et liens dans la zone de navigation ne sont pas flagués s'ils se répètent...
@leMoussel : ton plug-in fonctionne-t-il aussi sur les pages ou seulement sur les billets ?
Note : tu as oublié de mettre un formulaire de contact sur ton site...
Bonjour Sylvain et merci pour ce superbe article !
J'ai une question à propos de la pagination. La description qui se duplique de page en page est un gros problème que je n'ai jamais réussi à résoudre. C'est Google Webmaster qui m'avait attiré l'attention dessus en me disant que j'avais des pages avec des descriptions identiques... Bref, aurais-tu un plugin ou un morceau de code pour afficher la description uniquement sur la première page de la catégorie ?
Je te remercie par avance
Vince
Bonjour Sylvain
Excellent article qui montre bien le danger d'un outil non maitrisé. Il faut de la réflexion et e la stratégie pour lancer un site. Cet article est la suite de l'optimisation Title meta description de la semaine dernière.
Il faut faire attention cependant, certains themes n'affichent pas ce texte d’introduction dans les catégories ou les tags, il faut mettre un peu les mains dans le cambouis mais ce n’est pas très compliqué
C'est bien ce que je pensais, je suis dans le Cac*.
La solution la plus simple est de recommencer ailleurs, avec 3 ou 4 catégories majeures Homme, Femme, Autre (euh), Enfant, Animaux...
Je suis maintenant éclairé...
WordPress est un très bon CMS pour le référencement sauf qu'il cache des failles auxquels il faut être méfiant. Merci pour ces explications et ces astuces Sylvain !
J'aurais aimé lire que la pénalité pour contenu dupliqué en interne est une légende urbaine.
La non valorisation de pages n'est pas forcément problématique, donc le duplicate n'est qu'une anecdote pour la plupart des sites.
Google a très bien progressé pour valoriser les pages qu'il choisit de mettre au rebut.
Maintenant, c'est vrai que ça ne fait pas de mal d'être pro-actif en éliminant ce qui n'est pas "digne" de figurer dans l'index.
Merci Sylvain pour ces astuces utiles pour le positionnement sur les moteurs de recherches. Comme d'habitude , toujours des nouvelles et des solutions afin d'améliorer le réf.
C'est vrai que Wp est trés utile et facile en point de vue réf et gestion de contenu mais il est bien évident de suivre et de connaitre ces astuces !!
Voilà , on se met à étoffer nos catégories 😉
Salut Sylvain,
Tu passes à côté d'un détail important concernant les extraits. Effectivement la pseudo balise "more" est judicieuse pour ne pas reprendre l'intégralité de l'article sur d'autres pages, mais il y a carrément mieux, et bcp d'utilisateur de WP passent à côté :
Dans l'interface d'administration de l'article, en haut à gauche de l'écran, déroulez "Option de l'écran", et cochez "Extrait". Un nouveau champs de saisie apparaît alors. Avec cette solution, on a un texte d'introduction vraiment unique et c'est beaucoup mieux pour faire des textes qui incites à cliquer pour voir la suite (meilleur CTR).
Généralement, j'utilise les tags en complément des catégories principales quand elles ne sont pas nombreuses.
Cela me permet d'optimiser mes articles sur des mots clés longue traines par des tags complémentaires aux catégories principales.
Exemple :
Ma catégorie principale est : "chaussures de sport".
Mes tags pour les articles de cette catégorie pourraient être : "chaussures de sport nike", "chaussure de sport adiddas"...
Par contre il faut être très attentif à ne pas utiliser des tags en double => écrit de manière différente (singulier, pluriel, masculin, féminin).
Généralement j'essai de respecter 2 tags par article pour ne pas être submerger par un nombre de tags trop important et d'avoir des tags trop spécifique qui ne comporteraient qu'un article.
Salut Sylvain,
Bon petit rappel pour les débutants WordPress. Néanmoins, je te rejoins pas sur le petit texte d'introduction. En 2012, Google n'a pas trop besoin d'un petit texte d'intro pour faire la différence entre une page d'accueil et les pages catégories.
J'avais testé quelque chose de ce genre l'an passé car j'avais eu une alerte que les pages étaient trop similaires. Même en ajoutant le texte, ça n'a rien changé.
Google reste un logiciel, mais de moins en moins bête 🙂
Salut Sylvain,
Bonne synthèse.
Pour pousser plus loin, on pourrait jouer avec les champs personnalisés afin de définir pour chaque publication une ancre et un résumé spécifiques à afficher dans les catégorie, les archives par date, les tags.
J'ai fait un petit topo dessus justement avant hier sur Seosterone.
Cela nécessite un peu de boulot lors de la rédaction de chaque article, mais permet de n'avoir aucun texte similaire dans un blog, et de diversifier les ancres des liens internes.
Ton article vient de me donner l'idée de trouver une bidouille pour gérer une possibilité de description des catégorie lors de leur pagination, afin de ne pas répéter le même texte en pages 2, 3 , etc.
@Vince
Je demanderai à nos développeurs pour le code.
@ Laurent
Hum... sur une jeune blog c'est flagrant. Le truc des intro de catégories et du petit texte en image suffit à faire passer de l'index complémentaire à l'index primaire.
Après, l'autorité change tout, quand tu as pas mal de BL, tu peux même piquer les textes d'autres sites et leur piquer la place dans la Serp:-)
@ Aurélien
Tout à fait, tu as entièrement raison !
Jouer avec les extraits permet aussi d'éviter le DC de manière très efficace.
@ Mikiweb
Nous sommes d'accord, les tags, c'est très bon quand c'est bien géré. Maleheureusement, mes clients ont toujours exagéré avec, je préfère ne pas les laisser les utiliser plutôt que de faire n'importe quoi .
@ Ramenos
Comme je l'indiquais à Laurent, pour moi cela a fonctionné à plusieurs reprises pour sortir de l'index complémentaire.
@ Seosterone
Bonne idée.
Merci beaucoup ! j'ai cherché partout sur le net et pas de réponse malgré de nombreuses questions. Tu rendrais service à beaucoup de personnes 🙂
Merci pour cet article très intéressant, ça m'a permis de corriger quelques erreurs sur mon blog. J'avais beaucoup trop de tags et aucune description pour mes catégories. Du coup me viennent deux questions :
1) L'absence de tag nuit-elle au référencement ?
2) Vaut-il mieux privilégier la balise more ou un extrait unique pour chaque article ?
Au risque de lancer un pavé dans la marre et de me faire un peu éclabousser au passage, ce genre de problème n'arriverait pas si les gens utilisaient les rubriques (ou appelez ca catégories si vous voulez, c'est exactement la même chose) pour ce qu'elles sont VRAIMENT et non pour ce à quoi ils imaginent qu'elles servent !
J'en ai marre, cette erreur je la vois trop souvent partout :
Les catégories N'ONT JAMAIS EU POUR BUT DE THEMATISER DES ARTICLES mais de DIFFERENCIER DES METHODES DE PUBLICATION ! Ya quand même une gigantesque nuance !
Voyez la rubrique comme un dossier carton immuable contenant un type de documents (comme partout, finalement) : Une pochette bleue pour les factures, une autre rouge, pour les CR de réunions, etc... sur le web c'est ex-ac-te-ment la même chose !
Les rubriques n'ont jamais servi QU'A CA et à rien d'autre ! Différencier un mode de publication A d'un mode de publication B.
Pour les thématiques ou domaines abordés, c'est le boulot des tags, point !
Et quand on y réfléchit ne serait-ce que 3 seconde Trente : aujourd'hui j'écris un billet sur un film, adapté d'un livre dont j'ai parlé la semaine dernière. J'ai grave l'air d'un con si "Livres" et "Cinema" sont 2 rubriques distinctes, non ?
Alors qu'une simple rubrique "Blog", dans laquelle je range des billets (toute théma confondue) avec des tags derrière, pour faire les croisements de données que je veux quand je veux : curieusement je m'épargne tous les problèmes et écueils qu'on vient de citer ici ! Et c'est pas de la magie !
Tant que les gens n'auront pas compris ça, les arbos des sites continueront de ressembler à des usines à gaz et des pages, à être versées à l'autodafé de l'index complémentaire.
Il est vrai que je n'ai jamais fait attention à ça sur mon blog qui est très jeune même si je savais qu'il fallait y faire attention.
Et d'après ta conclusion c'est la même chose pour toi. Il y a toujours des choses qu'on remet au lendemain qui lui même remet à jamais.
Bref, il va falloir que je refasse mon système de tag... un jour...
Mettre un texte d'intro pour les catégories est très pertinent. Ca fait du texte en plus et ca peut éviter le DC. Il faudrait que je le fasse... un jour...
Il serait intéressant de montrer la marche à suivre pour ajouter un texte différent selon les catégories. Tu as utiliséq les conditions du style : if categorie = référencement else echo "j'affiche ce texte" ?
Merci pour ces conseils, je fais l'erreur des tags qui sont similaires à mes catégories. Comme quoi on pense souvent bien faire et ça se retourne contre nous 🙁
Intéressante la micro duplication, je ne pensais pas que cela pouvait avoir vraiment un impact, il va falloir que je me penche dessus sérieusement...
@ Benjamin
L'absence de tag vaut mieux que des tags mal utilisés.
On peut considérer que l'extrait est même encore plus efficace car il se différencie totalement du début de l'article. Il n’empêchera pas le besoin d'une intro spécifique pour les pages de catégories ou de tags.
@ Loiseau2nit
Je ne suis pas certain d'avoir tout compris, mais si tu parles de bien penser en amont ses rubriques (ou catégories), je suis d'accord. Après, les mêmes recettes restent à appliquer sur les pages de tags pour ne pas faire que déplacer le problème.
@ Lereferenceur
Oui, j'y ai déjà répondu, il faut que l'on vous détaille le code un de ces 4.
@ Julien
Je le répète, c'est surtout vrai au lancement d'un blog qui reçoit généralement peu de liens pour chaque page au début.
@Sylvain : oui il y a de ça, bien penser, non pas ses rubriques simplement mais TOUTE son arborescence en amont mais bon, là je pense que je n'apprend rien à personne en disant ça (enfin j'espère ? ^^)
Non ce que je dis en revanche, c'est que les rubriques/catégories, ne doivent en aucun cas se substituer aux tags. Les 2 objets édotoriaux n'ayant pas du tout la même fonction à l'origine.
La rubrique étant un placard dans lequel tu ranges des choses, des objets, et le tag, la petite étiquette que tu vas coller dessus pour savoir à quoi ca correspond.
Le problème étant que pour beaucoup, la rubrique devient l'étquette par dessus laquelle il rajoutent 150 post-it (des tags) alors qu'au final, toute leur collection d'assiettes n'est pas rangée dans le même placard..... What else... 😐
Merci pour cet article complet. J'ai ajouté comme beaucoup la différenciation des contenus générés par pagination dans ma liste des tâches futures, ainsi que l'image pour le texte descriptif.
Cette réflexion commune sur l'utilisation des mots-clés aussi bien dans les commentaires que dans l'article est très précieuse.
Mon blog est lui même très jeune et je l'utilise maintenant à fond : j'ai 5 catégories seulement et au départ j'avais des sous-catégories se rapportant aux services décrits. Du coup j'avais deux à trois fois "Facebook", "Twitter"... puisqu'ils se retrouvaient dans presque chacune des catégories.... Ils sont vite allés rejoindre les mots-clés avec une description en en-tête.
Je souhaitais aussi créer un lexique (mon site s'adressant à des débutants). Mettre les définitions dans les pages ? Multiplications de pages que je ne souhaitais pas. Les mettre dans les articles ? Avec une difficulté pour les retrouver pour les liens internes.
Et là encore j'ai décidé de les mettre en mot-clé : j'ai en plus le plaisir en dessous de mon texte de définition de proposer tous les articles qui correspondent.
Finalement mes mots-clés se transforment, je l'espère, en atouts à deux niveaux : contenus différents pour Google et guide pour mes lecteurs.
Par contre dès qu'un blog a plusieurs contributeurs, il est vrai que cette discipline autour des mots-clés et des catégories est d'autant plus sensible. Il n'est pas possible de dire dans l'administration qu'un rédacteur n'ait pas le droit de créer un mot-clé ou une catégorie, mais seulement de les "proposer" à l'administrateur ?
Je ne rencontre pas du tout ce problème sur mon site Photo qui est construit depuis le début avec des extraits d'articles en page d'accueil et ces même extraits forment les premiers paragraphes des articles (site en ligne depuis Mars 2012). Plus de 98% des pages sont indexées par Google. Cela étant dit je n'utilise pas WordPress et j'ai mis en application tout ce que je connais sur le SEO (à l'exception de la création de liens)... Cela porte (pour le moment) très bien ses fruits :). Aucun Panda ou Penguin ne m'a touché du moins jamais négativement 🙂
C'est toujours bon de rapeller l'importance du texte de description de catégories/tag, qui si il est suffisamment conséquent, permet de bien aider à sortir de ce problème de duplicate.
A mes yeux, l'utilisations de tag, ca permet surtout d'aller chercher la longtail, mais il faut clairement en amont avoir optimisé la structure et l'architecture pour ce que cela ne pose pas problème aux yeux de Google.
Je suis débutante sous WP. Comment faire pour qu'il y aie une intro dans une catégorie ?
@Marco m'est avis que si tu as besoin de pages entières pour travailler une long tail, c'est qu'il y a un autre problème en amont non ? Enfin je veux dire que perso, je ne me vois pas créer une page dédiée à une expression de LT, à moins qu'il y ait un réel besoin derrière l'expression, auquel cas ca n'est plus de la LT là... non ?
Bonjour, merci pour ces explications, en effet votre article est pertinent pour moi dans le sens où il soulève un problème auquel je suis actuellement confronté.
Bonjour Sylvain,
Peux-tu donner plus de détails sur la commande que tu utilises pour mesurer le nb de pages classées dans l'index supplémentaire?
Est-ce qu'il existe de la littérature qq part qui explique les différentes méthodes à utiliser?
Merci pour tes explications.
@ François
La commande est détaillée dans les liens que j'ai mis dans l'article, il te suffit de remplacer l'url du site par celle de ton choix.
La différence entre les pages d'une liste et l'autre te donnera celles classées dans l'index complémentaire.
Ça n'est pas juste à 100% comme tous les outils Google, mais cela donne déjà une bonne info de départ. A contrôler ensuite en faisant des requêtes plus précises en fonction des pages que tu auras listé.
Il ne faut pas oublier l'existence de la balise canonical qui permet de régler une partie des soucis. Pour ma part, je ne pense pas que la microduplication puisse pénaliser un site en quoi que ce soit. Aujourd'hui tous les sites ont un header, un menu, et un footer commun, je ne vois pas sur quels critères Google Bot pourrait décider de restreindre ce type de page.
Merci en tous cas pour cet article
@Virginie
Déjà il faut Taxonomy TinyMCE pour modifier les descriptions des catégories afin de les rendre attrayante, ensuite on importe la description dans Category.php par cette fonction (la catégorie sera présente que sur la page 1, suite...
edit AxeNet
----------
Désolé nicolas, le code passe mal dans les commentaires, ça donne un gros charabia ou il manque plein de signes.
J'ai mis le code dans l'article (sans plugin, ce n'est pas plus mal)
+1 avec l'intervention de Simon.
Je serai toi, Sylvain, je modifierai l'article pour en parler.
C'est à mon avis, la meilleure arme anti-DC même si évidemment, ça fait du boulot en plus.
@Loiseau2nuit : Oui il m'arrive de gerer la LT avec des Tags, et je ne vois pas en quoi cela serait révélateur d'un problème en amont. Sur quoi te bases tu pour dire cela ?
Après on a peut etre une définition différente de la longtail, mais pour moi a partir du moment qu'une expression est recherchée sur un moteur de recherche (LT ou non), c'est qu'il y a un besoin derrière, non ?
@ WebOnreft
Oui, je vais ajouter un passage.Mais ça ne change pas le principe, les pages de catégories listeront des extraits spécifiques au lieu des début d'articles, mais il reste nécessaire de faire des intros de catégories.
J'avoue que l'avantage est surtout d'éviter la duplication entre les pages d'articles et les pages de récap quelconques.
Bonjour,
Je possède un blog sous WP et je dois avouer qu'il y a pas mal de petites choses décrites plus haut auxquelles je n'avais jamais pensé. Il va donc falloir que je me retrousse les manches et que je fasse les modifs, mais c'est un mal pour un bien, merci pour ces conseils.
Merci pour le code. Je vais tester ça 🙂
C'est ne très bonne astuce que vous nous montrez là. C'est vrai qu'on n'est jamais à l'abri des duplications. Alors avoir une méthode pour contrer cela, c'est toujours la bienvenue. Il y a du travail à faire mais je pense que le résultat va être satisfaisant. Merci !
Salut Sylvain
Si j'ai bien compris ton article, il faut faire très attention entre les parties "catégorie" et "tag"... Peut-on envisager d'utiliser les tags pour une navigation transversale (par exemple, un mot clé qui rassemblerait des articles de plusieurs catégories différentes).
Cordialement,
Amadou
Bonjour,
WordPress est utilisé sur quoi ? 10 à 15% des sites de la planète je pense. On sait que Google connait bien ce CMS et j'ai envie de dire qu'il est plus que probable qu'il prenne en compte les défauts "naturels" de WP dans son algorithme !
Il y a quelques temps j'ai voulu tester ça sur un nouveau blog. Tags à gogo et non utilisation de la fonction permettant de ne montrer qu'un extrait du texte en page d'accueil. Je m'attendais à être aligné pour duplicate content. Surprise ! Pas du tout ! Non seulement je ne l'ai pas été, mais le blog a commencé à ranker sur les mots-clés utilisés dans les tags et la même page ressortait sur divers tags, sans tenir compte du DC !
J'ai poursuivi l'expérience plusieurs semaines et je n'ai pas vu l'ombre d'une pénalité. Certes, les articles étaient originaux et étoffés... Je pense donc que Google, s'il trouve du contenu de qualité, ne s'embête pas forcément avec un classement fonction de l'optimisation ou pas. Je suis presque sûr qu'il prend en compte ce "défaut" de DC de WP.
Bonjour,
J'ai essayé le code pour ne pas faire apparaître la description dans la pagination des catégorie, mais sa ne marche pas. J'ai que ce code : dans mon fichier category.php qui me permet de faire apparaître la description (j'ai du le rajouter car d'origine la description n'apparaissait pas).
Quelqu'un serait où il faut mettre le code ?
Attention aussi à la duplication des URL de catégories sous WP. Boite à Web (de mémoire) a donné une astuce à placer dans le fichier functions.php du thème afin d'endiguer la prlifération du bad SEO sur des URL de catégories n'existant pas.
Bonjour à tous,
Tous vos commentaires sont fondés, mais encore une fois je pense que les petits défauts cités dans cet article viennent plus des créateurs des blogs que du logiciel WordPress en lui-même. Et cela me semble d'autant plus important que tu le souligne Sylvain, car effectivement dès qu'on nous parle de la possibilité de faire un lien pour classer nos articles on pense directement à notre mot clé favori. Ce qui nous amène souvent à produire ce type d'erreur sur le Duplicate Content.
Alors certes, l'ajout de tags est un très bon outils, mais n'oubliez pas que derrière il faut quand même un minimum de contenu bien rangé, et un site avec minimum une cinquantaine d'article. Sinon c'est clair que ça ne sert pas à grand chose de les classer.
Bon courage et bon travail à tous ceux qui vont refaire un peu l'arborescence de leur site à la suite de cet article, je pense que le jeu en vaut la chandelle.
Bonne continuation.
Merci Sylvain pour cet excellent article sur le duplicate content lie a WordPress et les astuces pour y faire face. Sur l'ensemble de mes sites WP, je limite le DC en n'utilisant plus les tags, en reduisant les extraits, en veillant a ce que les elements repetes dans la sidebar soit tres court et en proposant une description unique pour la page d'accueil et pour les categories. Desole pour les accents, je redige depuis un clavier US.
Pour ma part j'ai mis en place un "Noindex, follow" sur toutes mes pages de navigation (hormis la première bien sûr) et ça marche plutôt bien...
Une autre chose qui faut que je mette en place c'est d'utiliser un "Excerpt" customisé qui contient par exemple ma "Meta Description" et qui ne soit pas le début de mon article. Ainsi mes pages catégories ne seront pas que du contenu dupliqué de mes articles.
Je retiens ton idée d'avoir très peu de tags, jusqu’à présent j'avais supprimé tous les Tags pensant que c'était une source de DC supplémentaire.
Wp est en effet un CMS qui possède de gros défaut de duplication. J'essaye de ne plus utiliser les pages tags / mots clés qui sont trop dangereuses et qui sont un peu trop similaire au catégorie.
Savez-vous comment ajouter une canonical sur les pages 2 et + des catégories vers la page 1 ?
Merci pour votre article
vraiment c'est très intéressant pour le duplicate content lie a WordPress et aussi les astuces que tu nous as donné
Pour le moment, les pages des tags ne sont pas indéxer sur mon blog, mais j'hésites de plus en plus à le faire pour pouvoir me positionner sur différentes requêtes.
Par contre, si j'ai bien retenu la leçon, il faudrait avoir une description de l'article différente sur l'accueil, la page de la catégorie et la page d'un tag ?
Est-ce que le mieux est d'associer qu'une seule fois un article à un tag ? Pour ne pas le retrouver plusieurs fois sur la même page avec la même description ? Ou je pousse peut être l'optimisation un peu trop loin ?
Merci beaucoup pour ces informations précieuses ! Moi qui pensait que WP était idéal pour le référencement naturel. Je découvre qu'il est à utiliser avec précaution. En outre, je n'imaginais pas que l'utilisation des tags devaient se pratiquer ainsi.
Excellent blog ! On sent l'expertise !
Merci pour ce super article. Autant de détails sur la duplication et ses solutions bravo. Je pars de ce pas appliquer ces changements sur mon blog!
Pour ceux réticents, il n'y a de toute facon rien à perdre, si ce n'est à garder en même temps son site confortable pour les visiteurs.
Un article qui tombe à pic dans ma besace, j'étais en pleine optimisation de ma plate forme de diffusion WordPress et je tombe sur cet article. Je crois que j'ai mis à profit déjà le maximum que je pouvais appliquer pour l'instant. merci pour cette check list, bien utile au demeurant.
Malheureusement le code proposé pour la partie catégorie est introuvable dans certains thèmes, comment faire ?
Sinon très bon article, qui date certes, mais qui a toujours le plus grand effet, merci Sylvain.
Merci pour les infos Sylvain. J'ai immédiatement appliqué tes recommandations sur mon blog WordPress au niveau des catégories. J'ai toujours été inquiet à cause de la mauvaise réputation de WordPress en termes de DC sans vraiment savoir quoi faire pour lutter contre.
En ce qui concerne les tags, je ne les utilise pas du tout ... à tord certainement mais pour le moment, ça m'évite peut-être certains ennuis.
Bonjour !
Merci pour ton article qui éclaire ce vaste sujet (pas toujours accessible !)
Une petite question (bête?)... Si je mets un article (même url) dans deux catégories différentes sur wordpress, est-ce que c'est du duplicate content ?
Merci beaucoup pour ton retour ! 🙂
@ Elodie
Si l'article n'a qu'une seule url il n'y a aucun souci.