Quand le contenu dupliqué pénalise les copieurs

copieur

Je teste actuellement un outil de détection du contenu dupliqué (je reviendrai vers vous sur le sujet, car il renvoie Copyscape à la préhistoire). En regardant en détail quelques sites qui volent le contenu du site de notre agence, j'ai bien la confirmation que dans certains cas, les copieurs pénalisent clairement leurs propres sites.

Heureusement les plagiaires sont parfois punis

Lorsque l'on possède un site web, le vol de ses propres contenus est toujours angoissant, car Google est incapable de gérer la paternité d'un texte. Ce même Google conseille même lorsque vous diffusez vous même un texte sur plusieurs sites de demander aux autres de faire un lien vers l'original ou de mettre une meta noindex sur le site qui diffuse la copie (source).

Pour résumer la pratique de Google. Si le site copieur à plus d'autorité que le vôtre, il vous piquera votre place dans les résultats, s'il en a moins, c'est lui qui sera parfois plus ou moins pénalisé.

Quelques exemples concrets

Web Hebergeur France

J'ai trouvé chez un hébergeur (web-hebergeurs.pro) une copie intégrale de l'un de nos vieux articles concernant l'arnaque de Domain Renewal Group. Ce site a publié (sans rien nous demander bien sûr... et en mettant juste leur nom de société à la place de celui de AxeNet) cet article sur la page  suivante : https://www.web-hebergeurs.pro/admin/knowledgebase/article/26/arnaque---domain-renewal-group/  (une copie d'écran ici).

Qu'en est-il quand on effectue une recherche avec les mots-clés relatifs à cet article « domain renewal group, domainrenewalgroup, arnaque domain renewal group, avis domain renewal group, etc. » ? Le site de l'hebergeur indélicat n’apparaît sur aucune des requêtes (check fait sur les 1000 premiers résultats de Google).

Malgré cela, il reste visible lorsque l'on tape dans Google une requête qui intègre à « domain renewal group » un mot-clé présent dans son nom de domaine comme « hebergeur ». (je note au passage que ce site interdit la reproduction de ses textes dans ses mentions légales 🙂 )

Le site AxeNet est lui positionné 1er ou 2e quand on recherche les requêtes précitées.

On observe donc une pénalité au moins partielle pour ce site qui copie illégalement sans vergogne le contenu d'autrui. À quel point cette pénalité donne-t-elle un signal négatif au reste du site, je n'en sais rien. Il est probable que s'il volait de nombreux autres articles, ceci le pénaliserait plus largement.

Ecole virtuelle gratuite

Voici un "passionné de la formation gratuite" qui copie lui aussi  le contenu complet de notre page contenant une infographie SEO sans nous avoir rien demandé bien évidement. La copie est visible ici :
(un screenshot ici car la copie a été supprimée suite à la parution de ce billet)

Lorsque l'on effectue des recherches sur Google sur les termes « Qu'est-ce que le référencement (seo) [H1 de l'article], qu'est-ce que le seo, infographie seo, etc. le site du plagiaire n’apparaît pas dans les 1000 premiers résultats de Google.

Il se pénalise donc lui aussi tout seul en pillant les sites vers lesquels il se garde bien de faire des liens... (en même temps, avec l'autoduplication qu'il provoque chez lui en utilisant n'importe comment les tags de WordPress, ça n'arrange pas les choses...)

Sur les requêtes précitées, le site AxeNet se positionne plutôt bien et ne souffre donc d'aucun filtre avec ce contenu originalement publié (nous sommes même 2e sur la requête « seo »).

De l'utilité d'acquérir de l'autorité

Dans ces deux exemples (il en existe des dizaines d'autres) , les copieurs sont pénalisés, car leurs sites manquent singulièrement d'autorité aux yeux de Google (quoi que dans le cas de l'hébergeur...). Celle-ci s’acquiert au fil du temps, en obtenant des liens entrants de qualité (et donc souvent en publiant des contenus originaux de qualité).

Mais il aurait pu en être autrement. Si un très gros site comme Le Monde, ou le Huffington Post avait copié l'un de nos articles, il est très probable que le site Axenet en aurait fait les frais et ce serait vu pénalisé, au moins pour les articles concernés.

Que faire en cas de vol de contenu ? *

  • La manière douce : contacter le copieur et lui demander un lien vers votre contenu original.
  • La manière forte : l'action en justice. Pour ceux qui souhaitent commencer seuls, j'avais publié ici un modèle de lettre.
    * Dans le cas présent, je préfère garder ces deux exemples plutôt que de mener une quelconque action.

Edit 12:39

La réaction de Ecole Virtuelle Gratuite quand @Loran750 lui pose la question sur son plagiat ( en image ci dessous). Bien sur, je devrais les remercier, il me font de "la Pub". C'est vraiment trop gentil... qu'est-ce que je suis stupide...

"Je vous vole ça vous fait de la pub..."

"Je vous vole ça vous fait de la pub..."

Edit 2  (21 mars) : suite aux réponses reçues sur Twitter, je vous livre mon point de vue sur la mauvaise foi évidente dont certains font preuve.

 

(je recevrai un mail quand un article est publié (no spam)

30 thoughts on “Quand le contenu dupliqué pénalise les copieurs

  1. Le Clos d'Othe

    Je croyais que la balise canonical, l'association de mes pages à mon compte G+ protégeaient déjà bien dans le sens signalait le voleur et donc chez GG lançait la pénalité.

  2. Sylvain Auteur de l’article

    @ Le clos...
    Si un gros site fait un copier/coller d'un de tes contenus, tu verras que ça ne protège de rien du tout. Google est un incapable sur le sujet. Seule l'autorité de ton site peut t'épargner.

  3. OLIVIER

    Bonjour

    Une solution intermédiaire pour lui apprendre la politesse s'il persiste ou fait la sourde oreille avant d'engager des frais de justice :

    Normalement, il est interdit d’afficher des annonces Adsense via un contenu dont on n'est pas propriétaire. Donc demander la suppression des annonces Google Adsense sur le site (voir à ce sujet le "AdSense program policies" qui interdit l'utilisation de contenu plagié). Vu la présence d'annonces "adsense" sur le site...

  4. Sylvain Auteur de l’article

    @ Daniel
    Pas certain que la date d'indexation soit un critère fiable. La copie peut être indexée avant l'original malheureusement.

  5. Logibezt

    Bonjour Axe-Net,
    J'ai remarqué récemment que certains sites utilisés le contenu de mon blog.
    Dans les résultats de recherche, si je vérifie la version cache, c'est carrément la page de mon blog qui apparaît. Et en cliquant directement sur le lien on attérit sur une autre page (pas catholique). Comme si les pages de mon blog étaient intégré sur d'autre site.
    La page affiché n'a rien à voir avec le site sur lequel c'est publié, on dirait qu'ils utilisent le site indépendamment de la volonté de leurs propriétaire.
    Pourriez vous m'éclairer ? Est-ce négatif pour moi ? Est-ce que mon blog risque une pénalité ? Car au final même les liens sur la page (en cache) sont les miens et renvoient vers mon blog.
    Je vous remercie grandement, Amitiés, Logibezt.

  6. Sylvain Auteur de l’article

    @ Logibezt
    Ces sites intègre sans doute le votre dans une iframe.
    A priori pas vraiment gênant. Il existe toutefois des scripts qui peuvent limiter cela.
    Dans Google, cherchez : script sortir iframe

  7. Nicolas

    Bonjour Sylvain,
    Moi aussi je subit cela trop souvent... Et le pire, c'est que le plus souvent les plagiaires me prennent pour un idiot ou m'agressent carrément en me traitant "d'emmerdeur" !
    Depuis une semaine j'utilise le même outil que toi, merci Paul ! Plus simple que CopyScape, mais c'est déprimant de voir tout le contenu dupliqué que je possède sur le web... Je n'en voyais pas autant avec CopyScape...
    J'ai mis en place un article pour les plagiats de mon site, c'est souvent grâce à lui que j'arrive à faire supprimer les contenus copiés et le plus souvent à avoir une réponse à mes mails. Sans cet article, on ne me répondait pas ou rarement, avec cet article en lien dans mes mails, j'ai des réponses et même des excuses parfois...
    Mon article sur mes plagiaires (que je dois mettre à jour dès que j'ai un peu de temps...) : http://www.creanico.fr/prestations/freelances-plagiaires-et-plagiats/

  8. Sylvain Auteur de l’article

    @ Nicolas
    Les plagiaires n'aiment pas que l'on raconte leurs pratiques, surtout si cela se voit en tapant leurs noms sur Google 🙂
    Pour ce qui est d'être soi-même pris pour le casse-pieds de service, je connais, j'ai eu un festival d'explications et de commentaires tellement amusants sur Twitter hier à l'issu de cet article que je vous en ai préparé un 2e que je publierai cet après midi...

  9. Nicolas

    C'est exactement le but recherché : que l'on trouve leurs noms dans Google grâce à mon article, ils le méritent bien !!! Je languis cet après midi pour lire le second article... 🙂

  10. Camping-complet

    Bonjour Sylvain,
    J'ai déjà eu des problèmes de plagiat et j'ai bien tenté de contacté le voleur, sans réponse de sa part. Je ne suis pas allé jusqu'à l'action de justice par peur d'avoir des frais de justice à ma charge (je ne compte même pas le temps perdu).
    Sais-tu combien coûte ce genre d'action ? Les frais de justice sont-ils remboursés par le plagieur si la justice lui donne tort ?

  11. Camping-complet

    Merci pour la réponse 🙂
    C'est rassurant de savoir qu'on peut faire valoir ses droits sans risquer une perte financière supplémentaire.
    Néanmoins, le plagiat de Diamsinvest est un cas extrême. Je doute que la copie d'un article ou d'une infographie donne droit à autant de dommages et intérêts 🙂

  12. Sylvain Auteur de l’article

    @ L.jee
    Je pense que la situation parfaite est de ne pas avoir de copie.
    Après, soyons honnête, si ton site a plus d'autorité et que sur la copie il y a un lien vers ton site, c'est plutôt bon pour toi.

  13. Romain

    En fait quand on y réfléchi bien, les très gros des secteurs pourraient, au lieu d'écrire eux mêmes leurs articles, faire un travail de veille et tout pomper aux petits sites sans jamais être réellement inquiété.
    Dommage qu'il n'existe pas une balise obligatoire qui réglerait le problème simplement.

  14. Sylvain Auteur de l’article

    @ Romain
    Qu'on se rassure, ils seraient inquiétés légalement. Sinon, la balise existe, c'est la balise canonical. Mais je vois peu de plagiaires l'utiliser 🙂

  15. glazweb

    Quid du "Press This" intégré à WordPress, qui permet de relayer sur un blog thématique tout ou partie d'une info pertinente glanée sur le web ?
    Est-ce que c'est considéré comme du DC par Google ?
    Personnellement, je trouve cette fonctionnalité constructive. Elle ajoute automatiquement le lien vers la source, et la balise data-mce-href.

  16. Sylvain Auteur de l’article

    @ Glazzweb
    Je ne sais pas, jamais utilisé.
    Est-ce que ça reprend un contenu complet ? J'en doute.
    Et si un lien est fait vers l'original c'est déjà ça.

  17. glazweb

    @ Sylvain
    Seule l'intro est reprise automatiquement (155 caractères) avec une image, mais il est possible de sélectionner tout un bloc de texte, et de le partager. Par exemple, pour ce post, jusqu'au sous-titre "Ecole virtuelle gratuite", soit plus de 2400 caractères.
    Mais effectivement, Press This n'a pas l'air très utilisé.

    Bien, je vais lire le Festival de mauvaise foi...

  18. Bertrand

    Je tente le vol de contenu pour voir si le site definitions-marketing à suffisamment d'autorité 😉

    Blague à part, je trouve que Google a fait de gros progrès dans le domaine. Des sites étranger qui nous plagiaient en reproduisant intégralement des centaines de définitions me semblent beaucoup moins visibles qu'avant dans les SERPs.

  19. Gérald Bouillaud

    S'il s'agit d'un petit blog avec de super bons articles et qu'il est face à un site bien célèbre et plus futé, la situation se retournera contre lui, et ce sera lui le plagiaire. Dans le monde de l'informatique, il ne faut pas dormir tranquille sur ses lauriers, il faut toujours être aux aguets. Cela est surtout important pour les prestataires externes.

  20. Steve

    Bonjour,
    Quel impact sur le referencement pour l'auteur et le copieur quand oη copie uη contenu avec uη lien ? Est-ce que ςa apport quelque chose au site original à part potentiels visiteurs venu de l'autre site ? Y a t il uη risque pour le site original de se faire piquer le palmares ?

  21. Ramenos

    J'ai loupé une histoire croustillante pendant mes vacances dis donc...

    En même temps, c'est la base du web de citer la source qu'on partage et ça crédibilise à la fois celui qui l'a produit et celui qui l'utilise dans le sens où il fait bien sa veille donc je ne comprends toujours pas pourquoi des gens s'amusent à voler le contenu... Car lorsqu'il/elle est découvert(e), adieu sa réputation.

  22. Maxime

    Encore hereux! Car il y'a à peine quelques années les sites avec un bon linkbuilding, mais un contenu 100% copypaste (faut bien faire des économies) étaient tranquillement dans le top de google, dépassant (et oui, ça arrivait pour de bon!!!) parfois les portails avec le contenu original!

Partagez sur :

Les commentaires sont fermés.