Le content spinning

content spinning

On fait souvent des rencontres intéressantes dans le milieu du SEO, en discutant avec des professionnels qui sont particulièrement pointus dans un domaine par exemple. C’est le cas de Florence Le Vot, la directrice de RaDiance Conseil. Florence fuit les projecteurs mais certains font appel à son expertise pour des services très spécifiques comme la mise en place de réseaux de sites, le déploiement d’opérations mixant presse/influenceurs/SEO, la génération de contenu par traitement automatique du langage et le content-spinning, dont nous allons plus particulièrement parler dans cet article. Florence développe cette activité depuis 2007 via une entité spécialisée dans ce domaine : SpinWave.

A quoi sert le content-spinning ?

Imaginons : vous devez produire 600 articles de 300 à 400 mots qui seront placés sur tout un tas de sites. Bien sûr, vous ne pouvez pas envoyer le même article à 600 sites car seule une petite poignée serait indexée et la plupart des plateformes aujourd’hui contrôlent l’unicité des articles avant de les publier.

En effet, que se passe-t-il lorsque Google voit plusieurs articles trop similaires ? Eh bien il ne les indexe pas tous. Le content-spinning (ou article spinning) se positionne donc comme une alternative à la rédaction classique et s’avère sans doute la seule solution économiquement viable lorsqu’il faut publier des centaines d’articles traitant du même sujet sur une multitude de sites. Pour s’en convaincre, nous allons comparer les avantages et les inconvénients des deux solutions :

1.    La rédaction classique

C’est la solution la plus qualitative si vous faites appel à de bons rédacteurs. Mais c’est aussi la plus chronophage et la plus coûteuse. Vous devrez définir les 600 sujets, former une équipe de 10 rédacteurs par exemple en leur confiant à chacun 60 articles à rédiger. Il faudra ensuite contrôler le contenu de chaque article (c’est tellement facile d’écrire des bêtises sur un sujet que l’on ne maitrise pas) et y placer vos liens manuellement, à moins que vous n’ayez rédigé des consignes précises à ce niveau et qu’un chef de projet s’en charge.

En ce qui concerne le budget, comptez entre 25.000 € et 50.000 € pour 600 articles (ces chiffres ont été obtenus après une demande de devis faite auprès des principales plateformes du marché). Par ailleurs, des tests ont montré que si l’on demande à un même rédacteur d’écrire plusieurs dizaines d’articles sur le même sujet, les taux de similarité atteignent vite des valeurs de 20% à 25%.

2.    Le content-spinning  

Le content-spinning est une technique rédactionnelle spécifique (détaillée dans la section suivante) dont le but consiste à produire un maximum de variations à partir d’un seul texte-source. Grâce au content-spinning, on obtient des centaines voire des milliers d’articles qui traiteront du même sujet mais avec des constructions de phrase et des mots suffisamment différents pour que les moteurs de recherche ne les classent pas comme « duplicate content ».

Les deux inconvénients du content-spinning disparaissent dès que l’on fait le choix de la qualité : un spin de très bonne qualité ne produira pas de phrases aux tournures bizarres voire incompréhensibles. Et si les métriques du spin sont élevées (taux de variation et taux de perforation), il permettra de produire suffisamment d’articles au-dessous de 25% de taux de similitude maximum.

Au rayon des avantages : vous n’aurez qu’un article à valider et les articles générés à partir du spin peuvent être triés en fonction du taux de similitude maximum que vous acceptez, par exemple 18%. En ce qui concerne le coût, il est 20 à 50 fois inférieur à celui de la rédaction classique dès que l’on doit envisager de produire quelques centaines d’articles.

Qu’est-ce que le content-spinning ?

Le content-spinning s’appuie sur l’utilisation d’accolades et de pipelines. On placera donc les variations entre une paire d’accolades en les séparant par un pipeline. Ces variations peuvent être créées à différents niveaux : paragraphes, phrases, bouts de phrases et mots.

Exemple :

{Suivi de {l’avancée|la progression} {en ce qui concerne les|concernant les|pour ce qui est des|relative aux} {implémentations|ajustements|recommandations} techniques et {recettage {avant la mise en ligne{||||| du site}|final|en fin de projet}|mise au point {avant la mise en ligne{||||| du site}|finale|en fin de projet}}|{Reporting régulier|Mise au point {régulière|assurée tout au long de la prestation|continue|ininterrompue|permanente}} en ce qui concerne {la mise en place|l'implémentation} des {recommandations|préconisations} techniques|{Mise en place|Application} des {recommandations|préconisations} techniques {avec |accompagnée d'|incluant }un{ {reporting|suivi}|e mise à jour} hebdomadaire}

On a dans cet exemple 1 seule phrase en sortie mais cette phrase est basée sur 3 constructions complètement différentes et à l’intérieur de chacune de ces 3 variantes de phrase on trouve des variantes pour des bouts de phrase et des variantes au niveau de certains mots.

Cette construction permet d’obtenir :

  • 444 variations
  • Des phrases allant de 8 à 22 mots en sortie, avec une moyenne de 16,4 mots

Comment évalue-t-on un spin ?

Lorsqu’on souhaite évaluer un spin il faut prendre en compte 2 critères : la qualité des textes produits et les métriques.

La qualité des textes produits : pas de fautes basiques comme des fautes d’accord, de conjugaison, des mots collés ou plusieurs espaces d’affilée. Mais la qualité des tournures est également primordiale : on ne doit pas, à la lecture des textes, découvrir des tournures bizarres ou des phrases qui ne veulent rien dire. Un bon spin produit des articles dont la qualité ne soulève aucun questionnement. Les articles qu’il permet de générer se fondent dans la masse, sans se faire remarquer.

Parlons des métriques. Elles sont généralement inversement proportionnelles à la qualité des textes produits. En effet, par facilité, au plus on veut booster les métriques d’un spin, au plus on aura tendance à utiliser des synonymes, c’est en tout cas que font les mauvais spinneurs, par facilité. On appelle cela « le spin au clic » car le spinneur, au lieu de se creuser la tête pour trouver des variations, clique sur un mot puis clique sur les synonymes de celui-ci avant de passer au mot suivant.

Lorsqu’on travaille de cette manière on génère immanquablement des phrases composées de mots qui, hors contexte, peuvent être considérés comme synonymes les uns des autres mais qui finissent par produire des phrases aux tournures incongrues. Heureusement, il est tout à fait possible d’avoir la qualité et la performance en faisant appel à d’excellents rédacteurs, expérimentés, qui travaillent de manière très consciencieuse, au sein d’une équipe qui respecte de multiples phases de contrôle et de correction.

Sachez-le : s’il faut un bon rédacteur pour produire des articles d’une certaine qualité, il faut d’excellents rédacteurs pour produire la même qualité d’articles à partir d’un spin.

D’où vient le content-spinning ?

Le content-spinning est une technique qui vient tout droit du laboratoire de recherche et développement que constitue le référencement black-hat au sein du SEO. Le référencement white hat ne nécessite pas un gros volume d’articles dans un temps très court, le black hat si, car il faut publier des milliers d’articles sur des constructions plus ou moins complexes en pyramide, en étoile, en pétale, etc.

Lorsque les premiers référenceurs black-hat ont commencé à utiliser le content-spinning, ils ne faisaient pas dans la qualité. Il suffit de se rappeler des splogs et des bouillies de texte produites à l’époque, n’est-ce pas, Rudy 😉 . Mais à ce moment-là, Google était complètement dépassé et ça fonctionnait. Ça a fonctionné pendant des années. Aujourd’hui, et depuis quelques années déjà, ça ne fonctionne plus, Google a développé des filtres bien plus sophistiqués qui lui permettent de ne pas prendre en compte la bouillie de texte et pour aller encore plus loin dans la démarche, des milliers de personnes (les quality-raters) passent en revue des millions de sites tous les ans afin de filtrer ce que l’algorithme de Google a laissé passer. Google analyse d’ailleurs les actions de ces quality-raters afin d’améliorer son algorithme.

Comment le content-spinning s’est-il adapté aux progrès de Google ?

Dans tous les métiers, vous trouverez de bons artisans et de moins bons. Le content-spinning n’échappe pas à cette règle. Si vous conservez ce que cette technique a de meilleur dans son principe, si vous rassemblez des spécialistes des algorithmes, des mathématiciens, des statisticiens, d’excellents rédacteurs, des chercheurs en traitement automatique du langage et des développeurs, vous pouvez alors déboucher sur un niveau de service qui permet d’obtenir des résultats qui dépassent toutes les espérances. Les meilleurs prestataires en content-spinning sont aujourd’hui en mesure de produire des articles d’une qualité telle qu’ils peuvent être publiés sur des money-sites, avec des niveaux de similarité que l’on peut contrôler et filtrer.

Parlons des niveaux de similarité justement. Google a déposé par brevet une méthodologie (simhash) qu’il applique au niveau de son moteur de recherche pour évaluer le niveau de similarité entre 2 textes. C’est ce même brevet qui a permis le développement d’outils qui, à partir d’un spin, vont permettre de comparer et d’extraire les x articles les plus éloignés ou, au choix, tous les articles dont le seuil de similitude maximum est de x%. Si vous fixez par exemple un taux de similitude maximum de 15%, cela signifie concrètement qu’au sein d’un lot de plusieurs milliers d’articles, vous aurez au maximum 15% de similitude entre les 2 articles les plus similaires. Autant dire qu’à de tels niveaux, Google ne peut plus faire d’exclusion, cela reviendrait à exclure une trop grande partie du web.

Mieux encore : si on comparait les taux de similarité obtenus pour 5.000 articles triés à partir d’un spin et 5.000 articles portant sur le même sujet et produits par 50 rédacteurs (à raison de 100 articles par rédacteur), il y a fort à parier que les taux de similarité maximum seraient moins bons du côté des 50 rédacteurs. Le test n’a pas été fait sur des volumes aussi importants mais sur 500 articles rédigés par 5 rédacteurs, les résultats étaient sans appel, les taux de similitude maxi montaient à 38%.

La composante « délai » confère également un intérêt au content-spinning, puisque l’on peut obtenir plusieurs milliers d’articles en quelques semaines. Il faudrait recruter une armée de rédacteurs pour tenir de tels délais, avec des relecteurs et un chef de projet pour gérer l’ensemble.

En 2016, le content-spinning bénéficie d’un regain d’intérêt avec des outils comme YourTextGuru, SEO Quantum ou AnswerThePublic, qui permettent des produire des textes-sources de manière plus intelligente, en se basant sur une analyse approfondie des résultats de Google sur une expression ou une thématique.

D’où vient cette mauvaise image qu’a encore le content-spinning aujourd’hui ?

Les gens qui ont une mauvaise image du content-spinning en 2016 se répartissent en deux catégories :

  • Il y a ceux qui n’ont jamais vraiment fait appel à cette technique et qui la perçoivent comme un procédé qui produit des textes « crades ».
  • Il y a ceux qui ont utilisé cette technique dans le passé mais qui s’en sont détournés au profit de la rédaction classique, qui est souvent plus qualitative tant qu’on ne sous-traite pas dans des pays d’Afrique ou à Madagascar.

Bien sûr, si vous faites faire quoi que ce soit par des personnes qui le font mal, le résultat sera décevant. Et au plus une tâche est technique, au plus elle demande de l’expertise, au plus il est difficile de trouver des personnes qualifiées. C’est la même chose dans tous les métiers et le content-spinning n’y échappe pas. Pour autant, si vous avez eu de mauvaises expériences, ce n’est pas le content-spinning qu’il faut mettre en cause dans ce cas mais la qualité du prestataire auquel vous vous êtes adressé. Ça nous arrive à tous de sortir déçu d’un restaurant mais on ne clame pas pour autant autour de soi : « n’allez pas manger dans les restaurants, c’est pas bon ! », ce serait idiot, nous sommes bien d’accord.

Le content-spinning souffre aussi de son caractère « astucieux », comme le référencement à une certaine époque. Quel référenceur n’a pas eu affaire à des clients qui pensaient que les secrets d’un bon positionnement tenaient à quelques astuces qu’il fallait connaître ? En ayant cela en tête, ils n’admettent pas tout le travail qu’il faut accomplir en réalité, que ce soit pour référencer un site ou produire un spin de très bonne qualité. Ils se fixent donc un plafond tarifaire complètement irréaliste, qui ne prend même plus en compte la notion de retour sur investissement. Ils voudraient être référencés en 1ère page de Google sur « rachat de crédit » mais sans dépenser plus de 300 € par mois par exemple, ou voudraient obtenir un spin qui demande 180 heures de travail réparties entre 3 personnes pour 300 €.

Rédaction classique et content-spinning

Le content-spinning a donc toute sa place en complément de la rédaction classique et peut même venir en appui de celle-ci. Imaginons que l’on publie des articles de très belle qualité, rédigés par des experts et destinés à convaincre les lecteurs voire à les convertir. Outre les liens qu’ils pourraient obtenir naturellement (linkbaiting), le content-spinning permet d’apporter à ces articles « premium » du jus en provenance de centaines d’autres sites, à partir d’articles sémantiquement liés, dont le taux de similarité est totalement contrôlé.
Le content-spinning est donc évidemment utilisé en particulier pour la publication d’articles sur des réseaux de sites, la déduplication de fiches produits sur des sites e-commerce qui traditionnellement, copient et collent les descriptions produit fournies par les fabricants, l’enfouissement de résultats dans le cadre de campagnes d’e-réputation et la publication de communiqués de presse (les vrais, pas les CP propres au SEO) notamment.

Pour ceux qui trouvent cet article un peu complexe, j’avais fait il y a longtemps un résumé simple de ce concept.

(je recevrai un mail quand un article est publié (no spam)

11 thoughts on “Le content spinning

  1. Stepha e

    Le deuxième âge de la machine une fois encore. (Livre de deux économistes americains du MIT).

  2. Sebas

    Savez vous combien de temps de travail est nécessaire pour produire un bon spin ? Sur un texte disons de 800 mots par exemple

  3. Sylvain Auteur de l’article

    @ Sebas
    Ceci dépend beaucoup du niveau de qualité que l'on souhaite et du nombre de textes en sortie. Voir aussi les recherches qu'il faut faire sur le sujet avant de se mettre à rédiger. On peut sans doute dire de 3 jours à plus d'une semaine selon ce que l'on souhaite.

  4. baptiste REY

    Effectivement pour un texte de sortie de 400 mots le master spin fait 800 mots.

  5. Sylvain Auteur de l’article

    @ Baptiste
    Je ne compte pas comme toi, tu as plutôt 2000 à 4000 mots dans le spin pour un texte de sortie de 400 selon les variations que tu souhaites avoir.
    Sachant qu'en plus on peut aussi spinner des phrases entières voir des paragraphes entiers.

  6. Flo - SpinWave

    Bonjour à tous,

    @ Stepha e : bien vu 🙂

    @ Sebas : l'estimation de Sylvain est parfaitement exacte.

    @ baptiste REY : vous êtes très loin du compte 🙂 Le spin contient au bas mot plusieurs centaines de millions de mots voire plusieurs dizaines/centaines de milliards. Pour vous donner un ordre d'idée, un spin de 400 mots peut peser 40 Go alors que les articles font 4 Ko en sortie, ce qui fait un rapport de 1 à 1 milliard : 400 mots dans le texte-souche et dans les articles en sortie (en moyenne), 400 milliards de mots dans le spin. Je ne parle pas de mots différents mais de mots combinés différemment ou placés à des endroits différents.

  7. Clément

    Hello Sylvain !

    Aurais-tu quelques références de bons logiciels de CS pour mac ?
    Si c'est gratuit, c'est encore mieux :).

    Merci pour cet article en tout cas.

    A bientôt

  8. Sarah Hafiz

    Je vous remercie pour cet article, je connaissais un peu les pratiques de content-spinning mais je considérais comme un procédé peu qualitatif. Et cet article prouve tout le contraire et qu'il est tout à fait possible d'allier rédaction classique et content-spinning.

  9. Florian

    Salut Sylvain,

    Je suis très surpris par les prix indiqué 25 000/50 000€.
    J'ai fait rédiger par une plateforme de rédaction (non offshore je précise bien française) 500 fiches de 160 mots pour 3000€ de mémoire donc même si on triple (480 mots) on est à 9000€ ht. Après, peut être que pour de l'article c'est bien plus cher mais plus de 2 fois le prix.

    A ce moment là, vaut mieux prendre une rédactrice en cdd.

    Après je pense en effet qu'en fonction de la destination du texte final,le content spinning peut être une excellente alternative.

    Florian

  10. Florence

    Bonjour Florian,

    Je réponds à la place de Sylvain car j'ai les preuves que ces chiffres sont parfaitement exacts. Voici la proposition de TextMaster pour 2500 articles de 300 mots : http://i.imgur.com/1E9AYpp.jpg : 225.000 €, ce qui fait donc 54.000 € si on la ramène à 600 articles.

    Florence.

  11. Florence

    S'ils vous ont vendu 500 fiches de 160 mots à 3.000 € au lieu de 30.000 € c'est qu'ils les ont sans doute produites via un spin ou via du traitement automatique de langage, à partir de données. On a souvent des commandes de ce type pour des sites e-commerce. Vous êtes probablement l'un de nos clients indirects sans le savoir 😉

Partagez sur :

Les commentaires sont fermés.