On fait souvent des rencontres intéressantes dans le milieu du SEO, en discutant avec des professionnels qui sont particulièrement pointus dans un domaine par exemple. C’est le cas de Florence Le Vot, la directrice de RaDiance Conseil. Florence fuit les projecteurs mais certains font appel à son expertise pour des services très spécifiques comme la mise en place de réseaux de sites, le déploiement d’opérations mixant presse/influenceurs/SEO, la génération de contenu par traitement automatique du langage et le content-spinning, dont nous allons plus particulièrement parler dans cet article. Florence développe cette activité depuis 2007 via une entité spécialisée dans ce domaine : SpinWave.



A quoi sert le content-spinning ?

Imaginons : vous devez produire 600 articles de 300 à 400 mots qui seront placés sur tout un tas de sites. Bien sûr, vous ne pouvez pas envoyer le même article à 600 sites car seule une petite poignée serait indexée et la plupart des plateformes aujourd’hui contrôlent l’unicité des articles avant de les publier.

En effet, que se passe-t-il lorsque Google voit plusieurs articles trop similaires ? Eh bien il ne les indexe pas tous. Le content-spinning (ou article spinning) se positionne donc comme une alternative à la rédaction classique et s’avère sans doute la seule solution économiquement viable lorsqu’il faut publier des centaines d’articles traitant du même sujet sur une multitude de sites. Pour s’en convaincre, nous allons comparer les avantages et les inconvénients des deux solutions :

1. La rédaction classique

C’est la solution la plus qualitative si vous faites appel à de bons rédacteurs. Mais c’est aussi la plus chronophage et la plus coûteuse. Vous devrez définir les 600 sujets, former une équipe de 10 rédacteurs par exemple en leur confiant à chacun 60 articles à rédiger. Il faudra ensuite contrôler le contenu de chaque article (c’est tellement facile d’écrire des bêtises sur un sujet que l’on ne maitrise pas) et y placer vos liens manuellement, à moins que vous n’ayez rédigé des consignes précises à ce niveau et qu’un chef de projet s’en charge.

En ce qui concerne le budget, comptez entre 25.000 € et 50.000 € pour 600 articles (ces chiffres ont été obtenus après une demande de devis faite auprès des principales plateformes du marché). Par ailleurs, des tests ont montré que si l’on demande à un même rédacteur d’écrire plusieurs dizaines d’articles sur le même sujet, les taux de similarité atteignent vite des valeurs de 20% à 25%.

2. Le content-spinning

Le content-spinning est une technique rédactionnelle spécifique (détaillée dans la section suivante) dont le but consiste à produire un maximum de variations à partir d’un seul texte-source. Grâce au content-spinning, on obtient des centaines voire des milliers d’articles qui traiteront du même sujet mais avec des constructions de phrase et des mots suffisamment différents pour que les moteurs de recherche ne les classent pas comme « duplicate content ».

Les deux inconvénients du content-spinning disparaissent dès que l’on fait le choix de la qualité : un spin de très bonne qualité ne produira pas de phrases aux tournures bizarres voire incompréhensibles. Et si les métriques du spin sont élevées (taux de variation et taux de perforation), il permettra de produire suffisamment d’articles au-dessous de 25% de taux de similitude maximum.

Au rayon des avantages : vous n’aurez qu’un article à valider et les articles générés à partir du spin peuvent être triés en fonction du taux de similitude maximum que vous acceptez, par exemple 18%. En ce qui concerne le coût, il est 20 à 50 fois inférieur à celui de la rédaction classique dès que l’on doit envisager de produire quelques centaines d’articles.

Qu’est-ce que le content-spinning ?

Le content-spinning s’appuie sur l’utilisation d’accolades et de pipelines. On placera donc les variations entre une paire d’accolades en les séparant par un pipeline. Ces variations peuvent être créées à différents niveaux : paragraphes, phrases, bouts de phrases et mots.

Exemple :

{Suivi de {l’avancée|la progression} {en ce qui concerne les|concernant les|pour ce qui est des|relative aux} {implémentations|ajustements|recommandations} techniques et {recettage {avant la mise en ligne{||||| du site}|final|en fin de projet}|mise au point {avant la mise en ligne{||||| du site}|finale|en fin de projet}}|{Reporting régulier|Mise au point {régulière|assurée tout au long de la prestation|continue|ininterrompue|permanente}} en ce qui concerne {la mise en place|l'implémentation} des {recommandations|préconisations} techniques|{Mise en place|Application} des {recommandations|préconisations} techniques {avec |accompagnée d'|incluant }un{ {reporting|suivi}|e mise à jour} hebdomadaire}

On a dans cet exemple 1 seule phrase en sortie mais cette phrase est basée sur 3 constructions complètement différentes et à l’intérieur de chacune de ces 3 variantes de phrase on trouve des variantes pour des bouts de phrase et des variantes au niveau de certains mots.

Cette construction permet d’obtenir :

444 variations

Des phrases allant de 8 à 22 mots en sortie, avec une moyenne de 16,4 mots

Comment évalue-t-on un spin ?

Lorsqu’on souhaite évaluer un spin il faut prendre en compte 2 critères : la qualité des textes produits et les métriques.

La qualité des textes produits : pas de fautes basiques comme des fautes d’accord, de conjugaison, des mots collés ou plusieurs espaces d’affilée. Mais la qualité des tournures est également primordiale : on ne doit pas, à la lecture des textes, découvrir des tournures bizarres ou des phrases qui ne veulent rien dire. Un bon spin produit des articles dont la qualité ne soulève aucun questionnement. Les articles qu’il permet de générer se fondent dans la masse, sans se faire remarquer.

Parlons des métriques. Elles sont généralement inversement proportionnelles à la qualité des textes produits. En effet, par facilité, au plus on veut booster les métriques d’un spin, au plus on aura tendance à utiliser des synonymes, c’est en tout cas que font les mauvais spinneurs, par facilité. On appelle cela « le spin au clic » car le spinneur, au lieu de se creuser la tête pour trouver des variations, clique sur un mot puis clique sur les synonymes de celui-ci avant de passer au mot suivant.

Lorsqu’on travaille de cette manière on génère immanquablement des phrases composées de mots qui, hors contexte, peuvent être considérés comme synonymes les uns des autres mais qui finissent par produire des phrases aux tournures incongrues. Heureusement, il est tout à fait possible d’avoir la qualité et la performance en faisant appel à d’excellents rédacteurs, expérimentés, qui travaillent de manière très consciencieuse, au sein d’une équipe qui respecte de multiples phases de contrôle et de correction.

Sachez-le : s’il faut un bon rédacteur pour produire des articles d’une certaine qualité, il faut d’excellents rédacteurs pour produire la même qualité d’articles à partir d’un spin.

D’où vient le content-spinning ?

Le content-spinning est une technique qui vient tout droit du laboratoire de recherche et développement que constitue le référencement black-hat au sein du SEO. Le référencement white hat ne nécessite pas un gros volume d’articles dans un temps très court, le black hat si, car il faut publier des milliers d’articles sur des constructions plus ou moins complexes en pyramide, en étoile, en pétale, etc.

Lorsque les premiers référenceurs black-hat ont commencé à utiliser le content-spinning, ils ne faisaient pas dans la qualité. Il suffit de se rappeler des splogs et des bouillies de texte produites à l’époque, n’est-ce pas, Rudy 😉 . Mais à ce moment-là, Google était complètement dépassé et ça fonctionnait. Ça a fonctionné pendant des années. Aujourd’hui, et depuis quelques années déjà, ça ne fonctionne plus, Google a développé des filtres bien plus sophistiqués qui lui permettent de ne pas prendre en compte la bouillie de texte et pour aller encore plus loin dans la démarche, des milliers de personnes (les quality-raters) passent en revue des millions de sites tous les ans afin de filtrer ce que l’algorithme de Google a laissé passer. Google analyse d’ailleurs les actions de ces quality-raters afin d’améliorer son algorithme.

Comment le content-spinning s’est-il adapté aux progrès de Google ?

Dans tous les métiers, vous trouverez de bons artisans et de moins bons. Le content-spinning n’échappe pas à cette règle. Si vous conservez ce que cette technique a de meilleur dans son principe, si vous rassemblez des spécialistes des algorithmes, des mathématiciens, des statisticiens, d’excellents rédacteurs, des chercheurs en traitement automatique du langage et des développeurs, vous pouvez alors déboucher sur un niveau de service qui permet d’obtenir des résultats qui dépassent toutes les espérances. Les meilleurs prestataires en content-spinning sont aujourd’hui en mesure de produire des articles d’une qualité telle qu’ils peuvent être publiés sur des money-sites, avec des niveaux de similarité que l’on peut contrôler et filtrer.

Parlons des niveaux de similarité justement. Google a déposé par brevet une méthodologie (simhash) qu’il applique au niveau de son moteur de recherche pour évaluer le niveau de similarité entre 2 textes. C’est ce même brevet qui a permis le développement d’outils qui, à partir d’un spin, vont permettre de comparer et d’extraire les x articles les plus éloignés ou, au choix, tous les articles dont le seuil de similitude maximum est de x%. Si vous fixez par exemple un taux de similitude maximum de 15%, cela signifie concrètement qu’au sein d’un lot de plusieurs milliers d’articles, vous aurez au maximum 15% de similitude entre les 2 articles les plus similaires. Autant dire qu’à de tels niveaux, Google ne peut plus faire d’exclusion, cela reviendrait à exclure une trop grande partie du web.

Mieux encore : si on comparait les taux de similarité obtenus pour 5.000 articles triés à partir d’un spin et 5.000 articles portant sur le même sujet et produits par 50 rédacteurs (à raison de 100 articles par rédacteur), il y a fort à parier que les taux de similarité maximum seraient moins bons du côté des 50 rédacteurs. Le test n’a pas été fait sur des volumes aussi importants mais sur 500 articles rédigés par 5 rédacteurs, les résultats étaient sans appel, les taux de similitude maxi montaient à 38%.

La composante « délai » confère également un intérêt au content-spinning, puisque l’on peut obtenir plusieurs milliers d’articles en quelques semaines. Il faudrait recruter une armée de rédacteurs pour tenir de tels délais, avec des relecteurs et un chef de projet pour gérer l’ensemble.

En 2016, le content-spinning bénéficie d’un regain d’intérêt avec des outils comme YourTextGuru, SEO Quantum ou AnswerThePublic, qui permettent des produire des textes-sources de manière plus intelligente, en se basant sur une analyse approfondie des résultats de Google sur une expression ou une thématique.

D’où vient cette mauvaise image qu’a encore le content-spinning aujourd’hui ?

Les gens qui ont une mauvaise image du content-spinning en 2016 se répartissent en deux catégories :

Il y a ceux qui n’ont jamais vraiment fait appel à cette technique et qui la perçoivent comme un procédé qui produit des textes « crades ».

Il y a ceux qui ont utilisé cette technique dans le passé mais qui s’en sont détournés au profit de la rédaction classique, qui est souvent plus qualitative tant qu’on ne sous-traite pas dans des pays d’Afrique ou à Madagascar.

Bien sûr, si vous faites faire quoi que ce soit par des personnes qui le font mal, le résultat sera décevant. Et au plus une tâche est technique, au plus elle demande de l’expertise, au plus il est difficile de trouver des personnes qualifiées. C’est la même chose dans tous les métiers et le content-spinning n’y échappe pas. Pour autant, si vous avez eu de mauvaises expériences, ce n’est pas le content-spinning qu’il faut mettre en cause dans ce cas mais la qualité du prestataire auquel vous vous êtes adressé. Ça nous arrive à tous de sortir déçu d’un restaurant mais on ne clame pas pour autant autour de soi : « n’allez pas manger dans les restaurants, c’est pas bon ! », ce serait idiot, nous sommes bien d’accord.

Le content-spinning souffre aussi de son caractère « astucieux », comme le référencement à une certaine époque. Quel référenceur n’a pas eu affaire à des clients qui pensaient que les secrets d’un bon positionnement tenaient à quelques astuces qu’il fallait connaître ? En ayant cela en tête, ils n’admettent pas tout le travail qu’il faut accomplir en réalité, que ce soit pour référencer un site ou produire un spin de très bonne qualité. Ils se fixent donc un plafond tarifaire complètement irréaliste, qui ne prend même plus en compte la notion de retour sur investissement. Ils voudraient être référencés en 1ère page de Google sur « rachat de crédit » mais sans dépenser plus de 300 € par mois par exemple, ou voudraient obtenir un spin qui demande 180 heures de travail réparties entre 3 personnes pour 300 €.

Rédaction classique et content-spinning

Le content-spinning a donc toute sa place en complément de la rédaction classique et peut même venir en appui de celle-ci. Imaginons que l’on publie des articles de très belle qualité, rédigés par des experts et destinés à convaincre les lecteurs voire à les convertir. Outre les liens qu’ils pourraient obtenir naturellement (linkbaiting), le content-spinning permet d’apporter à ces articles « premium » du jus en provenance de centaines d’autres sites, à partir d’articles sémantiquement liés, dont le taux de similarité est totalement contrôlé.

Le content-spinning est donc évidemment utilisé en particulier pour la publication d’articles sur des réseaux de sites, la déduplication de fiches produits sur des sites e-commerce qui traditionnellement, copient et collent les descriptions produit fournies par les fabricants, l’enfouissement de résultats dans le cadre de campagnes d’e-réputation et la publication de communiqués de presse (les vrais, pas les CP propres au SEO) notamment.

Pour ceux qui trouvent cet article un peu complexe, j’avais fait il y a longtemps un résumé simple de ce concept.