Le Pagerank thématique : qu'est-ce que c'est ?

Pagerank

On aborde de plus en plus souvent le thème du Pagerank sémantique (ou Pagerank thématique) lorsque l'on parle de référencement.
Ce Pagerank est impacté par l'optimisation sémantique Onpage (sur le site), et influencera le netlinking (Offpage).

Cet article a pour but de vulgariser cette notion pour en comprendre les impacts sur le positionnement de pages web.

Le "vieux Pagerank"

Initialement, le Pagerank calculait "bêtement" les votes d'une page vers une autre. Les notions relatives au sujet abordé dans les pages n'avaient pas d'incidence. Si vous obteniez un lien à partir de la page d'accueil du site de la maison blanche (PR10), c'était la fête. Plus d'info sur le pagerank Old style et encore plus simple ici.

C'est probablement toujours le cas, mais dans une moindre mesure. La notion de thématique est maintenant venue se glisser dans le calcul.

La valeur thématique, c'est quoi ?

Le principe de base est de dire qu'une page peut posséder plusieurs Pagerank.
Imaginons que nous ayons une page qui parle de 3 grands sujets qui seraient (exemple): Les moteurs de recherche, le pagerank, l'hébergement.

On peut considérer que dans ce cas, la thématique de la page est décomposée en trois parties.
La valeur de Pagerank thématique que l'algo de Google attribue à chacune des thématiques sera donc de 33% *.

Si à contrario nous avons une page qui ne parle que d'un sujet (les moteurs de recherche), 100% * de la valeur sera attribuée à ce sujet.

Quel impact pour mon optimisation Onsite ?

Suite à l'explication précédente, on comprend vite que l'on a intérêt à rester concentrer sur un seul sujet par page pour ne pas diluer cette notion de thématique aux yeux de Google. En diluant, je fais perdre du poids sémantique à celle-ci. Il est donc probable qu'à toutes choses égales par ailleurs, ma page qui n'est pas suffisamment thématisée aura plus de mal à se placer que celle d'un concurrent qui s'est mieux concentré sur le sujet.

La pertinence de votre contenu sera analysée par Google en fonction du vocabulaire que vous utiliserez dans votre page.

Pour aller plus loin dans cette logique, je vous invite à lire l'article de Christian Méline sur les corpus. Le choix de certains n-grams permettra à Google de parfaitement cerner la thématique de votre page.

Exemple de répartition thématique

Évitons de diluer la thématique de nos pages pour conforter Google  ( chiffres *)

Impact du Pagerank thématique dans mon linking entrant.

Il est assez facile de "faire le lien" et de se dire que, si Google arrive à classer les pages en fonction de leur thématique il prendra en compte ce point pour donner du poids aux liens entre deux pages.

Pour être concret, à toutes choses égales par ailleurs, si j'obtiens un lien d'une page qui parle exclusivement de Pagerank, vers ma page qui parle de Pagerank, je bénéficierai d'un meilleur apport que si mon lien vient d'une page qui aborde aussi d'autres sujets.

Transmission du Pagerank sémantique

Une meilleure transmission du Pagerank sémantique  (chiffres*)

On peut aussi facilement en déduire qu'un site qui aborde 36 thématiques (CP, annuaire) sera lui-même moins bien classé sur une thématique précise et apportera moins de jus sémantique qu'un site spécialisé sur un sujet.

Pertinence thématique et liens sortants

Dans la même veine, il est aisé de penser que les liens sortants de ma page peuvent influencer l'idée que Google s'en fait en terme de thématique. Si dans ma page, je fais des liens externes vers des pages qui approfondissent mon sujet et contiennent un corpus de mots similaire à la mienne, il y a de fortes chances que Google "valide" encore plus la thématique de ma page.

Rappelez-vous, il y a  un an, je vous disais d'ailleurs de ne pas être égoïste avec vos liens sortants.

Et les ancres de liens ?

Pourquoi croyez-vous que Google fasse une chasse aussi âpre aux ancres de liens optimisées ? Parce que le texte des liens apporte une forte valeur sémantique.
Alors dans un monde merveilleux pour les SEO, dans lequel aucune sanction ne serait appliquée, optimiser les liens entrants en plus de la page qui émet le lien serait idéal.

Mais par les temps qui courent, je préconiserai bien plus d'obtenir des liens à partir de pages traitant exactement du sujet de votre page, plutôt que d'exagérer en optimisant le lien. Vous récupérerez de toute façon du jus sémantique, mais en prenant moins de risque.

À noter :

Ce concept ne date pas d'hier, il y a plus de 10 ans déjà, Taher Haveliwala aujourd'hui chez Google publiait sur ce point précis : version difficileversion plus facile.

Un document de 2006 de Michel Chilowicz aborde déjà la notion de Pagerank Thématique chez Google.

De nombreuses entreprises s'intéressent de près à ce sujet de la sémantique comme en atteste ce brevet sur le classement sémantique de contenu dans un site web publié en 2013 par HP. Et un autre publié en 2014 par Microsoft relatif au classement sémantique au moyen d'un indice de transfert.

Pour ceux qui voudraient approfondir ce sujet, je conseille fortement la MasterClass des Frères Peyronnet.

Vous comprendrez sans doute mieux à la lecture de cet article que le Pagerank (TBPR) n'est qu'une sorte de somme de plusieurs Pagerank thématiques pour une page et qu'il est à prendre avec des pincettes.

Est-ce plus clair pour vous maintenant ?

* Tous les pourcentages indiqués ne servent qu'à faciliter la compréhension et illustrer un principe. D'une part, une page ne transfert jamais tout son pagerank et d'autre part, les méthodes de calcul de Google sur cet aspect sont (j'imagine) plus complexes.

 

(je recevrai un mail quand un article est publié (no spam)

23 thoughts on “Le Pagerank thématique : qu'est-ce que c'est ?

  1. Keeg - econcept

    L'idée c'est surtout de signifier la puissance du positionnement en actionnant les leviers du thématisé. J'ai vu beaucoup de sites ranker sur des requêtes longue traîne avec un ou deux liens, ultra thématisé sur des supports de bonne qualité. Ce n'est pas nouveau mais l'impact me semble être plus fort depuis 2 ans.

    Concernant les liens thématisés, il reste encore de mon coté une donnée à lever : une page thématisée t'offre un positionnement supérieur sur la thématique en question. Pour autant, est-ce que cela change véritablement la puissance potentielle globale qu'on peut embarquer en disposant de liens thématisés ailleurs ? La logique voudrait que oui (le fameux PR thématique), mais je n'ai ni testé ni vu de test là dessus.

  2. Sylvain Auteur de l’article

    @ Keeg
    J'ai beau relire, je sèche sur la compréhension de ta question.
    Pourrais tu la poser autrement ?

  3. Christian Méline

    Salut Sylvain,
    Merci pour la citation, je vois que tu as pris des notes pendant le SMX 😉
    @Keeg
    Le fait de thématiser te permet d’avoir des pages, des rubriques, des sites qui montent mieux sur gg LORSQUE l’internaute s’intéresse précisément à ce que tu proposes. Dans ce cas, bien fait, tu es devant les autres, et tu peux espérer garder l’internaute sur ton site et convertir.
    Ce n’est pas forcément un + dans le cas d’un ranking général où ta seule satisfaction est de te voir en tête des SERP.
    Là, l’idée est d’être en tête des conversions 😉

  4. Emile

    @Christian... j'entend ce que tu réponds à Keeg... mais dis moi, pour que l'internaute puisse d'abord venir sur mon site, et ensuite y rester... pour ensuite que je le convertisse... ne faut-il pas qu'au préalable je sois DEVANT mon concurrent dans les SERPS ? Attendu que celui qui est 2éme génère plus de traf et donc a plus d'espérance de conversion que celui qui est 3éme... sauf si j'ai mal compris ton explication.

    Pour en revenir à l'article ... c'est très clair mais selon toi Sylvain, comment Google va thématiser ma page qui est dans un site qui parle globalement de "musique" (pour l'exemple)... et dans ma page on y trouve d'avantage d'occurrences de "audio" et de "sonorisation" ... que de "musique".

    Les Peyronnets ont abordé ce sujet dans leur formation... mais j'ai du être dans la lune... sans doute ^^

  5. Sylvain Auteur de l’article

    @ Emile
    Il faut raisonner page par page.
    GG va thématiser ta page avec "audio" et "sonorisation", mais une autre page de ton site peut être thématisée différemment. En général, la page d'accueil a une thématique plus large que les pages de détails.

    C'est aussi pour cela que l'on conseille depuis des lustres de mettre les thématiques dans des silos étanches pour conserver une thématique spécifique dans un silo, même si dans l'ensemble le site peu avoir plusieurs thématiques.

  6. Laurent Bourrelly

    Je suis surpris que cet article ne mentionne par le Topical Trust Flow de Majestic.
    Pour ceux qui ne connaissent pas, je l'introduis dans ce billet http://www.laurentbourrelly.com/blog/1590.php
    C'est le meilleur moyen d'avoir une vision claire des thématiques liées à votre profil de liens.

  7. Christian MELINE

    @emile
    Les serp sont différentes quand le thème de ta recherche est repéré par GG

  8. SylvainP

    @keeg : la réponse est "oui"

    @Emile : Une thématique pour Google c'est un cluster de pages qui sont en similarité (salton + co-occurences des mots), cela correspond sans doute assez largement à ce que l'on appelle aussi une thématique. En mettant "audio" et "sonorisation", tu augmente ta probabilité (ou ton score) sur une thématique de type "musique". Mais si le moteur a découpé "musique" en sous-thématiques, alors tu vas sans doute être plus proches d'une sous thématique sur les "instruments" de sonorisation que sur le classique par Mozart 😉

  9. Emile

    Merci @SylvainP pour la précision... oui le tout étant de savoir comment GG redécoupe les thématiques. Le topical Trust est un indicateur intéressant mais ce n'est pas GG.

    Ok @Christian pour ta réponse... merci bien.

  10. Ben

    Très intéressant et actuel, bien que sur le site d'Abondance j'ai pu lire depuis très longtemps qu'il valait mieux avoir 1 page sur les pommes de terre, une page sur les carottes et une page sur les tomates qu'une page mixant les trois sur la thématique "soupe". C'est là qu'on retrouve les silos et cocons sémantiques, et tous les mots en "ique" (comme thématique, domotique, immotique...cherchez l'intrus). L'intervention de Sylvain P rappelle l'importance de bien défricher les thésaurus : plus on creuse dans la catégorisation, plus on est pertinent, et donc plus on a de chance de bien se positionner non ?

  11. Keeg - econcept

    @Sylvain : Pour essayer de réexpliciter, l'idée est de savoir si un lien thématisé influence de manière supérieure à la fois ton positionnement mais aussi ton potentiel de positionnement comparé à du lien non thématisé. Exemple, admettant que chaque support soit de force identique :
    10 liens dont 10 thématisés VS 10 liens dont 9 thématisés

    @SylvainP : Ok merci

  12. Sylvain Auteur de l’article

    @ Laurent
    Bien vu !

    @ Ben
    Pourquoi dis-tu "bien que".
    C'est exactement cela, il vaut mieux traiter un sujet par page.
    L'évolution de l'algo de Google vient surtout du fait qu'aujourd'hui, cela influence aussi fortement le linking.
    Pour ta question, je dirais un grand OUI.

    @ Keeg
    Argh, j'ai encore un doute quand tu parles de lien "thématisé".
    Si comme moi tu nommes "lien thématisé" un lien qui comporte une expression-clé sur laquelle on souhaite se positionner, alors pas de doute, l'ancre du lien joue un rôle très fort. Le truc consiste seulement à varier et à ne pas exagérer pour ne pas se faire prendre.
    Si tu parles de la thématique de la page qui fait le lien, je pense que cela compte aussi de plus en plus. Même si ton lien est "cliquez ici". C'est justement le principe du transfert de Pagerank thématique.

  13. Nicolas Breya

    Le PageRank thématique est effectivement loin de dater d'hier. D'ailleurs, c'est logique : pourquoi donnerait-on autant de poids à un lien depuis une page ayant la même thématique qu'à un lien similaire sur un page parlant d'un tout autre sujet.

    C'est un peu comme dans la vraie vie d'ailleurs : on va toujours accordé plus de crédit à quelqu'un qui nous parlera d'un site, d'une entreprise ou encore d'un lieu quand cette personne est spécialiste du domaine dont elle parle.

  14. Christophe

    Super sujet qu'est le PageRank thématique 😉 n'est-ce pas Christian 😉
    Je précise une chose, c'est que pour avoir fait la Master Class des frères Peyronnet, ça m'a ouvert grandement les yeux au niveau du PageRank et franchement je remercie du fond du coeur Sylvain et Guillaume !!! D'une part parce que la formation était limpide comme de l'eau de roche et avec des professionnels à votre écoute. En plus pour le prix, c'est juste une rigolade vu la qualité de la presta 😉
    Passons un peu au sujet 🙂
    Pour ma part lorsque je traite un sujet j'essaye de le traiter en entier et ne pas me diversifier dans un autre domaine. Puisqu'on m'a appris en SEO, un seul H1 par page, donc une seul sujet ! (bête et discipliné)
    En fait la thématique, on en fait tout un plat, mais c'est ce que l'on fait depuis tout le temps sauf pour les backlinks. On ne va pas écrire un billet ayant pour titre des chaussures alors qu'on parlera de vêtements ...
    Ensuite, pour avoir le cosinus de Salton en fonction du texte écrit et surtout en espionnant les autres sites qui ne doivent pas avoir de liens pour avoir le vrai degré sans que les backlinks fausses la donne et bien bon courage ! Parce que tous les sites ont des backlinks (surtout ceux en première page) !
    Dans les corpus sémantiques il y a toujours une part de mots qui seront obligatoirement cités puisque l'on traite du même sujet.
    Donc ma façon d'écrire sur un sujet que je ne connais pas, c' est de regarder les autres sites, de noter les idées principales et ensuite de faire une intro, développement et conclusion comme à l'école !
    On sera forcément dans le corpus puisqu'on aura émis les principales idées avec un joli texte, ensuite on ira mettre des liens par contre là qui devront être strictement en rapport avec le sujet et c'est ce que je fait obligatoirement.
    Perso lorsque j'écris un sujet je m'embête pas à regarder le cosinus de Salton en ayant lemmatisé le texte .. Vous vous imaginez si on devait pour chaque texte faire cela ....!
    A savoir que les liens ont encore de beaux jours devant eux et parfois on s'embête à faire des choses qui ne rapportent pas ce quelle devrait rapporter !

  15. François

    Je trouve le concept intéressant, mais je me demande si parler de "PageRank thématique" est la meilleure façon de conceptualiser.

    Pour moi, le PageRank reste un indicateur parmi d'autres, un calcul assez basique de popularité donné par Google. La pertinence thématique {du paragraphe|de la page|de la catégorie|du site} fait considérablement varier le poids du backlink, mais je pense qu'il ne faille pas mélanger ces deux concepts.

  16. Sylvain Auteur de l’article

    @ Nicolas
    On est d'accord – CQFD

    @ Christophe
    Christian Méline te dirait qu'au feeling on s'écarte facilement, on glisse (glissement sémantique), et Sylvain Peyronnet te dirait que tu risque de changer de cluster.
    Mais bon, avec un sujet en profondeur par page, tu évites déjà pas mal de soucis.

    @ Sonia

    Suis le lien indiqué en fin d'article sur le Pagerank (TBPR) et tu y trouveras ta réponse 🙂

    @ François
    En anglais, la définition est "Topic sensitive Pagerank" soit "Pagerank sensible au sujet".
    On le traduit en "Pagerank thématique" en français.

    Sinon, je pense que tu pars dans une mauvaise direction en scindant les deux notions.
    De nos jours, le Pagerank ne fonctionne plus comme au début de Google. La notion de thématique a pris le dessus. Ce ne sont pas deux concepts différents, c'est simplement une évolution du concept initial du Pagerank qu'applique Google aujourd'hui. Ce n'est pas pour rien que GG a embauché Taher Haveliwala entre 2003 et 2008 pour travailler sur l'algo.

    Après, quand tu parles de ce que Google nous "donne", et notamment le Pagerank de la toolbar, je dois avouer que je ne vois pas trop ce qu'il indique. Comme tu le dis, c'est la pertinence thématique qui fait considérablement varier le poids du backlinks. Et quand on parle de backlinks, on parle forcément de transfert de Pagerank.

    Au passage, je l'ai oublié dans les liens de l'article, mais je conseille aussi la lecture de ceci : entre autre à partir de la slide 34.

    Bref, les backlinks ont encore de beau jours devant eux, comme l'avoue Matt Cutts ici :

    Et la thématique des pages qui nous font des liens a pris aujourd'hui une importance capitale.

  17. Olivier

    Merci pour cet article qui surfe sur la mode des articles actuels, alors que comme tu l'avoues à la fin, la notion est ultra vieille : amusant 😉

    Je note que tu utilises l'expression "PageRank sémantique" puis "PageRank thématique". Est-ce pour ranker sur les 2 expressions ou car tu ne sais pas la différence entre les 2 ?
    Je lis plus loin "En diluant, je fais perdre du poids sémantique à celle-ci." mais pourquoi "sémantique" ici et pas "thématique" ?
    Ca m'énerve un peu de lire trop d'articles où l'auteur utilise l'un ou l'autre comme s'ils étaient interchangeables. Cependant, j'avoue que je ne saurais pas très bien décrire la différence (ça m'intéresse si vous savez dans le contexte du SEO) mais ici, il faut utiliser "thématique", ça me semble évident non ?

    Autre remarque du gars pénible : le verbe impacter n'est pas transitif. On n'impacte pas quelque chose, mais quelque chose est impacté par XYZ. Cet anglicisme est une erreur de plus en plus courante : http://www.academie-francaise.fr/impacter

    Tu écris :
    "On peut aussi facilement en déduire qu'un site qui aborde 36 thématiques (CP, annuaire) sera lui-même moins bien classé sur une thématique précise et apportera moins de jus sémantique qu'un site spécialisé sur un sujet."
    bien que je sois d'accord sur le fait qu'un site de CP multithématiques est souvent foireux, ton explication est étrange car tu passes d'un coup de la notion de thématique de page à celle de site. Le lien issu d'un article publié sur un site de CP apportera du PR thématique en fonction des thématiques de la page et non du site.

    PS : l'article a "tellement" de fautes d'orthographe (inattention je suppose) que j'ai cru que l'article n'était pas de toi Sylvain 😉

  18. Sylvain Auteur de l’article

    Bonjour Olivier

    Et bien, tu ne passes pas souvent ici, mais quand tu le fais tu y vas franchement 🙂
    Merci pour ce long commentaire, j'essaie d'y répondre point par point.

    Concernant la « mode » de ce sujet, si tu regardes sur Google tu verras qu'il n'y a pas tellement d'articles qui en parlent. Les bons articles de Sylvain P ou Christian M étant parfois un peu ardus, je voulais vulgariser comme je le fais habituellement ici afin de rendre cette notion plus accessible.
    Si j'en crois les retours sur les réseaux sociaux, il faut croire que cela a permis à plus d'un de lui clarifier les choses.

    Mais comme « tu » ou « je » le dis, la notion n'est pas nouvelle, tu l'as abordé sur Webrankinfo, même si tu n'utilisais pas le même terme.

    Sémantique ou thématique ? Tu dis toi même que tu ne fais pas la différence entre les deux, concernant la relation de ces deux mots par rapport au Pagerank, je suis comme toi.
    « Sémantique » me semble aussi bien adapté, car il se réfère à la signification des mots.
    Bref, j'ai utilisé l'un ou l'autre indifféremment dans cet article.
    Là encore, Sylvain, Christian, Laurent B, utilisent l'un ou l'autre sans que je fasse clairement la différence.
    Je peux toutefois te rejoindre quand tu préfères favoriser « thématique », car je ne sais pas où en est Google concernant le sens des mots.
    Mais bref, est-ce que cela change la compréhension de l'article ?

    Merci pour la règle pour « impacter », je vais corriger

    Concernant le passage de la thématique de page à celle d'un site.
    Je suis intimement persuadé qu'un site qui est concentré sur une thématique (par exemple l'automobile, ou le SEO comme ce blog) est « marqué » globalement par Google sur le sujet.
    En ce sens, chacune de ses pages recevra un « jus » thématique plus marqué (par le maillage interne, les liens des menus, etc.)
    Je crois donc largement préférable d'obtenir un lien à partir d'un site dont la thématique générale colle à la mienne (en plus du fait que la page qui me fait le lien traite de mon sujet spécifique...)
    Ceci va aussi dans le sens de l'authorank. Un auteur est (à priori, contredis moi si tu penses le contraire) jugé comme « expert » sur une thématique. Si demain je publie une recette de cuisine, je serais moins bien noté par Google sur ce thème qu'avec un article sur le SEO.
    Ensuite, les autres paramètres entrent forcément en ligne de compte. Un lien d'une page du site de TF1 me conviendra très bien si la page traite de mon sujet 🙂

    Pour les fautes, à part la mauvaise utilisation de « impacter », je veux bien que tu me corriges, tu en vois d'autres ?

    Et pour finir, si tu souhaites plutôt apporter des compléments d'information sur le sujet pour partager ton savoir, n'hésites pas à commenter à nouveau.

  19. Keeg

    @Sylvain : Je parlais bien entendu de la thématique du site et / ou page (tiens, encore un truc à tester) et non d'une ancre optimisée.

  20. Le Juge

    Tres interessant comme article - on reste dans un concept (ou une thematique 😉 ) effectivement relativement vieille - puisque moi meme j'en parle (en partie et moins bien) dans cet article http://lemusclereferencement.com/2010/10/06/le-concept-de-conformite-semantique/ mais qui non seulement est toujours valide mais prend, comme le dit @keeg, de l'importance crescendo depuis les 2/ 3 dernières années. Décidément il faut peut être que je choppe le temps de me faire une petite masterClass avec les Peyronnet Brothers...

  21. Emile

    C'et vrai qu'un genre de "mise en accord" avec les termes qu'utilisent les uns et les autres permettrai d'y voir plus clair... même si on y voit mieux.
    Cluster, cocon... ca se comprends...
    LaurentB parle également de "granularité" ... là aussi faut se pencher.

    Dans mon esprit, "thématique"... ca parle d'un thème. Et "sémantique", c'est le champ lexical utilisé et qui es propre au thème... Google de ce que j'ai pu voir encore ne sais pas lire de toute façon... Enfin, on verra le prochaine panda

  22. Ledzep_56

    Article on ne peut plus clair, dans la lignée de ceux de Christian qui est très attaché à cette histoire de thématique du PR, et que je trouve (aussi) particulière intéressant et pédagogique.

    Pour revenir à celui-ci, je l'avais lu dès sa publication, là je reviens sur l'article et en fait les commentaires sont tout autant intéressants que l'article.

Partagez sur :

Les commentaires sont fermés.