→ Consultez cet article, revenez vers le blog SEO pour plus d'infos sur l'actualité, retournez au menu des textes sur les techniques de référencement. Regardez aussi notre rubrique sur les outils d'optimisation. Et pourquoi ne pas soumettre vos sites dans notre annuaire ?
Le Page Rank est un outil permettant de mesurer la popularité d'une page, en évaluant l'intensité du flux de liens qui circule à travers cette page. Le web étant une toile d'araignée, chaque page est sensée recevoir du Page Rank (sinon c'est une page orpheline) et distribuer du Page Rank (sinon c'est une page « cul de sac »). Quel est le problème posé par les pages « cul de sac » ?
Pour commencer je ne résiste pas à la tentation de citer le texte original sur le Page Rank, écrit par les fondateurs de Google eux-mêmes (Sergey Brin et Larry Page). L'extrait porte justement sur les pages « cul de sac » (en anglais, dangling pages).
« Dangling links are simply links that point to any page with no outgoing links. They affect the model because it is not clear where their weight should be distributed, and there are a large number of them. Often these dangling links are simply pages that we have not downloaded yet. Because dangling links do not affect the ranking of any other page directly, we simply remove them from the system until all the PageRanks are calculated. After all the PageRanks are calculated they can be added back in without affecting things significantly. »
Un lien « cul de sac » est un lien qui pointe vers des pages qui ne possèdent pas de liens sortants. Ce type de lien affecte le modèle du Page Rank, expliquaient les deux universitaires à l'époque, car on ne sait pas trop comment le poids de ces liens doit être distribué. Certains liens paraissent en « cul de sac » parce qu'ils conduisent vers une page elle-même inconnue de Google : ils y sont donc piégés, jusqu'à ce que la page soit connue et son Page Rank calculé.
Tant que la page (et donc son PR) reste inconnue, les liens qui vont vers elle sont retirés du système, nous disent-ils. Puisqu'ils n'ont nulle part vers où transmettre de la popularité, Google les sort momentanément de son calcul. Assez rapidement, Google va explorer la page cible, l'indexer et suivre les liens sortants. Les liens rentrants, momentanément désactivés, sont alors réintégrés dans le calcul du PR puisqu'il y a bien une échappatoire.
Et s'il n'y a pas d'échappatoire (pas de liens sortants) ? Si les liens rentrants n'ont pas de cible à qui transmettent la popularité qu'ils véhiculent ? En clair s'ils débouchent dans un cul-de-sac ? Eh bien vous aurez donc des pages qui reçoivent du jus de lien mais n'en redistribuent pas, vous aurez des pages « cul de sac ».
Que se passe-t-il au niveau de Google ? Les robots d'indexation vont passer sur votre page des dizaines de fois, peut-être des centaines de fois dans leur travail itératif et cyclique de calcul du PR. Mais ils ne vont pas réussir à en sortir ! Laissons de côté le cas extrême des pages totalement « cul de sac » : en réalité les pages web redistribuent presque toujours du PR vers d'autres pages internes du même site. Par exemple à travers le menu.
Le jus de lien va donc ressortir de la page semi - « cul de sac » pour aller vers une autre page interne... Puis au travers des cycles successifs de calcul du PR, il va aller de loin en loin vers d'autres pages internes... Jusqu'au moment où il va tourner en rond, sans échappatoire possible. On touche ici à un problème sérieux : de la page « cul de sac », on passe au site « cul de sac ».
Mais pourquoi s'arrêter là ? Les calculs itératifs du PR qui tournaient en rond sur un site trouve une échappatoire vers un autre site. Ouf ? Non. Car le second renvoie aussi vers le premier. Ainsi que vers un troisième, qui redistribue sur les deux premiers sites. Etc... De la page « cul de sac » et après le site « cul de sac », nous atteignons un niveau plus élevé : la nébuleuse de sites. Et là, cela devient le problème de milliers de webmasters, qui ont peur de faire des liens externes, et qui se retrouvent à piéger le PR.
Bizaremment, un beau jour c'est toute la nébuleuse qui vascille. "Mais comment Google sait-il que tous ces sites interliés m'appartiennent ?". Google n'a pas besoin d'aller lire le Whois de vos sites pour s'en rendre compte. C'est le calcul et re-calcul permanent du PR qui le lui dit. Que fait Google quand il se trouve devant une nébuleuse de sites bien identifiée ? Il est très probable qu'il diminue l'intensité du flux de PR transmis entre ces sites.
En clair, les sites de votre nébuleuse ne transmettent plus autant de jus de lien qu'avant. De la même façon que vos sites s'auto-portaient les uns les autres dans la course à la popularité, ils sont maintenant tous ensemble entraîné vers le bas. Le sang qui coule dans les veine de Google est VERT : non, je ne parle pas du dollar (quoique...), je parle du PageRank. Si vous piégez du Page Rank, Google mettra plusieurs mois à s'en rendre compte mais finira par baisser la popularité de vos sites.
Que faire ? Je ne vois que deux possibilités.
1/ Jouer le jeu ? C'est une possibilité. Dans ce cas, il faut faire des échanges de liens pour que le jus de lien qui tourne en rond sur vos pages trouve une échappatoire. Il s'agit simplement "d'élargir le cercle" (comme les enfants dans une cour d'école) des sites qui échangent du PR. Rappelez-vous : le web est une toile d'araignée.
2/ Ne PAS jouer le jeu. C'est une autre possibilité. Vous aviez 5 sites étroitement entreliés les uns les autres ? Achetez 10 domaines supplémentaires. Vous en aviez 10 ? Achetez-en 50. Etc... Autre possibilité très utilisée : créer des sous-domaines, que Google considère a-priori comme "des sites différents". Avec 15 domaines, vous pouvez facilement créer une centaine de sous-domaines.
Combien de temps la partie de cache-cache avec Google peut-elle durer ? A priori, très longtemps. Mais c'est une course de vitesse, car tôt ou tard les robots d'indexation peuvent découvrir la manoeuvre. Rappelez-vous (je crois que c'était en 2005) quand Matt Cutts a expliqué ce qu'il appellait les "bad neighbors" autrement dit les "mauvais voisinages". C'est exactement ça.
Il FAUT DONC DES LIENS SORTANTS sinon le web ne serait plus le web. Bien sûr si vous avez réussi à concentrer sur votre nébuleuse une forte intensité de jus de liens à redistribuer à vous-même, vous n'avez guère envie de faire entrer des "partenaires" dans la danse. A vous de voir les risques que vous prenez.
Vous souhaitez commenter cet article ? Revenez vers l'entête de l'article ici. Retrouvez d'autres articles et des commentaires réguliers sur l'actualité du référencement sur le blog SEO du Portail du Web. Pour consulter d'autres pages sur des thèmes similaires, cliquez sur techniques de référencement.
Encore un peu de lecture :
• busby seo challenge
• ręceprecz odtybetu
• chocoku
• seocontest2008
• zobibi
• racheumeuneu
• La valeur d'un lien
• Le typosquatting
• Accessibilité et ergonomie
• Avenir du référencement
• Les annuaires
• Mauvais conseils SEO
• Les backlinks
• Les pièges à Page Rank