5 concepts SEO qui peuvent être mal interprétés

Publié le 25/05/2014 à 20h21

Lorsqu'on s'intéresse au référencement on découvre tout un panel de nouveaux termes pour décrire des algorithmes ou des concepts spécifique SEO. Or, il y a parfois des mots que les débutants pensent maîtriser mais qui sont en réalité peuvent prêter à confusion. Cet article en présente quelqu'un et le but sera ici de réduire les malentendu.

Duplicate content

Lorsqu'on parle de duplicate content, en français "contenu dupliqué", ce n'est pas trop dur de comprendre qu'il s'agit du concept qui stipule que du contenu est dupliqué à plusieurs endroits sur le web. Mais en réalité il faut avoir plus de détail pour vraiment préciser savoir de quel type de duplicate content l'ont à faire :

  • 100% identique, design compris
  • Presque identique, à là seule différence qu'il y a une minime différence sur la page, par exemple une date générée automatiquement dans le header
  • Contenu textuel identique, mais le design, le header, la sidebar et le footer sont différent. C'est le cas par exemple d'un article qui est copié d'un site à un autre

Comprendre qu'il y a plusieurs sortes de duplicate content permet de mieux comprendre les procédures mis en place par Google pour lutter contre le contenu dupliqué.

TrustRank

Le TrustRank, ça vous dit quelque chose ? D'accord, mais de quel TrustRank pensez-vous que l'ont parle, celui de Google ou celui de Yahoo ?

Le TrustRank de Yahoo! est issue d'une publication scientifique de mars 2004, publié par 3 chercheurs incluant un chercheur de Yahoo. L'idée émise dans la publication évoque une méthodologie pour savoir si un site est probablement du spam ou non. Le concept est simple, il suffit de prendre une liste de 200 sites de confiances et de forte autorité  puis d'explorer les liens entre ces sites. Les sites de confiances font en général des liens vers des sites de confiance mais rarement vers des sites de spam. En suivant les liens on peut donc estimer si les sites à recommander ou non.

Fonctionnement du TrustRank de Yahoo !

Fonctionnement du TrustRank de Yahoo !

Le TrustRank de Google quant à lui n'a rien à voir. Dans un petit interview de 2007 Matt Cutts explique que Google travaillait sur un filtre antiphishing permettant de reconnaître le taux de confiance envers un site et qu'il a fallu donner un nom à cet algorithme, c'est tout naturellement qu'ils ont choisi le terme de "TrustRank" tant bien même cela n'a rien à voir avec le TrustRank de chez Yahoo!.

Pénalité Google

Autre erreur courante, celle qui consiste à confondre les types de pénalités. Pour résumer les différents types de pénalités :

  • Blacklist : la pire des pénalités, celle qui exclu une page ou un site de l'index Google
  • Déclassement : la perte de position est une pénalité qui est parfois attribué et déclassent un site très loin dans les SERP (Search Engine Result Pages)
  • Baisse de PageRank : un site peut voir son PageRank mis à zéro lorsque celui-ci est suspecté de ventes de liens
  • Sandbox : les jeunes sites web qui reçoivent trop de popularités peuvent voir leur positionnement baissé dans les SERP. Cette pénalité est parfois considéré comme un filtre automatique attribué aux jeunes sites

Autre aspect à différencier, les pénalités automatiques qui sont le résultat d'un algorithme qui fonctionne sans intervention humaine, aux pénalités manuelles qui sont attribuées par des quality raters (cf. les employés de Google qui veille aux grains).

PageRank

La notion de PageRank est l'un des premiers algorithmes qui est expliqués aux jeunes référenceurs, mais lorsqu'on débutent on confond 2 termes :

  • PageRank réel : chiffre à virgule allant de 0 à 10, qui est mis à jours pratiquement instantanément
  • PageRank toolbar : valeur correspondant au PageRank réel arrondi pour être affiché dans la Google toolbar. L'export du PageRank réel pour la toolbar est effectué assez rarement (environ 3 fois par an)

Mise à jour Google

Les dernières mises à jour de Google ont été assez popularisées. Entre Google Panda, Google Penguin ou même Hummingbird, il y en a pour tous les goûts. A tort on pourrait penser que ces mises à jour sont des évolutions de l'algorithme, alors qu'il s'agit parfois de filtres qui sont activés ponctuellement. Quelques exemples typiques :

  • Google Panda : mise à jour permanente
  • Google Penguin : filtre ponctuel
  • Google Hummingbird : mise à jour permanente du moteur de recherche pour comprendre le sens d'une requête
  • Algorithme anti-bombing : algorithme ponctuel qui est lancé lorsqu'un bombing est connu

Quoi d'autres ?

Et vous, connaissez-vous des concepts qui sont mal interprétés ou mal compris ?

Auteur: Tony Archambeau

Développeur web passionné par le référencement et l'ergonomie d'utilisation des sites et applications web, j'édite plusieurs sites web dont infowebmaster.fr.

Commentaires »


Charlotte
Le 2 juin 2014

Mis à part le duplicate content, je n’avais pas une idée précise des autres concepts.


Spider
Le 7 juin 2014

Une petite piqure de rappel nécessaire sur les termes employés dans le domaine du SEO. La notion de trustrank est certainement l’une des plus importante car elle amène un paramètre supplémentaire et essentiel au bon vieux pagerank ;)


jecreemavitrine
Le 25 juin 2014

Bonjour, ah tiens je ne savais pas que google Penguin était un filtre ponctuel, je dormirai un peu moins inculte ce soir :)


top web
Le 25 juin 2014

je pense que l’erreur la plus répondu est celle qui consiste à confondre les types de pénalités.
le plus choquant c’est que beaucoup de professionnel du web n’arrive as à faire la différences entre ces différentes pénalité.
il faut dire que Google est sans doute responsable puisqu’il ne communique que rarement, à travers des tweets tel que Matt Cutts en fait souvent, ces tweet qui sont en anglais laisse souvent plus d’un perplexe.

Leave a comment