5 concepts SEO qui peuvent être mal interprétés
Lorsqu'on s'intéresse au référencement on découvre tout un panel de nouveaux termes pour décrire des algorithmes ou des concepts spécifique SEO. Or, il y a parfois des mots que les débutants pensent maîtriser mais qui sont en réalité peuvent prêter à confusion. Cet article en présente quelqu'un et le but sera ici de réduire les malentendu.
Duplicate content
Lorsqu'on parle de duplicate content, en français "contenu dupliqué", ce n'est pas trop dur de comprendre qu'il s'agit du concept qui stipule que du contenu est dupliqué à plusieurs endroits sur le web. Mais en réalité il faut avoir plus de détail pour vraiment préciser savoir de quel type de duplicate content l'ont à faire :
- 100% identique, design compris
- Presque identique, à là seule différence qu'il y a une minime différence sur la page, par exemple une date générée automatiquement dans le header
- Contenu textuel identique, mais le design, le header, la sidebar et le footer sont différent. C'est le cas par exemple d'un article qui est copié d'un site à un autre
Comprendre qu'il y a plusieurs sortes de duplicate content permet de mieux comprendre les procédures mis en place par Google pour lutter contre le contenu dupliqué.
TrustRank
Le TrustRank, ça vous dit quelque chose ? D'accord, mais de quel TrustRank pensez-vous que l'ont parle, celui de Google ou celui de Yahoo ?
Le TrustRank de Yahoo! est issue d'une publication scientifique de mars 2004, publié par 3 chercheurs incluant un chercheur de Yahoo. L'idée émise dans la publication évoque une méthodologie pour savoir si un site est probablement du spam ou non. Le concept est simple, il suffit de prendre une liste de 200 sites de confiances et de forte autorité puis d'explorer les liens entre ces sites. Les sites de confiances font en général des liens vers des sites de confiance mais rarement vers des sites de spam. En suivant les liens on peut donc estimer si les sites à recommander ou non.

Fonctionnement du TrustRank de Yahoo !
Le TrustRank de Google quant à lui n'a rien à voir. Dans un petit interview de 2007 Matt Cutts explique que Google travaillait sur un filtre antiphishing permettant de reconnaître le taux de confiance envers un site et qu'il a fallu donner un nom à cet algorithme, c'est tout naturellement qu'ils ont choisi le terme de "TrustRank" tant bien même cela n'a rien à voir avec le TrustRank de chez Yahoo!.
Pénalité Google
Autre erreur courante, celle qui consiste à confondre les types de pénalités. Pour résumer les différents types de pénalités :
- Blacklist : la pire des pénalités, celle qui exclu une page ou un site de l'index Google
- Déclassement : la perte de position est une pénalité qui est parfois attribué et déclassent un site très loin dans les SERP (Search Engine Result Pages)
- Baisse de PageRank : un site peut voir son PageRank mis à zéro lorsque celui-ci est suspecté de ventes de liens
- Sandbox : les jeunes sites web qui reçoivent trop de popularités peuvent voir leur positionnement baissé dans les SERP. Cette pénalité est parfois considéré comme un filtre automatique attribué aux jeunes sites
Autre aspect à différencier, les pénalités automatiques qui sont le résultat d'un algorithme qui fonctionne sans intervention humaine, aux pénalités manuelles qui sont attribuées par des quality raters (cf. les employés de Google qui veille aux grains).
PageRank
La notion de PageRank est l'un des premiers algorithmes qui est expliqués aux jeunes référenceurs, mais lorsqu'on débutent on confond 2 termes :
- PageRank réel : chiffre à virgule allant de 0 à 10, qui est mis à jours pratiquement instantanément
- PageRank toolbar : valeur correspondant au PageRank réel arrondi pour être affiché dans la Google toolbar. L'export du PageRank réel pour la toolbar est effectué assez rarement (environ 3 fois par an)
Mise à jour Google
Les dernières mises à jour de Google ont été assez popularisées. Entre Google Panda, Google Penguin ou même Hummingbird, il y en a pour tous les goûts. A tort on pourrait penser que ces mises à jour sont des évolutions de l'algorithme, alors qu'il s'agit parfois de filtres qui sont activés ponctuellement. Quelques exemples typiques :
- Google Panda : mise à jour permanente
- Google Penguin : filtre ponctuel
- Google Hummingbird : mise à jour permanente du moteur de recherche pour comprendre le sens d'une requête
- Algorithme anti-bombing : algorithme ponctuel qui est lancé lorsqu'un bombing est connu
Quoi d'autres ?
Et vous, connaissez-vous des concepts qui sont mal interprétés ou mal compris ?