Données Alexa de Wikio faussées

Publié le 16/12/2008 à 17h47

Saviez-vous que les données fournissent par Alexa.com pour le site Wikio sont faussées? En fait il faut regarder un peu plus en détail pour comprendre cela.
Cet article a pour but de vous montrer comment ces données ont été faussées, vous serez ainsi en mesure de comprendre pourquoi le site Wikio devrait avoir de moins bonnes statistiques.

Présentation

Alexa

Le site internet de la société Alexa Internet fournit des statistiques sur plusieurs millions de site internet à travers le monde. Par conséquent, n'importe quels sites un peu connu sont susceptibles d'avoir des données et des statistiques sur Alexa.

Parmi ces statistiques ont retrouve le "classement Alexa" de plus de 25 millions de sites internet à travers le monde.

Wikio

Logo de Wikio

Logo de Wikio

Le site internet Wikio est parfois comparé à un Digg-Like puisqu'il reprend de façon automatique les articles de nombreux blogs et que la communauté de Wikio peut voter pour ces articles. Néanmoins, ce site est un peu plus une sorte de "moteur d'actualité francophone" qui va piocher l'information aussi bien dans les blogs mais également dans des sites d'actualité de qualité.

Ce site permet de voir rapidement lorsqu'il y a des buzz dans la bloguosphère francophone.

Comment Alexa récolte les données?

Logo de Alexa

Logo de Alexa

Il convient de comprendre de quel façon Alexa récolte ses données pour comprendre ensuite comment Wikio procède pour "truquer" les résultats.

Dans l'article d'InfoWebMaster intitulé "Alexa: Statistiques mondiaux des sites web", il y avait des explications sur la méthode utilisé par Alexa. Une grande partie des données récoltées par Alexa proviens de tous les utilisateurs qui ont installé la "toolbar Alexa". En d'autre terme, Alexa propose d'installer sur votre navigateur internet une barre d'outils, et cette barre d'outil récolte vos données de façon automatique.

A chaque fois que vous visitez un site internet, la barre d'outil Alexa le note et va ensuite le reporter dans une gigantesque base de données. Il faut ensuite analyser les résultats pour savoir si un site à beaucoup de site, si les visiteurs reste longtemps sur le site, ...

Truquer les résultats

Nous voici à l'un des points les plus important de cet article. Comme je l'ai dit précédemment, c'est en partie la barre d'outil Alexa qui récolte les informations de statistiques. Néanmoins, tout le monde n'a pas cette fameuse barre d'outil.

Une grosse majorité des utilisateurs de cette barre d'outils sont des "geek", "fan de statistiques", "américains" (car cette barre d'outils est beaucoup plus répondu de l'autre côté de l'atlantique), ...
Par conséquent, les sites un peu "geek" ou les sites américains reçoivent de meilleurs données que les autres.

Pour améliorer ses données, il y a plusieurs méthodes:

  • Installer soit-même la toolbar Alexa. Sachant que vous êtes probablement le plus grand fan de votre propre site/blog, vous êtes peut-être l'un des visiteurs les plus assidus et ponctuel.
  • Présenter des choses qui intéresse les visiteurs qui ont la barre d'outils Alexa (contenu geek, contenu statistique, article parlant d'Alexa, ...).
  • Inciter vos lecteurs à installer la barre d'outils Alexa.

Toutes ces astuces ont été présentées par Pierre Chapaz lui-même (le créateur de Wikio) dans un article intitulé: "Comment faire monter votre ranking dans Alexa".

Preuve que Wikio a des données truquées

Données et statistiques sur Alexa

Données et statistiques sur Alexa

Il y a sans nul doute les données Wikio qui sont tronquées. En effet, il est fort probable que Pierre Chapaz et tous les employées de Wikio aient installé cette barre d'outils. Et pour cause, je vous suggère d'aller jeter un oeil à la page Alexa qui décrit le traffic de:

Si vous regardez en bas de ces pages vous verrez des statistiques pour divers sous-domaine tel que: europa.wikio.fr, new3.wikio.com, alpha3.wikio.com, ...
Or la plupart de ces sous-domaines ne sont pas (encore) disponible. Il sont probablement utilisé par les développeurs pour tester/créer de nouvelles fonctions/services. De même, il ne faut pas perdre de vue que les employés de Wikio travail chez eux (ils font du "télétravail"). Par conséquent, il y a probablement aussi un sous-domaine qui est utilisé en interne chez Wikio pour que les employés puissent communiquer facilement et rapidement entre eux (hypothèse: chatroom, suivis de projet, todoliste, ...).

En ce rendant compte qu'il n'y a que 82% des utilisateurs de Wikio.com qui utilisent véritablement le "bon" nom de domaine, de même il n'y a que 88% des utilisateurs de Wikio.fr qui utilisent le sous-domaine principal. On peut alors en déduire que les pourcentages restant correspondent plus ou moins aux sous-domaines utilisé par l'équipe de Wikio.

Par conséquent, on peut se dire que les membres de l'équipe de Wikio ont installés la toolbar Alexa. Les 12% à 18% de visites (selon Alexa) sur les sous-domaines non-utilisé le prouve aisément. :grr:

Conclusion

Sachant que l'équipe doit certainement visiter de temps en temps le domaine principal, on peut se dire qu'au final il y a peut-être 65-70% de visiteurs de l'audience réelle.

Ne tombons pas non plus dans l'extrême, Wikio n'est pas forcément un site "désert". J'ai juste essayé de démontrer ici par A plus B que les données Alexa peuvent facilement être trafiquées et qu'elle ne représente pas des données très fiable. C'est aussi pour cela que le mois prochain, la liste de Digg-Like (réalisée mensuellement sur InfoWebMaster) sera classée en fonction du Medium-Rank (nouvel indice de calcul pour essayer de définir véritablement si un site est visible/populaire sur l'internet). ;)

Auteur: Tony Archambeau

Développeur web passionné par le référencement et l'ergonomie d'utilisation des sites et applications web, j'édite plusieurs sites web dont infowebmaster.fr.

Commentaires »


Adrien
Le 16 décembre 2008

Sinon, il y a un outil un peu plus dans l’air du temps : google trends ;)


Funnycat [site]
Le 16 décembre 2008

Merci pour ton message Adrien.

C’est vrai que Google Trends est un bon outil pour avoir des statistiques sur la visibilité d’un site. Les données qu’il fournit sont de meilleurs qualités que celles misent en avant sur Alexa. Et les données de Google trends sont plus difficile à faussées.


Maigret
Le 17 décembre 2008

Très bon article et d’ailleurs Wikio ne doit être qu’un exemple parmi tant d’autres d’ailleurs….

Google est décidément partout et ces services sont vraiment utiles et de qualité !


Funnycat [site]
Le 18 décembre 2008

Oui, c’est bien vrai. Déjà, je me demande si Yahoo fait exprès de créer des sites toujours en sous-domaine. Parce que bien évidemment l’ensemble de tous ces petits sites est cumulé pour le même nom de domaine auprès de Alexa et par conséquent Yahoo reste en première position d’Alexa depuis belle lurette.


anone
Le 5 mars 2009

marrant, j’ai pas l’impression de lire la même chose….

http://www.alexa.com/data/details/traffic_details/wikio.fr

wikio.fr – 98.8%

les subdomains non publiques :

alpha3.wikio.fr – 0.0%
new.wikio.fr – 0.0%

donc bon… rien compris à la démonstration « par A+B » qui ne semble pas s’appuyer sur les données linkées dans l’article.
surtout quand il s’agit de conclure que Wikio truque ses stats sur Alexa, alors que leur équipe ne fait qu’une trentaine de personne..


mickaël
Le 5 mars 2009

ça fleure bon le buzz pas cher pour ton blog surtout..


anone
Le 5 mars 2009

tiens tiens, commentaires modérés… pourtant je ne faisais que pointer vers les vrais chiffres…


Olivier
Le 5 mars 2009

En fait toutes les données fournies par Alexa sont faussées et ce site n’a rien d’une référence, professionnellement parlant.
Il n’y a aucun intérêt à être bien classé dans ce système donc aucun intérêt à le détourner.

Olivier


Funnycat [site]
Le 5 mars 2009

Merci pour vos commentaires.
@mickaël: Désolé de te décevoir mickaël, mais je ne vois pas pourquoi cet article serait un buzz pour mon blog, comparé à n’importe quel autre article. D’ailleurs je n’ai pas vraiment fais de publicités particulière pour cet article, si mes souvenirs sont bon. Va jeter un oeil sur Yahoo Search pour analyser ça en détail, je n’ai que 18 liens entrant vers cet article, c’est pas ça qui va me créer un énorme buzz.

@anone: Désolé de te décevoir, mais je ne vois pas de quoi tu parle. Je n’ai pas modéré de commentaires particulier. Tu peux ré-écrire ton message s’il a mal été envoyé.

@Olivier: Oui je suis d’accord avec toi, les données fournis par Alexa ne sont pas exceptionnel. Mais il n’y a que peu d’indice sur l’internet comme celui-ci. Mis à part les statistiques précises de visites, une quantité non négligeable de personne se basent sur ce qu’elle ont à leur disposition pour « quantifié » un site et Alexa fait partit de ces indices. Et c’est un peu pour ces personnes là que j’ai rédigé cet article, pour remettre au gout du jour que les données Alexa ne sont pas une référence absolu.
Attention, je ne parle pas ici d’un détournement énorme, juste d’une petite manipulation pour grimper un peu les chiffres. Et au passage, j’ai pris l’exemple Wikio parce que c’est celui que j’avais sous le nez, mais j’aurais pu prendre n’importe quel autre site dans la même situation. Tout ça pour dire que ce n’est pas une attaque direct de Wikio.

Cordialement. :)


Funnycat [site]
Le 5 mars 2009

@anone: j’ai retrouvé ton message, il avait été bloqué par Askimet.
Donc il faut noter que cet article a été écrit en décembre 2008, les données ont évolué depuis. Il faut aussi noter qu’il y a des données différentes pour wikio.fr et wikio.com. Je n’ai pas fait de capture d’écran à l’époque mais je promet que j’ai utilisé les chiffres que j’ai trouvé sur Alexa. Je ne vois pas l’intérêt de mentir sur mon propre article, surtout si je donne moi-même les liens pour que le visiteur vois par lui-même.

De plus, il ne me semble pas avoir indiqué que Wikio truque ses stats (la flemme de relire en entier mon article). Il me semble juste avoir dit que à cause de l’équipe, les données de Wikio sont « faussé » (que cela soit volontaire ou non).

Cordialement.

Trackbacks

[Note de Lecture] BrowseRank: Letting Web Users Vote for Page Importance « Blog Tony Archambeau [site]
Le 30 décembre 2009

[…] "moyen", cela peut aisément biaiser les statistiques. A titre d'exemple, les statistiques Alexa peuvent être faussées facilement car les données sont récupérées grâce à la barre d'outils Alexa. Sachant que le […]

Leave a comment