Comment Google traque le taux de clics dans ses services

Vous êtes probablement déjà au courant que Google traque le taux de clics (CTR) dans les pages de résultats (SERP). A chaque recherche, lorsqu'un utilisateur clique dans les SERP, Google enregistre le mot clef recherché, le lien cliqué ainsi que sa position, et probablement d'autres informations... (vous pouvez voir tout ça sur webmaster tools)

Google peut éventuellement utiliser ces informations comme ranking factor (Bing affirme le faire), certains brevets déposés par Google vont dans ce sens (mais brevet déposé ne signifie pas obligatoirement mise en application), des tests confirment l'effet important et rapide d'une manipulation du CTR (moz) tandis que d'autres tests n'ont permis de tirer aucune conclusion (dejan).

Pour ma part, j'ai pu effectuer des tests de manipulation du CTR dans les SERP mais sans succès. Cependant, je pense que mon protocole opératoire était biaisé (automatisation, ips suspectes) et que Google a su détecter cette manipulation. Pourtant, je pense toujours très fortement que Google utilise le CTR (je vais tenter l'expérience à nouveau très prochainement).

Il y a quelque chose de très intéressant que j'ai pu remarquer : Sur un grand nombre de ses services (search, google+...), le moteur de recherche traque les clics sur les liens sortants via un seul et unique tracker.

Google peut donc avoir une idée de la popularité d'un lien, ou du nombre de clics vers un site, sur la plupart de ses services. Il est encore trop tôt dire si Google utilise ces données comme signal de qualité, mais pourquoi pas ? En tout cas, voici la liste des services dans lesquels j'ai pu identifier ce tracking.

La plupart du temps ces URLs de tracking sont soit directement dans le code HTML à la place du lien (par exemple http://google.com/tracking?url=http://veritable/lien). Ou bien, via un cloaking javascript discret qui remplace l'URL d'origine par le tracker.

Pour détecter l'URL de tracking vous pouvez utiliser l'analyseur de requête présent sur Chrome et Firefox (CTRL + SHIFT + i) ou bien utiliser un proxy client-side qui vous permettra de voir les requêtes envoyées par votre navigateur (burp free edition, zaproxy, charles ...). Il peut être nécessaire de désactiver les extensions anti tracking du type adblock ou ghostery. Dans certains cas, le tracking ne se déclenchera que sur un clic normal et pas sur un clic "ouvrir dans un nouvel onglet".

Google search

Commençons par le plus connu, il s'agit d'un cas spécifique car nous avons ici une association "mot clef" et "clic".

Sur une page de résultat, lorsque vous cliquez sur un site, le lien est cloaké en javascript et vous atterissez sur la page suivante avant d'être redirigé vers la véritable URL :

https://www.google.fr/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&ved=_VED_&url=https://url-du-resultat.com/&usg=_SECURITÉ_&bvm=_BVM_

On remarquera que le mot clef n'est pas présent dans cette url (depuis le mode not provided). Il existe probablement un lien entre le paramètre ved et la recherche, le paramètre usg étant un hash de vérification de l'URL et bvm identique lors de recherches différentes.

Google groups

Le service de pseudo mailing-list / forum de Google. Tracking des liens sortants dans les messages via javascript comme pour le search. (exemple de message avec un lien).

https://www.google.com/url?sa=D&q=https://lien-d-origine.com/&sntz=1&usg=_SECURITÉ_

Google bookmarks

Un service de bookmarking basic, rien à voir avec les bookmarks du navigateur Chrome synchronisable dans votre Google. Ici pas de cloaking, l'URL de tracking est en dur dans le code HTML :

https://www.google.com/url?q=https://lien-d-origine.com/&usg=_SECURITÉ_

Plusieurs choses à dire ici, tout d'abord le nombre de visites d'un bookmark est quelque chose de très intéressant en terme de signal qualité. J'ai également pu lire ça dans quelques brevets (notamment celui-ci).

Aussi, on peut donner un titre ou une description au bookmark et lui associer des tags. C'est donc bien plus qu'un simple lien, on peut associer plusieurs mots clefs à un lien. (Pour info, on pouvait faire la même chose sur Google Reader, mais RIP).

Honnêtement, je doute fort que ce service soit utilisé en terme de signal qualité. J'ai effectué plusieurs tests infructueux il y a quelque temps. Aujourd'hui, je pense plutôt que c'est le rôle des bookmarks Chrome.

Google plus

Le réseau social traque les clics sur les liens vers les articles, dans les posts ou dans les commentaires. Tracking en javascript comme pour le search.

http://plus.url.google.com/url?sa=j&url=https://lien-d-origine.com/&uct=_TIMESTAMP_&usg=_SECURITÉ_.

Hormis un nom de domaine légèrement différent (probablement un simple alias), le service semble le même que les autres.

Tracking spécial

Youtube

Il est possible de mettre des liens dans les descriptions des vidéos youtube. Il y a également un tracking sur ces liens, mais très différent des autres trackers :

https://www.youtube.com/redirect?q=https://lien-d-origine.com/&redir_token=_SECURITÉ_

Cela laisse à penser que le tracking des vidéos youtube n'est pas utilisé dans le même but que les services précédents. (ou pas).

Feed Burner

FeedBurner est un "Google Analytics" pour les flux RSS. Il y a bien un tracking des clics sur ce service mais il est très différent du tracking habituel :

http://feedproxy.google.com/~r/_FLUX_FEED_BURNER_fr/~3/_HASH_/lien.html

Ce tracking est très probablement destiné à usage unique de FeedBurner. L'arrêt du service Google Reader montre également que Google apporte peu d'intérêt aux statistiques des flux RSS, un système trop technique et trop peu utilisé par le grand public. Pourtant Google Reader était bel et bien intégré au moteur de recherche : j'ai pu découvrir que GoogleBot visitait les articles présents dans des flux RSS ajoutés à GoogleReader (mais indexé/linké nulle part ailleurs).

Les grands absents

Blogger : pas de tracking. Pourtant la quantité d'informations récupérables (clics sur les liens sortants) est très importante.
Gmail : pas de tracking. Données trop personnelles ?
Google docs : ce service traquait les clics il y a ~2 ans, mais ce n'est plus le cas aujourd'hui.

Hypothèses

La présence d'un unique service http://www.google.fr/url dédié au tracking des clics sur les liens m'interpelle. Cela laisse à penser que Google utilise ce service pour calculer la popularité des liens de façon globale et pas uniquement dans le cadre du service. Par exemple, dans le cas de youtube et de feedburner, on voit bien que le tracking est spécifique au service avec une URL totalement différente.

Il faut maintenant effectuer des tests sur ce service de tracking pour en savoir plus sur son éventuelle implication dans le classement des SERP. Je ne crois pas qu'un clic sur ce service déclenche le passage de GoogleBot sur l'URL cible (à revérifier). Cependant, le service pourrait accorder du trust à une URL recevant un fort taux de clics. Ou bien, dans le cadre d'un clic dans les SERPs, booster le ranking d'une URL pour un mot clef donné.

Google dispose d'un grand nombre de moyens de calculer la popularité d'un site sans utiliser les liens, j'en parlerai dans un prochain article.

SERP HACKER Éditeur de solutions pour le référencement