Tout sur Google et la fraîcheur

Google et la prime de fraîcheur

Rappelez-vous… comment aviez-vous appris la mort de Michael Jackson ?
Moi, c’est par Twitter.
Cette information a fait 40 fois le tour de la terre via Twitter avant que les algorithmes de Google ne parviennent à l’identifier comme breaking news. Ce retard a résonné comme une énorme claque au visage du grand Google en démontrant la faiblesse des moteurs de recherche sur les requêtes d’actualité. Depuis, l’armée de têtes (bien) pensantes de Google à beaucoup travaillé afin d’avoir un moteur de recherche performant sur l’actualité.
Tout bon SEO comprends immédiatement pourquoi cette mécanique de fraîcheur impacte son travail… non ?
Faisons le point ensemble.

 

QDF ? Kézako !??

Google ne balance pas des contenus typés actualité n’importe où, n’importe quand. Ce ne serait pas pertinent. A quoi servirait-il de forcer l’affichage d’actualité sur requête aussi périmée que… euh… « Emile Zola » par exemple (Zola, je peux pas. Je me demande si ce mec était en vie de son vivant. Rien qu’après 3 pages d’un roman Zola, j’ai déjà envie de lui enlever la prostate).

En 2007, Amit Singhal (ingénieur en chef de l’algo de ranking chez Google) nous expliquait déjà dans le New York times comment QDF (pour Query Deserves Freshness, la requête mérite de la fraîcheur) un algorithme qui analyse la requête de l’internaute, détermine à quel degré celle-ci est une recherche d’actualité.

Google Trends pour déterminer les requêtes d'actualité

La détection des sujets d’actualité

J’imagine que certains mots-clés doivent automatiquement déclencher un score QDF élevé comme « nouveau, dernier, quand… ».
Cependant, l’élément déterminant pour identifier une recherche d’actualité c’est l’augmentation soudaine de la fréquence de recherche de cette requête.

Vous connaissez Google Trends ? N’est-ce pas la preuve que Google dispose des outils pour analyser la fréquence de recherche des requêtes ?

 

Quoi, ils sont pas frais mes contenus !??

Il y a plusieurs manières pour Google d’identifier les contenus d’actualité, ou plus exactement ceux qui apportent une réponse pertinente à une recherche d’actualité. Il y a les contenus d’actualité par nature et les contenus d’actualité par adoption.

Google et la prime de fraîcheur

Il est pas frais mon contenu ?

Les contenus d’actualité par nature :

Ce sont des contenus dont la nature et l’origine (le média émetteur) les place de facto comme des contenus d’actualité. Ce sont en fait des contenus publiés par des sites identifiés :

  • Les sites identifiés par Google comme des médias d’actualités et référencés par Google actualité. Si j’en crois les chiffres que j’ai pu croiser, les résultats de Google Actualité sont présents sur Google.fr pour 7% à 12% des mots-clés… et sûrement sur une portion beaucoup plus importante des requêtes des naunautes. Des évolutions de Google comme ‘cafeine’ visaient justement à re-déployer les ressources de crawl et d’indexation de Google vers les bonnes sources, autrement dit les sites populaires et qui balancent fréquemment du contenu.
  • Les blogs, identifiés par Google Blog Search. Il est fréquent que les articles des blogs soient  indexés par Google seulement quelques secondes après leur publication. BigG qui dépense donc beaucoup d’énergie à acquérir rapidement ce type de contenus.
  • les réseaux sociaux, je pense principalement aux Tweets qui jouissent (jouissaient ?) d’un affichage quasiment en temps réel dans les SERPs de Google sur quelques types de requêtes particulières.

 

Les contenus d’actualité par adoption :

Quand je parle d’adoption, je parle ici de d’adoption par le public. C’est-à-dire lorsqu’un contenu génère un buzz qui se propage rapidement et qui en fait un sujet d’actualité. Ce buzz prend désormais deux formes : Nos chers et traditionnels backlinks d’une part, et les signaux sociaux d’autre part.

Le signal « backlinks » :

Pour coller à l’actualité, Google ne peut attendre que le total des liens accumulés par une page nouvelle dépasse celle des pages beaucoup plus anciennes. Ce qui est d’actualité, c’est ce dont on « parle » maintenant. Par conséquent, au-delà du cumul historique de liens, un moteur doit s’intéresser à ce qu’il se passe à court terme, à la marge, sur les liens nouvellement créés. Plus précisément, c’est un afflux soudain de backlinks qui permet de détecter une actualité. C’est ce que vous montre (à postériori) l’indicateur « nouveaux backlinks » du logiciel de référencement SeeUrank (sur lequel je m’appuierais tout à l’heure) ou l’indicateur « backlink discovery (non-cumulative view) » de Majestic SEO.

Le signal « activité sociale » :

Si Google à mis autant d’acharnement à lancer des applications sociales (Orkut, Buzz, Wave, voire Latitude et maintenant Google+), ce n’est pas uniquement pour dominer le monde. Le web a changé. Désormais les réseaux sociaux permettent aux naunautes de partager très vite leurs découvertes numériques (et aussi de se relier à des « objets » web, mais c’est un autre sujet).
Ce signal social de popularité (le lien dans un tweet, le lien dans un post FB, un Like, un G+1) à un triple intérêt.
Tout d’abord, il est très démocratique. On ne compte plus les utilisateurs de FaceBook et Twitter, il y en a beaucoup plus que des webmasters.
Ensuite, il mesure bien ce qui fait l’actu. Le fonctionnement en « time line » des réseaux sociaux rend les sujets éphémères et favorise donc la nouveauté.
Enfin, il est facilement exploitable puisque la fourniture d’une API est dans le fonctionnement de base de Twitter et FaceBook.
Google est aujourd’hui dépendant de FaceBook et Twitter pour la détection des tendances. C’est une menace grave, d’autant que FaceBook concurrence frontalement Google sur le marché du profilage du naunaute et de la publicité ciblée.

Résumé pour ceux qui ont fait semblant lire ce qui précède

Si je résume, Google dispose de deux critères alternatifs pour déterminer quels contenus sont d’actualité.
Comme dit précédemment, le premier critère est la vocation d’actualité du contenu… et en second lieu sa fraicheur (bah oui, les actus de 1982 ça n’intéresse pas le naunaute).
En revanche, un buzz ne se produit pas nécessairement sur un contenu frais. Le second critère est donc l’apparition d’un pic de popularité.

 

Quelles conséquence pour mon SEO ?

Mon cher ami SEO, la compréhension du fonctionnement des moteurs de recherche devrait ton pain intellectuel quotidien. Mais aujourd’hui, tel une maman oiseau, je te mâche le travail.

Conséquence 1 : le cycle de vie de la popularité

En analysant les courbes d’acquisition de liens de différents sites web (merci SeeUrank), on peut identifier trois scénarios significatifs du cycle de vie de la popularité d’un site.

1- Les pics : synonymes du début et de la fin d’une actualité.

Pic de popularité

Pic de popularité via SeeUrank

Lorsqu’ils sont détectés par un moteur, ces afflux rapides de nouveaux liens vers un site indiquent un buzz… ou un abus par le référenceur d’outils de linking massif. Dans le premier cas, le moteur va logiquement donner un bonus de pertinence à la page, voire l’étiqueter comme ‘actualité’. Mais attention à la descente ! Si un buzz donne probablement une « prime d’actualité », la fin de ce buzz devrait logiquement donner un malus. Ce type de courbe convient bien à un site d’actualité, mais peut être néfaste au SEO d’un site professionnel.

2- Les plateaux : le site acquiert en permanence de nouveaux liens.

Plateau de popularité

Plateau de popularité

Les courbes de cette forme sont traditionnelles des « sites de référence », dont la valeur informationnelle est valable à long terme. En d’autres mots, c’est un site qui intéresse aujourd’hui, qui intéressait déjà hier, et qui a donc toutes les chances d’intéresser les internautes demain.
Ce type de courbe est probablement l’idéal à rechercher pour les sites corporate ou e-commerce.

3- Les déserts : le site n’obtient aucun lien (ou presque)

Désert de backlinks d'un site en panne de popularité

Désert de backlinks d’un site en panne de popularité

Ce manque d’intérêt régulier est malheureusement significatif des sites sans vie. Ces sites ont peu de chance de se positionner sur des requêtes concurrentielles.

 

Conséquence SEO 2 : Je buzze sur les réseaux sociaux

Les tests qui ont pu être faits semblent montrer que l’effet des signaux sociaux (Twitter, FaceBook, Google+) sur les classements des moteurs de recherche est de courte durée. On va donc s’en servir pour pousser des actualités, des blogs… l’impact pour du SEO à plus long terme est incertaine. Cela m’étonnerait que ce soit nocif, donc on applique la maxime « Dans le doute, agis ! ».

Un commentaire

  1. Très bonnes explications sur le sujet. Aurais-tu des données sur les durées ?
    ps : ton paragraphe « wp-caption-text » n’est pas super sous FF.
    ps 2 : Zola est un grand auteur espèce de naunaute (la il faut sentir l’insulte lié à la sous-culture Web + un côté France profonde) !

    Reply
  2. Merci pour cette réflexion ! Je suis d’accord avec toi pour souligner la dépendance de GG à Facebook et Twitter sur le sujet, le bouton +1 est bel et bien une tentative pour s’en affranchir, au moins partiellement.

    Google possédant tout de même un grand nombre d’outils pour qualifier les surfs des internautes, cette dépendance n’est quand même pas totale.

    Sur le buzz sur les réseaux sociaux, c’est clair ! C’est de toute façons, pour faire vite, ce buzz qui touche les blogueurs qui, eux, génèrent les liens ;)

    Reply
  3. Très intéressant ton article Magic Yoyo. Comme Aurélien j’aurais bien aimé que tu nous présente quelques données supplémentaires. C’est possible ?

    Reply
  4. « (Zola, je peux pas. Je me demande si ce mec était en vie de son vivant. Rien qu’après 3 pages d’un roman Zola, j’ai déjà envie de lui enlever la prostate). »
    J’ai la même interrogation à ton propos : celui qui jamais été ému à la lecture de Germinal n’est pas humain.

    Reply
  5. Démarrage sur les chapeaux de roues avec un excellent article, bravo !
    J’aurais aussi aimé quelques chiffres complémentaires et comme « graphiste », je trouve le nofollow un peu bizard sur un blog SEO, mais tu as sans doute tes raisons sur ce dernier point.

    Allez hop, j’ajoute ce blog à ma liste de références à suivre !

    Sylvain

    Reply
  6. Quel article ! Très sympathique à lire et très complet.
    Je cherchais des informations là dessus et surtout sur le comportement du ranking à moyen terme étant donné que j’ai eu l’occasion de voir un petit truc sympathique sur une requête il y a peu : 8 des 10 résultats historiques dégagés par de l’actualité pendant quelques jours.
    Au plaisir de te lire à nouveau.
    Autant dire qu’au moment le plus opportun pour ces sites, Google les a totalement négligés.

    Reply
  7. Article très complet pour un premier post :)

    « Google Freshness Update » impacte depuis plusieurs semaines les requêtes US, c’est assez impressionnant de voir ça sur google.com en tapant « football » par exemple.

    Reply
  8. Comme quoi les liens seront toujours le plus puissant des outils pour positionner un site.

    En tout cas, pour un premier article, tu ne fais pas dans la demie mesure à ce que je vois… Bravo.

    PS: même avis que Gwaradenn, les balises P des images s’affichent bizarrement.

    Reply
  9. Ce que je retire de ton article c’est qu’au final, les réseaux sociaux sont un excellent moyen pour les moteurs de recherche de repérer et de mettre en avant les contenus d’actualités mais ils n’assurent pas la pérennité d’un positionnement.
    Jamais les réseaux sociaux ne pourront permettre d’obtenir un positionnement sur une requête de façon pérenne dans le sens où Google ne peut pas trop donner le « pouvoir au peuple ». Non pas que ce ne soit pas dans la politique du moteur mais plutôt car Google perdrait le contrôle de ses résultats.
    D’un autre côté la dernière mise en jour de Google offre plus de crédit aux résultats d’actualité donc ça contredit un peu ce que je viens de dire :D.

    Dans tous les cas, on est bien d’accord sur le fait que la présence sur les réseaux sociaux est importantes puisque l’on sait que les moteurs aimerait leur accorder plus d’importance. Aujourd’hui, ils n’ont pas encore trouvé comment maîtriser, garder le contrôle tout en offrant plus de pouvoir au peuple (n’est-ce pas ce qu’il tente avec Google + ?) mais le jour où ils trouveront une solution, il vaudra mieux avoir pris un pas d’avance. S’il trouve une solution un jour car la problématique est complexe.

    Reply
  10. Bonjour et félicitation pour ce bel article.

    J’ai une interrogation sur le cycle d’un « Pic ».
    En effet, pourquoi la courbe descend en deça du point de départ? Pourquoi après un buzz, la situation serait pire qu’avant?
    Je pense (à tort?), au contraire que le site gagnerait ou au pire reviendrait à son niveau de départ.

    Reply
    • Bonjour;
      Le niveau exact de la descente n’a pas grande importance. La courbe affichée ici est un exemple réel, je n’ai pas cherché à indiquer un cas théorique parfait. L’idée est le retour à son niveau initial… plus ou moins. :)

      Reply
  11. Très bon pour un premier post, j’aurais appris les 2 concept de fraîcheur, nature et adoption, que je ne connaissais pas.
    Bonne continuation en tout cas !

    Reply
  12. Ce qui est hallucinant, c’est encore l’incapacité de Google à s’adapter aux buzz récurrents. Pour administrer un site d’actualité culturelle, je constate régulièrement qu’il préfère laisser d’anciennes pages sur la fête de la musique, les activités de Noêl… plutôt que de positionner les pages correspondant au bon événement pour la bonne année !

    Reply
  13. Bon, ben, moi j’aime pas du tout cet article, mais comme les autres disent qu’il faut te suivre alors allons-y!
    joke :s
    Tu fournis c’est vrai un très bon article pour commencer ce blog et l’année. Je pense que pour des grands comptes, il est très intéressant de profiter de ses pics en animant leurs comptes régulièrement de jeux ou concours. Si leur notoriété est déjà grande, ça la renforce encore et le nombre de signaux sociaux est finalement toujours plus grand.

    Reply
  14. Le pire étant tout de même les liens créés lors de buzz puis disparaissants. Quand ca arrive au bout d’un an sur 40% sur une page avec des ancres optimisé ca flingue la page pour le buzz suivant sur le même thème/personne !

    Reply
  15. Tu as toujours eu des talents de rédaction (et plein d’autres). En plus tu as une expérience et un regard super intéressant. Content de savoir que tu lances sur ce nouveau projet.

    Reply
  16. Je suis d’accord pour dire que ce blog fait un très bon départ. Je t’encourage à continuer, aussi bien sur la forme que sur le fond. D’ailleurs, pour que ton blog continue à avoir de la fraîcheur, tu devrais continuer à faire des articles ;)

    Reply

Leave a Comment.