Quelques informations confidentielles sur Google Reader

L’information a été divulguée par un employé de Google, Ben Darnell, dans une vidéo confidentielle qui a été supprimée depuis de Google Video. Dans cette vidéo, cet employé explique plusieurs informations sur les infrastructures qui se cachent derrière le lecteur RSS de la firme de Moutain View agrémentées de pas mal de chiffres :

  • deux tiers des flux RSS n’ont qu’un seul abonné Google Reader. Ces flux sont mis à jour tous les 3heures. En revanche plus il y a d’abonnés à un même flux et plus ce flux est mise à jour régulièrement : toutes les heures au maximum.
  • Google Reader est l’un des rares lecteurs RSS a conservé l’intégralité de l’historique de chaque flux.
  • Sa base de données représente plus de 10terabytes soit plus de 12500Go de données.
  • Cette base de données grossit de 4% toutes les semaines.
  • Google Reader surveille plus de 8 millions de flux RSS.
  • L’infrastructure de Google Reader est utilisé pour les flux par de nombreux autres services de Google : iGoogle, Orkut, les webclips deGmail, les widgets de Blogger, Google Spreadsheets ou encore l’API Ajax.
  • Le taux de croissance du nombre d’utilisateurs de Google Reader est égale au taux de croissance du nombre de flux dans la base.
  • 70% des utilisateurs de Google Reader utilise Firefox.
  • Google Reader n’a que 2 applications de Google qui génèrent plus de trafic que lui : Gmail et Orkut.
  • Seulement 6 employés travaillent sur Google Reader : 3 sur le Bakend et 3 autres sur le Frontend aidés d’un stagiaire.
  • La nouvelle fonctionnalité de recherche dans les flux demande beaucoup de ressources et Google Reader utilise deux indexs pour les recherches :
    • Un arbre géant mis à jour 2fois par jour (150 machines et 600millions de documents)
    • 40arbres plus petits pour les articles récents et mis à jour tous les 5minutes (40machines et 40millions de documents)
  • En ce qui concerne les évolutions de Google Reader :
    • Très prochainement : internalisation, la recommandation de flux RSS et accepter les pings envoyés à Google Blog Search.
    • Prochainement : possibilité de commenter les articles partagés et une organisation basée sur les liens (articles pointant vers une même page)
    • Possibilité de monétisation pour Google Reader : proposer aux auteurs des flux de partager de l’Adsense.

Il est vraiment très rare que des informations comme celles-ci parviennent à être rendues (brièvement) publiques. Les prochaines évolutions semblent vraiment prometteuses avec l’ajout d’un côté plus social et surtout la monétisation que beaucoup avait imaginé suite au rachat de Feedburner par Google.

Article trouvé et traduit sur un forum de Blogoscoped.com

Découvrez aussi les sous-titres à télécharger

Les meilleurs sous-titres français pour Vikings saison 4. Le meilleur moteur de recherche de sous-titres disponibles en français et en anglais.
14 Commentaires (ajouter le vôtre)
  1. gb

    J’aurais préféré des ameliorations de performance pour google reader, pour la recherche, pour l’ajout des flux, la lecture etc. Plutot que des évolutions que la majorité des personnes ne toucheront jamais…

  2. tu as des problèmes de performance sur GG Reader ? moi je l’utilise toute la journée et je le trouve très rapide… même la nouvelle fonctionnalité de recherche..

  3. Intéressant. Je suis étonné de l’équipe réduite sur un tel projet… comme quoi Google emploie bien les meilleus.
    Mais par contre, je comprends maintenant pourquoi certains flux sont plus à jour rapidement que d’autres… Parfois GReader me signifie une mise à jour qui a été signifiée plus d’une heure avant par Netvibes… A quoi sert un clic sur « refresh » alors si ça ne rafraichit par la liste ?

  4. J’ai remarqué que les perfs de Google Reader dépendent vraiment du navigateur utilisé. J’ai testé sous Opera et c’est très lent comparé à Firefox…
    Sinon c’est effectivement étonnant une équipe si réduite pour Google Reader au vu des autres chiffres ;)

  5. Une petite boulette dans l’article plus de 10To = 12500Go et non 1250Go

  6. J’aime bien le « EXCLUSIVITE » que tu as mis sur Twitter ;-)
    Bonne traduction, y’a des chances que je te linke dans un de mes prochains articles
    ++

  7. @b_adele : merci !
    @TOMHTML : au plaisir de te lire sur Zorgloob.com !

  8. @aysoon,
    Grrrr, A cause de ton article j’ai essayer la version 2.0 de Google Reader et je suis assez content de leur V2, je sens que je vais donc basculer de bloglines vers google reader.

  9. Perso je ne jure que par Google Reader, et une extension Firefox permet de le mettre dans Gmail, comme ça c’est propre…

  10. Perso je ne jure que par Google Reader, et une extension Firefox permet de le mettre dans Gmail, comme ça c’est propre…

  11. C’est quand même impressionnant ces stats ! tous cela avec 6 bonshommes …

  12. Wow!
    Intéressant!

    Je ne pensais pas que cela consommait autant, les feeds, mais c’est vraiment du lourd… une autre dimension!

  13. Perso je n’utilise pas Goggle Reader, je le trouve trop moche, peu intuitif !

    Qu’a-t-il de plus que les autres lecteurs de flux ? Y-a-t-il un intérêt spécifique qui m’aurait échappé à l’utiliser plus qu’un autre ?

    Tank U

  14. We are a gaggle of volunteers and opening a new scheme in our community. Your site provided us with valuable info to paintings on. You have performed an impressive job and our entire neighborhood will likely be thankful to you.

© 2006-2017 Frédéric Cozic  
Propulsé par Wordpress sous licence Creative Commons