Comment Facebook gère quotidiennement son infrastructure

Facebook est une vraie machine de guerre : on a pu voir récemment que c’était le site le plus visité au monde, et tout ça seulement après quelques années. Contrairement à d’autres « supergrands » (Google, Microsoft, Apple, Youtube, etc.) un certain nombre d’informations filtrent lors de conférences, et dans des documents officiels.

Logo Facebook

Je rappelle que pour écrire ces 2 articles, j’ai simplement visionné des vidéos de conférences pour compiler les informations. Vu la masse de détails obtenus, j’ai publié deux articles :

En extrapolant plusieurs données (graphiques d’évolution, chiffres passés, etc.) on estime entre 60 000 et 100 000 le nombre de serveurs de Facebook .

Facebook : évolution du nombre de serveurs

Facebook : évolution du nombre de serveurs

Cependant, ce chiffre ne tient pas compte de deux nouveaux datacenters actuellement en cours construction (Oregon et Caroline du Nord).

Facebook a depuis longtemps atteint une masse critique qui nécessite de voir sa copie en terme d’administration quotidienne.

Un des ingénieurs de Facebook a bien illustré le problème lors d’une conférence :

With Facebook users spending a collective 8 billion minutes on the site each day, serving 1.2 million photos each second, and managing more than 25 terabytes of data per day in logging data, we’re forced to think about servers and datacenters differently.

Nb : les chiffres sont de 2009, les actuels sont présents dans mon article précédent.

(suite…)

Les 1000 sites les plus visités dans le monde

Vous êtes curieux de savoir quelles sites dominent la planète en drainant le plus de visiteurs : DoubleClick Ad Planner (un service publicitaire racheté par Google) publie mensuellement ce classement, basé sur leurs statistiques.

Voici la listes des 5 premiers :

  • Facebook (bien sûr), normal avec leurs statistiques,
  • Youtube,
  • Yahoo,
  • Live,
  • Wikipedia : il est intéressant de retrouver ce site communautaire, n’utilisant aucune technique marketing ni aucune publicités.

Retrouvez les 1000 sites les plus visités dans le monde avec Google Doubleclick Ad Planner

Le classement est par ici : the 1000 most-visited sites on the web.

Tiens, mon blog n’est pas dans la liste ? :)

Facebook, site le plus visité au monde

C’est pas moi qui le dit, mais Hitwise et DoubleClick. :)

Pour commencer, DoubleClick Ad Planner qui liste les 1000 sites les plus consultés dans le monde en terme de visiteurs uniques mensuels.

Les 1000 sites les plus visités dans le monde

Les 1000 sites les plus visités dans le monde

Ensuite, Hitwise propose un Top 20 des sites les plus visités aux USA : on voit que Facebook représentait 10,28% des visites la semaine dernière.

Top 20 websites US

Ça en fait du temps perdu à rien faire sur Internet ! :)

Boostez votre serveur Apache avec mod_pagespeed

L’extension PageSpeed pour Firefox/Firebug permet d’évaluer les performances des pages web et prodigue des conseils pour optimiser la vitesse de celles-ci.

Cette semaine, c’est un module pour Apache, mod_pagespeed, qui vient compléter ce panel d’outils. Mis à disposition par Google (gratuitement, sous licence Apache), il est encore en version beta mais permet déjà des résultats visibles.

Comme je suis curieux, je l’ai installé sur mon serveur (qui était déjà optimisé depuis quelques semaines).

NB : pour l’installer en toute sécurité, j’ai fait un snapshot de mon serveur dédié (merci VMware ^^), au cas où ! :)

Je grapille 1% au test Page Speed sur GTmetrix, notamment avec quelques petites améliorations dans les points suivants :

mode_pagespeed : résultat au test gtmetrix

Cependant, sur certains points les performances diminuent : comme quoi, la solution magique n’existe pas, et simplement activer un module sur votre serveur ne fera pas forcément des miracles si vos applications n’en sont pas conscientes.

Pour la configuration, vous trouverez des informations par ici, ou ailleurs sur l’Internet Mondial (qui va être beaucoup plus rapide maintenant) ! ;)

La news est sur le blog Webmaster Central Blog.

Tentative de phishing sur GMail

D’après Wikipedia, le phishing (ou hameçonnage en français) est :

…une technique utilisée par des fraudeurs pour obtenir des renseignements personnels dans le but de perpétrer une usurpation d’identité. La technique consiste à faire croire à la victime qu’elle s’adresse à un tiers de confiance — banque, administration, etc. — afin de lui soutirer des renseignements personnels : mot de passe, numéro de carte de crédit, date de naissance, etc. C’est une forme d’attaque informatique reposant sur l’ingénierie sociale (sécurité de l’information). L’hameçonnage peut se faire par courrier électronique, par des sites Web falsifiés ou autres moyens électroniques.

La semaine dernière, j’ai eu un chouette courrier électronique sur mon adresse Gmail, envoyé par : service.comptes.courriers@gmail.com

Tentative de phishing sur Gmail via un courrier électronique

Pour l’utilisateur ne faisant pas attention / n’ayant pas été un minimum averti sur ce type d’arnaque, ce serait relativement plausible : en effet, le mail écrit sans fautes d’orthographe, comporte les avertissements de sécurité habituel sur les navigateurs, etc.

Il y a cependant quelques erreurs :

  • le logo GMail « beta » : ça fait quelques temps déjà que le service n’est plus en beta, :)
  • le fait que Google ne vous demandera jamais vos identifiants,
  • etc.

Je rappelle qu’aucun service en ligne ne vous redemandera vos informations, jamais ! Donc, même si un mail a l’air « officiel« , il faut réflechir à 2 fois avant de répondre.

En vrac #55

Revue de presse hebdomadaire par Romain DECKERAu départ prévue pour stocker des liens que je jugeais intéressants, la revue de presse hebdomadaire me permet de partager mes découvertes avec vous. Au menu de cette 54 ème édition : Facebook, des photos second degré, 9 cartes d’Internet, la visite d’un Airbus à 360° et les raisons pour lesquelles les développeurs devraient switcher sur Google Chrome.

(suite…)