L’infrastructure de Facebook : les chiffres clés

Facebook est une vraie machine de guerre : on a pu voir récemment que c’était le site le plus visité au monde, et tout ça seulement après quelques années. Contrairement à d’autres « supergrands » (Google, Microsoft, Apple, Youtube, etc.) un certain nombre d’informations filtrent lors de conférences, et dans des documents officiels.

Logo Facebook

J’ai visionné plusieurs heures de vidéos de conférences (long mais super intéressant) et ait compilé les informations. Vu la masse de détails obtenus, j’ai décidé de publier deux articles :



En extrapolant

  • certains graphiques d’évolution,
  • des chiffres passés,
  • des indications fournies pendant des conférences,

on estime entre 60 000 et 100 000 le nombre de serveurs de Facebook . Cependant, ce chiffre ne tient pas compte de deux nouveaux datacenters actuellement en cours construction (Oregon et Caroline du Nord).

Facebook : évolution du nombre de serveurs

Facebook : évolution du nombre de serveurs

Mais qu’est-ce qui peut bien tourner sur cette infrastructure ? :)

Données générales :

  • 500 millions d’utilisateurs actifs (un utilisateur actif est un utilisateur qui se connecte au moins une fois par mois),
  • 50% des utilisateurs se connectent au moins une fois par jour, soit 250 millions de personnes tout de même,
  • 690 milliards de pages vues par mois,
  • 6 milliards de contenus partagés par semaine (statuts, photos, liens, vidéos),
  • 3 milliards de photos uploadées par mois, pour plus d’un pétaoctet de stockage uniquement destiné aux photos (chaque photo existe en 4 tailles),
  • un dernier chiffre, le plus parlant peut-être : 16 milliards de minutes sont passées par jour sur Facebook. Ça représente 11 millions de jours ou encore plus de 30 000 années qui sont passées par jour sur le réseau social, c’est juste énorme !

Données techniques :

  • plus de 300 To (téraoctets) de données en cache en RAM avec Memcached,
  • 25 To (téraoctets) de log par jour,
  • un ingénieur Facebook pour 1,1 millions d’utilisateurs. A titre de comparaison, Google emploi un ingénieur pour 190 000 utilisateurs,
  • un opérateur Facebook pour 2,3 millions d’utilisateurs.

Quelques chiffres intéressants sur MySQL :

  • 13 millions de requêtes par seconde en pic,
  • 38 Go/s de trafic MySQL en pic,
  • temps de réponse moyen en lecture : 4 ms,
  • temps de réponse moyen en écriture : 5 ms,
  • 450 millions de lignes lues par seconde en pic,
  • 3,5 millions de lignes modifiées par seconde en pic,
  • 5,2 millions d’I/O (disques) InnoDB par seconde.

Qui a d’autres chiffres intéressants et récents à partager ? :)

Dans le prochain article sur le sujet, je traiterai de la gestion quotidienne d’une infrastructure de cette taille.

Sources :

16 Téra de stockage : qui en reprendra un peu ?

Et non, ce n’est pas chez moi (même si ce serait chouette) ! :)

16 Téraoctets de stockage

En vrac #49

Revue de presse hebdomadaire par Romain DECKERAu départ prévue pour stocker des liens que je jugeais intéressants, la revue de presse hebdomadaire me permet de partager mes découvertes avec vous. Au menu de cette semaine : 488 Go de stockage gratuit en ligne (sisi!), auditez votre code PHP à la recherche de failles de sécurité, un PC qui tient dans la main et qui ne consomme que 7 watts, et les 8 expressions régulières que vous devriez connaître ! (suite…)

Mon cycle de traitement et de sauvegarde pour mes photos

Cycle de backup de mes photos

Cycle de backup de mes photos

Depuis l’achat de mon Nikon D60, je produit entre 500 et 1000 photos par mois. :)

C’est bien, je suis productif… cependant, cela a assez rapidement soulevé d’autres problématiques : celles du stockage, de l’accès via plusieurs postes à ces photos, ainsi que la sauvegarde.

Je viens de faire le compte, j’ai très exactement :

  • 55,3 Go de photos,
  • pour un compte de 35 800 fichiers.

Je suis plutôt du genre « parano » pour les sauvegardes et la pérennité des données. Je pense que ça vient d’une mauvaise expérience où j’ai perdu des fichiers suite à un mauvais cryptage de disque dur.

C’est pourquoi j’ai déployé toute une stratégie de sauvegarde afin d’éviter toute perte de données future.

Les explications sur ma méthodologie sont dans la suite de l’article ! :)

(suite…)

Mon petit NAS de stockage, le meilleur ami du geek

L’élément central de mon réseau domestique se compose d’un assez gros volume de stockage, dont notamment le NAS Dlink DNS-323 de 2 Téraoctets.

Nas Dlink DNS-323 2 To

Nas Dlink DNS-323 2 To

(suite…)

Gérer vos mots de passe avec KeePass

Je me suis longtemps posé la question de la gestion et du stockage des mots de passe. Plusieurs problématiques se posaient :

  • comment générer rapidement des mots de passe ?
  • stocker de manière sécurisée ces mots de passe ?
  • comment en assurer la gestion (classement, expiration, etc.) ?

C’est alors que je suis tombé sur un soft qui propose une réponse unique à tous ces problèmes : KeePass.

Keepass : gestionnaire de mot de passe

(suite…)