Pourquoi les supports de stockage ne font (presque) jamais la taille annoncée ?
Comme tout le monde, vous vous êtes certainement posé la question de savoir pourquoi un élément de stockage (disque dur, clé USB, carte mémoire, etc.) ne fait jamais la taille annoncée ?
Vous achetez une clé USB de 4 Go, mais elle ne fait que 3,72 Go une fois connectée (et formattée) à votre PC…où est ce trou noir qui engloutit l’espace de stockage ?
Illustration avec l’exemple ci-dessous : un vieux disque externe, vendu comme disque de 160 Go, n’annonce que 149 Go une fois formatté (sur Windows 7)…mais où ont disparu les 11 Go manquants ?
Cette différence vient de la différence qui existe entre les préfixes binaires et les préfixes décimaux : mais bordel, kézako ?
Les capacités de mémoires d’ordinateurs sont calculées au moyen de puissances de 2 (du binaire). Par exemple : 1024 = 210. Cependant, les professionnels du secteur informatique (ces boulets dont je fais parti) ont jugé plus simple d’utiliser les préfixes SI en changeant légèrement leurs valeurs (par exemple, kilo = 1024 au lieu de 1000) : l’habitude est ensuite restée.
C’est la raison pour laquelle le besoin s’est fait sentir de créer les préfixes binaires. Bien qu’ils existent depuis 1998, les deux systèmes cohabitent actuellement, ce qui permet d’entretenir la confusion pour le grand public.
D’autant que les fabricants de stockage ont bien compris l’intérêt d’utiliser les préfixes SI (décimaux) : ils suivent ainsi la norme de 1998, mais leurs acheteurs qui ne la suivent pas croient acheter des disques de plus grandes capacités que ce qui est indiqué.
Dans le système numérique « normal », on utilise les préfixes (kilo, mega, giga, etc.) pour faciliter l’utilisation des multiples de 10 : ainsi, 100 000 000 (cent millions) peut être transposé à 100 mega.
Les préfixes binaires sont obtenus en prenant la première syllabe de chaque préfixe, et en suffixant « bi » (pour binaire). Cela donne :
- kibi : symbole Ki (ordre de grandeur 103, valeur exacte 210) appelé par abus « kilo (k) »,
- mébi : symbole Mi (ordre de grandeur 106, valeur exacte 220) appelé par abus « méga (M) »,
- gibi : symbole Gi (ordre de grandeur 109, valeur exacte 230) appelé par abus « giga (G) »,
- tébi : symbole Ti (ordre de grandeur 1012, valeur exacte 240) appelé par abus « téra (T) »,
- etc.
Donc, on ne dit pas gigaoctet, mais gibioctet.
Voici un tableau récapitulatif des différences : en rouge, vous retrouvez le pourcentage de différence entre la représentation métrique et la représentation binaire. Pour 1 To, cette différence atteint 9%, soit tout de même 90 Go.
Démonstration : un fabricant va utiliser le système (préfixes décimaux) qui l’avantage le mieux, puisque le nombre obtenu sera le plus grand.
Cela représentera pour un disque de 160 Go :
- en préfixes décimaux (utilisé par les fabricants) : 160 x 109,
- en préfixes binaires : 149 x 230,
soit, une différence de 11 Go.
Attention : ceci n’est pas commun à tous les systèmes d’exploitation. Par exemple, Ubuntu utilise le système « officiel » (binaire, en puissance de 2), alors que Windows utilise (encore) le système décimal. Tout dépend donc de l’application et/ou du système d’exploitation.
Et pour le fun, quelques faits à propos du stockage :
- A terabyte is equal to the number of human heartbeats on the Earth every 2.4 minutes. In seconds, a terabyte is equal to 32,000 years. A terabyte of paper stacked would be 66,000 miles high. If a terabyte of pencils were placed side by side, they would stretch 4.5 million miles. One terabyte is equal to 16 days of continuously running DVD movies or 8,000 times more data than the human brain retains in a lifetime.
- To store a gigabyte’s worth of data just 20 years ago required a refrigerator-sized machine weighing 500 pounds. Today, that same gigabyte’s worth of data resides comfortably on a disk smaller than a coin.
- IBM is helping the European Organization for Nuclear Research to create a data file system to handle up to a petabyte (a million gigabytes) of data, which is the equivalent to the information stored in 20 million four-drawer filing cabinets or 500 million floppy disks or 1.5 million CD-ROMs.
Sources :
- Wikipedia : Octet et Préfixe binaire,
- CEI 60027-2,
- A few facts about IBM storage.