Solutions de stockage de données

Posted Posted by Patrice Guay in Web hosting     Comments No comments
avril
3

Il existe trois principales technologies pour le stockage des données sur disque dur :

  • stockage local (DAS)
  • stockage sur réseau standard (NAS)
  • stockage sur réseau spécialisé (SAN)

Chacune de ces technologies a ses forces et ses faiblesses. Alors que le stockage local est le plus répandu et qu’il offre potentiellement un haut niveau de performance, le stockage sur réseau offre la possibilité de partager les données entre différents serveurs. Cette dernière fonctionnalité est de plus en plus recherchée que ce soit pour synchroniser les données entre différents serveurs, pour consolider l’espace disque ou pour permettre des architectures de virtualisation avancées.

Disques durs

Au cours des dernières années, la taille des disques durs a augmenté rapidement. Une capacité de stockage de quelques téraoctets n’est plus dispendieuse à plus forte raison si l’espace de stockage est créé avec des disques SATA. Toutefois, l’utilisation de disques SATA pour fournir l’espace de stockage résulte en de faibles performances I/O. L’utilisation de disques SAS avec une vitesse de rotation de 15000 tours/min plutôt que des disques SATA 7200 tours/min procure jusqu’à deux fois plus de performances I/O. Les disques SSD peuvent être utilisés pour obtenir encore plus de performances I/O.

Le tableau suivant présente les performances de base des différents types de disques durs en terme de MB/s et de IOPS (Input/Output Operation per Second). Ces données, tirées du site tom’s hardware, peuvent être utiles pour estimer le niveau de performance d’une solution de stockage donnée :

Pour un serveur de base de données, une performance I/O élevée est désirable alors que l’espace disque requis est généralement faible. L’utilisation de disques SAS ou SSD de faible taille sera plus utile que des disques SATA dans ce cas. Pour les serveurs de fichiers, un débit élevé est préférable surtout s’il s’agit de fichiers de large taille (fichiers musicaux, vidéos, etc).

Par ailleurs, les disques peuvent être arrangés en configuration RAID afin d’obtenir un niveau de performance plus élevé que celui offert par un disque seul.

DAS (Direct Attached Storage)

Le stockage local correspond aux disques directement installés dans un serveur. Il s’agit évidemment du type de stockage le plus répandu puisque la majorité des serveurs, bien qu’ils puissent être connecté à un système de stockage réseau, accèdent aux fichiers de leur système d’exploitation via des disques locaux. Les serveurs démarrant directement à partir d’un SAN sont une exception à cette règle puisqu’ils peuvent fonctionner sans disque dur local.

Le stockage de type DAS est très performant car les disques sont connectés avec le processeur du serveur via le contrôleur intégré à la carte mère ou une carte RAID matérielle. Il s’agit donc d’une connexion à haut débit et exclusive puisqu’elle n’est pas partagée avec d’autres serveurs.

NAS (Network Attached Storage)

Un système de stockage sur réseau standard rend disponible des fichiers via un réseau IP. Les protocoles de partage de fichiers suivants sont habituellement offerts :

  • CIFS : Common Internet File System (natif sous système d’exploitation Microsoft Windows)
  • NFS : Netowork File System (natif sous système d’exploitation Linux)
  • AFP : Apple File Protocol (natif sous système d’exploitation Apple Mac OS X)
  • WebDAV : Web-based Distributed Authoring and Versioning (extension du protocole HTTP)

Un simple serveur de fichiers peut être converti en système de stockage NAS. Une partie du stockage local est alors rendue disponible aux autres serveurs du réseau. Des solutions commerciales sont également disponibles et peuvent offrir des fonctionnalités supplémentaires :

  • redondance entre les éléments fondamentaux du système (contrôleur, connectivité réseau, alimentation électrique)
  • optimisation des protocoles de partage de fichiers
  • mise en cache des données fréquemment consultées
  • gestion du système via une interface web

La performance d’un système NAS est tributaire de plusieurs facteurs :

  • Type de disques durs utilisés (SATA, SAS ou SSD)
  • Configuration RAID des disques durs
  • Nombre de disques durs
  • Connectivité réseau
  • Type de fichiers partagés

Le niveau de performance de la solution NAS dépend du facteur limitatif. Par exemple, un ensemble de seize (16) disques durs SATA en configuration RAID 10 peut offrir un débit de données supérieur à 1 Gb/s. Par contre, si ces disques sont placés dans un système NAS ayant une connectivité 1 Gb/s vers le réseau, la performance du système ne pourra pas dépasser 1 Gb/s faute d’une connectivité réseau insuffisante. Le facteur limitatif est alors la connectivité réseau. En utilisant une connectivité réseau 10 Gb/s, la performance du système sera augmentée. L’amélioration d’un autre facteur que la connectivité réseau n’aurait eu pratiquement aucun effet sur la performance du système.

SAN (Storage Area Network)

Un système de stockage sur réseau spécialisé (SAN) utilise les protocoles iSCSI ou Fibre Channel pour partager un espace de stockage. Cette solution de stockage se distingue du NAS par l’accès bas niveau qui est offert. Dans le cas d’un NAS, la ressource de stockage est directement connectée au réseau IP alors que dans le cas d’un SAN, l’espace de stockage est accessible en mode bloc par le système de fichiers des serveurs. Chaque serveur voit l’espace disque d’un SAN comme son propre disque dur. Le trafic sur un réseau SAN suit des conventions similaires à celles en vigueur lors de la communication vers un système de stockage local. Un volume en provenance d’un SAN connecté sur un serveur pourra donc être formaté de la même manière qu’un disque local peut l’être. Cela n’est évidemment pas possible dans le cas d’un volume en provenance d’un NAS.

Au cours des dernières années, le protocole iSCSI est devenu de plus en plus attrayant. Le protocole Fibre Channel existe encore mais tend à disparaître au profit du protocole iSCSI. Différentes raisons expliquent ce phénomène :

  • compatibilité avec l’équipement réseau IP standard
  • généralisation des connectivités 1 Gb/s et 10 Gb/s
  • faible coût des équipements (câbles, commutateurs, routeurs) sur réseau IP
  • similitude des connaissances requises par les administrateurs réseau

Le SAN permet de répondre à certains besoins particuliers :

  • Formation d’un cluster Microsoft Windows (ActiveDirectory, SQL, Exchange, etc.) pour obtenir un niveau de redondance élevé
  • Solutions de virtualisation (VMware, Xen) permettant le déplacement de machines virtuelles d’un serveur à un autre
  • Solution de base de données avec réplication entre deux sites distants
  • Consolidation de l’espace disque pour un grand nombre de serveurs
  • etc.

En dehors de ces besoins particuliers, l’utilisation d’une solution NAS permet généralement d’obtenir un niveau de performance similaire à un meilleur coût.

Conclusion

La solution de stockage conventionnelle DAS (disques durs locaux) offre un haut niveau de performance. Le coût de cette solution est également inférieur à celui des solutions de stockage réseau NAS et SAN. Pour vos besoins de stockage réseau, la solution NAS permet le partage de fichiers entre différents serveurs alors qu’une solution SAN rend disponible un espace de stockage accessible en mode bloc.

Post comment

Advertisements