Où les données sont stockées ?

Publié le 13/03/2021 22:14

Durée de la vidéo : 2 min.

Que deviennent les données stockées dans les data centers en cas d’incendie ? France Télévisions a enquêté, pour le journal de 20 Heures du samedi 13 mars. 

Mardi 9 mars à Strasbourg (Bas-Rhin), un incendie survenu dans un centre de données a paralysé des milliers d’entreprises. Plus de trois millions de sites internet sont devenus inaccessibles. Ces centres sont utilisés au quotidien par les Français. Pour conserver une photo ou une vidéo en ligne, il faut par exemple l’envoyer vers le cloud, censé protéger les documents. Ils sont en réalité stockés dans des centres de données, en France ou à l’étranger. Il en existe plus de 4 700 dans le monde. Des dizaines de milliers de disques durs fonctionnent 24 heures sur 24 dans les hangars, reliés au réseau mondial. 

Entreprises comme particuliers payent pour ce service, de quelques euros par mois à quelques milliers. "Ils vont doubler absolument tout ce qui pourrait connaître une avarie, qu’il s’agisse du service du réseau électrique, du service de ventilation et de climatisation, (…) des équipes (…) et bien évidemment des systèmes de sécurité incendie", explique Faïz Djellouli, dirigeant de Holiseum. Comme le risque zéro n’existe pas, il est cependant conseillé de faire des sauvegardes, et de les stocker en plus chez plusieurs hébergeurs en ligne.

jeudi 7 mai 2020 par Pedro Vasconcelos

Lorsque l’on pense au cloud computing, la première chose qui vient à l’esprit sont les applications courantes telles que Google Drive, Dropbox ou iCloud, mais cela va en fait beaucoup plus loin. Tout d’abord, il faut comprendre ce que le cloud computing est vraiment. Pour résumer, il s’agit de tout ce qui concerne le stockage et la récupération de vos données personnelles (ou d’entreprise) à partir de votre propre petit espace sur Internet. Rien n’est stocké sur votre disque dur local, et celles-ci sont accessibles depuis n’importe où, depuis n’importe quel appareil et à tout moment.

Si cela peut paraître un peu surréaliste, pensez à un service email que vous utilisez déjà tel que Gmail, Yahoo, Hotmail, etc. Aucun des emails que vous envoyez ou recevez n’occupe d’espace sur votre disque dur local, ils sont stockés sur les serveurs du fournisseur de service : il s’agit d’une forme de cloud computing. Pour aller plus loin, pensez au fait que vous pouvez vous connecter et accéder à vos emails depuis n’importe quel ordinateur ou smartphone. Ceci est rendu possible uniquement par le cloud.

Cependant, de nombreuses personnes ne réalisent pas que malgré le fait qu’elles se trouvent dans le « cloud », vos données doivent tout de même être stockées physiquement sur un appareil quelque part. Que ce soit sur mémoire flash ou sur disque dur traditionnel, les sociétés qui proposent ce service doivent avoir à disposition des serveurs de très grande capacité dédiés au stockage de vos données. Ceux-ci sont généralement appelés « fermes de serveurs » et sont essentiellement de vastes entrepôts remplis de serveurs fonctionnant 24h/24 pendant toute l’année. Ceci soulève un certain nombre de questions : où mes données sont-elles réellement stockées ? Qui a accès à mes données et mes données sont-elles en sécurité ?

Où mes données sont-elles réellement stockées ?

En ce qui concerne le lieu où vos données sont stockées, vous ne le saurez sans doute jamais vraiment, à moins que vous ne fassiez quelques recherches. Le fournisseur peut très bien être basé aux États-Unis, par exemple, et ses serveurs se trouver en Chine, au Royaume-Uni, ou n’importe où ailleurs dans le monde. De nombreuses sociétés délocalisent leurs fermes de serveurs dans le but de réduire les coûts, c’est pourquoi il est difficile de savoir où se trouvent vraiment vos données et le fournisseur de service cloud ne révèle pas nécessairement ce genre d’information.

Qui a accès à mes données ?

Un autre point à prendre en considération est qui a accès à vos données. Les sociétés réputées ont essayé et testé des systèmes de sécurité pour garantir que vous seul avez accès à vos données. Il existe des sociétés anonymes sur le marché proposant le même espace de stockage et la même fonctionnalité, et que vous décidiez de leur faire confiance ou non a son importance. Par ailleurs, vous devez également avoir une idée des protections en place pour que vos données soient sécurisées et toujours accessibles. Les fournisseurs de stockage sur cloud les plus réputés répliqueront vos données plusieurs fois sur différents serveurs pour garantir qu’en cas de catastrophe, vos fichiers sont en sûreté. Cela ne signifie pas pour autant que vos données seront en sûreté à 100 % et de façon permanente : les catastrophes naturelles, les incendies et les actions malveillantes, par exemple, sont des événements que vous pouvez envisager, mais pas nécessairement éviter.

N’oubliez pas…

Le point essentiel à retenir est que malgré que vos données ne soient pas stockées physiquement sur votre disque dur local, celles-ci sont tout de même stockées quelque part, et il est important de garder à l’esprit qu’elles restent exposées aux mêmes problèmes et pannes que le disque dur de votre ordinateur. Les fermes de serveurs ne sont pas infaillibles, les supports de stockage peuvent tomber en panne, les grandes sociétés peuvent être l’objet d’une attaque de hackers et les données peuvent être supprimées aussi facilement sur un serveur que sur votre ordinateur, donc restez prudent en ce qui concerne le stockage de vos fichiers importants et confidentiels sur le cloud.

Où les données sont stockées ?

La multiplication des équipements ‘intelligents’ et des pratiques connectées transforme le Cloud en une option de plus en plus attractive pour stocker les données… Jusqu’à un certain point, car le stockage sur disques durs restera attractif !

En matière de stockage de données, l’année 2020 s’annonce comme une année charnière, où les données des consommateurs représenteront la part la plus faible des données stockées, où celles stockées dans le cloud prendront la tête, tandis que les données stockées dans l’entreprise continueront d’être à l’équilibre.

Où les données sont stockées ?

Le modèle économique comme la gestion des données vont changer avec leur localisation. La donnée doit être stockée et archivée de manière à fournir un niveau de performance, et une capacité à appliquer analytiques et intelligence. Et cela à un coût et avec la sécurité qui iront bien.

Pour autant, certains silos demeureront à l’abri des murs de l’entreprises. Des localisations de la donnée, dans des divisions physiquement ou culturellement éloignées, sur des sites de partenaires, ou plus simplement par leur localisation, resteront inaccessibles.

Où les données sont stockées ?

C’est pourquoi, comme l’indique le schéma ci-dessus, malgré sa forte progression aujourd’hui, le stockage de données dans le cloud public ne l’emportera pas et trouvera une certaine stabilité. Une partie des données dans le cloud public devrait d’ailleurs provenir de partenaires extérieurs. Elle seront exploitées mais ne seront pas produites en interne…

S’appuyant en particulier sur l’IoT (Internet des Objets) et l’IA (Intelligence Artificielle), en 2025, 80% des données produites dans le monde le seront par les entreprises.

Tout cela explique pourquoi la demande d’équipements de stockage de données demeurera forte et continuera de progresser. Avec une place réservée aux disques durs traditionnels - 80% des entreprises investiront encore dans le HDD - qui face au stockage sur mémoire flash continueront de bénéficier de l’avantage du prix le plus attractif.

Où les données sont stockées ?

Source : Rapport “Data Age 2015” par IDC pour Seagate, novembre 2018

Image d’entête 1054893186 @ iStock Photo diki darmawan

L’archivage de données fait référence aux supports magnétiques, optiques ou mécaniques qui enregistrent et conservent des informations numériques pour des opérations en cours ou futures.

Où les données sont stockées ?

L’archivage de données - définition

Il existe deux types d’informations numériques : les données d’entrée et les données de sortie. Les utilisateurs fournissent les données d’entrée. Les ordinateurs fournissent les données de sortie. Mais le processeur d’un ordinateur ne peut rien calculer ou produire des données de sortie sans l’entrée de l’utilisateur. 

Les utilisateurs peuvent saisir les données d’entrée directement dans un ordinateur. Cependant, ils ont découvert dès le début de l’ère informatique que la saisie continue et manuelle des données demande beaucoup de temps et d’énergie. Une solution à court terme est la mémoire d’ordinateur, également connue sous le nom de mémoire vive (RAM). Mais sa capacité d’archivage et de conservation de la mémoire sont limitées. Pour la mémoire morte (ROM), comme son nom l’indique, les données peuvent être lues mais pas nécessairement modifiées. Elle contrôle la fonctionnalité de base d’un ordinateur. 

Bien que des progrès aient été réalisés dans la mémoire informatique avec la RAM dynamique (DRAM) et la DRAM synchrone (SDRAM), ils sont encore limités par le coût, l’espace et la conservation de la mémoire. Lorsqu’un ordinateur est éteint, la capacité de la RAM à conserver les données s’arrête. La solution ? L’archivage de données. 

Avec l’espace d’archivage de données, les utilisateurs peuvent enregistrer des données sur un appareil. Et si l’ordinateur s’éteint, les données sont conservées. Et au lieu de saisir manuellement des données dans un ordinateur, les utilisateurs peuvent demander à l’ordinateur d’extraire des données des périphériques d’archivage. Les ordinateurs peuvent lire les données d’entrée à partir de diverses sources selon les besoins, et ils peuvent ensuite créer et enregistrer la sortie sur les mêmes sources ou d’autres emplacements d’archivage. Les utilisateurs peuvent également partager l’archivage de données avec leurs pairs. 

Aujourd’hui, les organisations et les utilisateurs ont besoin d’archivage de données pour répondre aux besoins informatiques de haut niveau actuels tels que les projets Big Data, l’intelligence artificielle (IA), l’apprentissage automatique et l’Internet des objets (IoT). Et l’autre aspect de ce besoin de stocker des quantités énormes de données est la protection contre la perte de données en raison d’une catastrophe naturelle, d’un échec ou d’une fraude. Ainsi, pour éviter la perte de données, les entreprises peuvent également utiliser l’archivage de données comme solutions de sauvegarde. 

Fonctionnement de l’archivage de données
En termes simples, les ordinateurs modernes, ou terminaux, se connectent à des périphériques d’archivage soit directement, soit via un réseau. Les utilisateurs demandent aux ordinateurs d’accéder aux données de ces dispositifs d’archivage et également de les stocker. Cependant, il existe deux piliers fondamentaux à l’archivage de données : la forme sous laquelle les données sont prises et les appareils sur lesquels les données sont enregistrées et stockées.

Dispositifs d’archivage des données

Pour stocker des données, quel que soit leur forme, les utilisateurs ont besoin de périphériques d’archivage. Les périphériques d’archivage de données se répartissent en deux grandes catégories : Archivage en zone directe et archivage en réseau. 

L’archivage en zone directe, également connu sous le nom d’archivage direct (DAS), est comme son nom l’indique. Cet archivage est souvent dans la zone immédiate et directement connecté à la machine informatique qui y accède. Souvent, c’est la seule machine connectée. Le DAS peut également fournir des services de sauvegarde locaux corrects, mais le partage est limité. Les dispositifs DAS comprennent des disquettes, disques optiques - disques compacts (CD) et disques vidéo numériques (DVD)- disques durs (HDD), lecteurs flash et lecteurs SSD. 

L’archivage en réseau permet à plus d’un ordinateur d’y accéder via un réseau, ce qui facilite le partage de données et la collaboration. Sa capacité d’archivage hors site le rend également mieux adapté aux sauvegardes et à la protection des données. Deux configurations d’archivage réseau communes sont l’archivage connecté au réseau (NAS) et le réseau d’archivage (SAN). 

Le NAS est souvent un dispositif unique composé de conteneurs d’archivage redondants ou d’un réseau redondant de disques indépendants (RAID). L’archivage SAN peut être un réseau de plusieurs appareils de différents types, y compris l’archivage SSD et flash, l’archivage hybride, l’archivage cloud hybride, les logiciels et appareils de sauvegarde et l’archivage sur cloud. Voici comment NAS et SAN diffèrent :

NAS

  • Périphérique d’archivage unique ou RAI
  • Système d’archivage
  • Réseau Ethernet TCP/IP
  • Utilisateurs limités
  • Vitesse Limitée
  • Options d’expansion limitées
  • Coût réduit et installation facile

SAN

  • Réseau de plusieurs appareils
  • Système d’archivage en blocs
  • Réseau Fibre Channel
  • Optimisé pour plusieurs utilisateurs
  • Performance plus rapide
  • Hautement expansible
  • Coût plus élevé et configuration complexe

La mémoire flash est une technologie à semi-conducteurs qui utilise des puces de mémoire flash pour écrire et stocker des données. Un lecteur flash à disque SSD stocke des données à l’aide d’une mémoire flash. Par rapport aux disques durs, un système à semi-conducteurs n’a pas de pièces mobiles et, par conséquent, moins de latence, donc moins de disques SSD sont nécessaires. Comme la plupart des disques SSD modernes sont basés sur le flash, la mémoire flash est synonyme d’un système à semi-conducteurs.

Explorer la mémoire flash

Les disques SSD et flash offrent un débit plus élevé que les disques durs, mais les baies 100 % flash peuvent être plus onéreuses. De nombreuses organisations adoptent une approche hybride, mélangeant la vitesse du flash avec la capacité d’archivage des disques durs. Une infrastructure d’archivage équilibrée permet aux entreprises d’appliquer la bonne technologie pour différents besoins d’archivage. Elle offre un moyen économique de passer des disques durs traditionnels sans passer entièrement au flash.

Découvrez l’archivage hybride

L’archivage dans le cloud offre une alternative économique et évolutive à l’archivage de fichiers sur des disques durs ou des réseaux d’archivage sur site. Les fournisseurs de services cloud vous permettent d’enregistrer des données et des fichiers dans un emplacement hors site auquel vous accédez via l’Internet public ou une connexion réseau privé dédiée. Le fournisseur héberge, sécurise, gère et maintient les serveurs et l’infrastructure associée et s’assure que vous avez accès aux données quand vous en avez besoin.

En savoir plus sur l’archivage cloud

L’archivage cloud hybride combine des éléments de cloud privé et public. Avec l’archivage cloud hybride, les entreprises peuvent choisir sur quel cloud stocker des données. Par exemple, les données hautement réglementées soumises à des exigences strictes d’archivage et de réplication sont généralement plus adaptées à un environnement cloud privé. Alors que les données moins sensibles peuvent être stockées dans un cloud public. Certaines organisations utilisent des clouds hybrides pour compléter leurs réseaux d’archivage internes avec l’archivage dans un cloud public.

Explorer l’archivage cloud hybride

L’archivage et les appareils de sauvegarde protègent les données contre les catastrophes naturelles, les défaillances techniques ou les fraudes. Ils font des copies périodiques de données et d’applications sur un appareil secondaire distinct, puis utilisent ces copies pour la reprise après sinistre. Les appareils de sauvegarde vont des disques durs et SSD aux lecteurs de bandes en passant par les serveurs, mais le stockage de sauvegarde peut également être offert en tant que service, également appelé sauvegarde en tant que service (BaaS). Comme la plupart des solutions en tant que service, BaaS fournit une option à faible coût pour protéger les données, en les enregistrant dans un emplacement distant avec évolutivité.

Explorer la sauvegarde et la restauration des données

Les données peuvent être enregistrées et stockées sous trois formes principales : Archivage de fichiers, archivage en blocs et archivage d’objets.

L’archivage de fichiers, également appelé archivage au niveau fichier ou basé sur des fichiers, est une méthodologie d’archivage hiérarchique utilisée pour organiser et stocker les données. En d’autres termes, les données sont stockées dans des fichiers, les fichiers sont organisés dans des dossiers et les dossiers sont organisés selon une hiérarchie de répertoires et de sous-répertoires.

L’archivage en blocs, aussi appelé archivage par blocs, est une technologie utilisée pour stocker les données en blocs. Les blocs sont ensuite stockés sous forme de pièces séparées, chacune avec un identifiant unique. Les développeurs favorisent l’archivage en blocs pour les situations informatiques qui nécessitent un transfert de données rapide, efficace et fiable.

L’archivage d’objets, ou archivage basé sur les objets, est une architecture d’archivage de données permettant de gérer de grandes quantités de données non structurées. Ces données ne sont pas conformes à, ou ne peuvent pas être organisées facilement dans une base de données relationnelle traditionnelle avec des lignes et des colonnes. Par exemple, des courriels, des vidéos, des photos, des pages Web, des fichiers audio, des données de capteurs et d’autres types de médias et de contenu Web (textuel ou non textuel).

La mémoire informatique et la mémoire locale peuvent ne pas fournir suffisamment d’archivage, de protection d’archivage, d’accès pour plusieurs utilisateurs, de vitesse et de performances pour les applications d’entreprise. Ainsi, la plupart des organisations emploient une forme de SAN en plus d’un système d’archivage NAS.

SAN
Parfois appelé le réseau derrière les serveurs, un SAN est un réseau spécialisé à haut débit qui connecte les serveurs et les périphériques d’archivage. Il se compose d’une infrastructure de communication qui fournit des connexions physiques permettant à un dispositif tout-à-tout de passer à travers le réseau en utilisant des éléments interconnectés, tels que des commutateurs et des directeurs. Le SAN peut également être vu comme une extension du concept de bus d’archivage. Ce concept permet aux dispositifs d’archivage et aux serveurs de s’interconnecter en utilisant des éléments similaires, tels que des réseaux locaux (LAN) et des réseaux étendus (WAN). Un SAN comprend également une couche de gestion qui organise les connexions, les éléments d’archivage et les systèmes informatiques. Cette couche assure des transferts de données sûrs et robustes. 

Traditionnellement, seul un nombre limité de périphériques d’archivage pouvait se connecter à un serveur. Alternativement, un SAN introduit une flexibilité de réseau permettant à un serveur, ou à de nombreux serveurs hétérogènes à travers de multiples centres de données, de partager un utilitaire d’archivage commun. Le SAN élimine également la connexion dédiée traditionnelle entre un serveur et l’archivage et le concept que le serveur possède et gère effectivement les périphériques d’archivage. Ainsi, un réseau peut comprendre de nombreux dispositifs d’archivage, y compris le disque, la bande magnétique et l’archivage optique. Et l’utilitaire d’archivage peut être situé loin des serveurs qu’il utilise.

Composants SAN 
L’infrastructure d’archivage est le fondement sur lequel repose l’information. Par conséquent, l’infrastructure d’archivage doit soutenir les objectifs et le modèle de fonctionnement de l’entreprise. Une infrastructure SAN améliore la disponibilité du réseau, l’accessibilité des données et la facilité de gestion du système. Dans cet environnement, déployer des périphériques d’archivage plus nombreux et plus rapides ne suffit pas. Un bon SAN commence par un bon design. 

Les principaux composants d’un SAN sont les canaux Fibre optique, les serveurs, les utilitaires d’archivage et le matériel et les logiciels de réseau. 

Le premier élément à prendre en compte dans toute implémentation SAN est la connectivité des composants d’archivage et de serveur, qui utilisent généralement Fibre Channel. Les réseaux SAN, tels que les LAN, interconnectent les interfaces d’archivage en de nombreuses configurations réseau et sur de plus longues distances.

L’infrastructure serveur est la raison sous-jacente de toutes les solutions SAN, et cette infrastructure comprend un mélange de plateformes serveur. Avec des initiatives telles que la consolidation des serveurs et l’e-commerce, le besoin de réseaux SAN augmente, ce qui accroît l’importance de l’archivage en réseau.

Un système d’archivage peut être constitué de systèmes de disques et de systèmes de bandes. Le système de disques peut inclure des disques durs, des disques SSD ou des lecteurs Flash. Le système d’archivage sur bandes peut comprendre des lecteurs de bandes, des chargeurs automatiques de bandes et des bibliothèques de cassettes.

La connectivité SAN se compose de composants matériels et logiciels qui interconnectent les périphériques d’archivage et les serveurs. Le matériel peut comprendre des concentrateurs (hubs), des commutateurs, des directeurs et des routeurs.

Transformez et améliorez votre entreprise avec une solution d’archivage complète qui intègre et actualise votre infrastructure informatique existante, tout en réduisant les coûts.

Grâce à la technologie 100 % flash du système de plateforme unique, éliminez les silos disparates en simplifiant la gestion de vos données sur site ou dans le cloud.

Réduisez les coûts et la complexité avec la virtualisation de l’archivage. L’archivage virtualisé vous permet de centraliser la gestion pour simplifier les environnements mixtes et découvrir la capacité cachée.

Explorez une technologie d’archivage sur bandes fiable avec airgap, rétention à long terme, cyber-résilience et efficacité énergétique à moindre coût par rapport aux autres médias. Préservez, protégez et sécurisez vos données de manière rentable avec l’archivage sur bandes IBM.

L’archivage défini par logiciel signifie des solutions d’archivage plus intelligentes. Détachez l’intelligence et les fonctionnalités du matériel d’archivage pour obtenir la meilleure configuration d’archivage sans compromis.