Qu’est-ce que l’archivage de données ?

L’archivage de données - définition

Il existe deux types d’informations numériques : les données d’entrée et les données de sortie. Les utilisateurs fournissent les données d’entrée. Les ordinateurs fournissent les données de sortie. Mais le processeur d’un ordinateur ne peut rien calculer ou produire des données de sortie sans l’entrée de l’utilisateur.

Les utilisateurs peuvent saisir les données d’entrée directement dans un ordinateur. Cependant, ils ont découvert dès le début de l’ère informatique que la saisie continue et manuelle des données demande beaucoup de temps et d’énergie. Une solution à court terme est la mémoire d’ordinateur, également connue sous le nom de mémoire vive (RAM). Mais sa capacité d’archivage et de conservation de la mémoire sont limitées. Pour la mémoire morte (ROM), comme son nom l’indique, les données peuvent être lues mais pas nécessairement modifiées. Elle contrôle la fonctionnalité de base d’un ordinateur.

Bien que des progrès aient été réalisés dans la mémoire informatique avec la RAM dynamique (DRAM) et la DRAM synchrone (SDRAM), ils sont encore limités par le coût, l’espace et la conservation de la mémoire. Lorsqu’un ordinateur est éteint, la capacité de la RAM à conserver les données s’arrête. La solution ? L’archivage de données.

Avec l’espace d’archivage de données, les utilisateurs peuvent enregistrer des données sur un appareil. Et si l’ordinateur s’éteint, les données sont conservées. Et au lieu de saisir manuellement des données dans un ordinateur, les utilisateurs peuvent demander à l’ordinateur d’extraire des données des périphériques d’archivage. Les ordinateurs peuvent lire les données d’entrée à partir de diverses sources selon les besoins, et ils peuvent ensuite créer et enregistrer la sortie sur les mêmes sources ou d’autres emplacements d’archivage. Les utilisateurs peuvent également partager l’archivage de données avec leurs pairs.

Aujourd’hui, les organisations et les utilisateurs ont besoin d’archivage de données pour répondre aux besoins informatiques de haut niveau actuels tels que les projets Big Data, l’intelligence artificielle (IA), l’apprentissage automatique et l’Internet des objets (IoT). Et l’autre aspect de ce besoin de stocker des quantités énormes de données est la protection contre la perte de données en raison d’une catastrophe naturelle, d’un échec ou d’une fraude. Ainsi, pour éviter la perte de données, les entreprises peuvent également utiliser l’archivage de données comme solutions de sauvegarde.

Fonctionnement de l’archivage de données
En termes simples, les ordinateurs modernes, ou terminaux, se connectent à des périphériques d’archivage soit directement, soit via un réseau. Les utilisateurs demandent aux ordinateurs d’accéder aux données de ces dispositifs d’archivage et également de les stocker. Cependant, il existe deux piliers fondamentaux à l’archivage de données : la forme sous laquelle les données sont prises et les appareils sur lesquels les données sont enregistrées et stockées.

Dispositifs d’archivage des données

Pour stocker des données, quel que soit leur forme, les utilisateurs ont besoin de périphériques d’archivage. Les périphériques d’archivage de données se répartissent en deux grandes catégories : Archivage en zone directe et archivage en réseau.

L’archivage en zone directe, également connu sous le nom d’archivage direct (DAS), est comme son nom l’indique. Cet archivage est souvent dans la zone immédiate et directement connecté à la machine informatique qui y accède. Souvent, c’est la seule machine connectée. Le DAS peut également fournir des services de sauvegarde locaux corrects, mais le partage est limité. Les dispositifs DAS comprennent des disquettes, disques optiques - disques compacts (CD) et disques vidéo numériques (DVD)- disques durs (HDD), lecteurs flash et lecteurs SSD.

L’archivage en réseau permet à plus d’un ordinateur d’y accéder via un réseau, ce qui facilite le partage de données et la collaboration. Sa capacité d’archivage hors site le rend également mieux adapté aux sauvegardes et à la protection des données. Deux configurations d’archivage réseau communes sont l’archivage connecté au réseau (NAS) et le réseau d’archivage (SAN).

Le NAS est souvent un dispositif unique composé de conteneurs d’archivage redondants ou d’un réseau redondant de disques indépendants (RAID). L’archivage SAN peut être un réseau de plusieurs appareils de différents types, y compris l’archivage SSD et flash, l’archivage hybride, l’archivage cloud hybride, les logiciels et appareils de sauvegarde et l’archivage sur cloud. Voici comment NAS et SAN diffèrent :

NAS

Périphérique d’archivage unique ou RAI
Système d’archivage
Réseau Ethernet TCP/IP
Utilisateurs limités
Vitesse Limitée
Options d’expansion limitées
Coût réduit et installation facile

SAN

Réseau de plusieurs appareils
Système d’archivage en blocs
Réseau Fibre Channel
Optimisé pour plusieurs utilisateurs
Performance plus rapide
Hautement expansible
Coût plus élevé et configuration complexe

Types de périphériques d’archivage

SSD et mémoire flash

La mémoire flash est une technologie à semi-conducteurs qui utilise des puces de mémoire flash pour écrire et stocker des données. Un lecteur flash à disque SSD stocke des données à l’aide d’une mémoire flash. Par rapport aux disques durs, un système à semi-conducteurs n’a pas de pièces mobiles et, par conséquent, moins de latence, donc moins de disques SSD sont nécessaires. Comme la plupart des disques SSD modernes sont basés sur le flash, la mémoire flash est synonyme d’un système à semi-conducteurs.

Explorer la mémoire flash

Archivage hybride

Les disques SSD et flash offrent un débit plus élevé que les disques durs, mais les baies 100 % flash peuvent être plus onéreuses. De nombreuses organisations adoptent une approche hybride, mélangeant la vitesse du flash avec la capacité d’archivage des disques durs. Une infrastructure d’archivage équilibrée permet aux entreprises d’appliquer la bonne technologie pour différents besoins d’archivage. Elle offre un moyen économique de passer des disques durs traditionnels sans passer entièrement au flash.

Découvrez l’archivage hybride

Archivage dans le Cloud

L’archivage dans le cloud offre une alternative économique et évolutive à l’archivage de fichiers sur des disques durs ou des réseaux d’archivage sur site. Les fournisseurs de services cloud vous permettent d’enregistrer des données et des fichiers dans un emplacement hors site auquel vous accédez via l’Internet public ou une connexion réseau privé dédiée. Le fournisseur héberge, sécurise, gère et maintient les serveurs et l’infrastructure associée et s’assure que vous avez accès aux données quand vous en avez besoin.

En savoir plus sur l’archivage cloud

Archivage cloud hybride

L’archivage cloud hybride combine des éléments de cloud privé et public. Avec l’archivage cloud hybride, les entreprises peuvent choisir sur quel cloud stocker des données. Par exemple, les données hautement réglementées soumises à des exigences strictes d’archivage et de réplication sont généralement plus adaptées à un environnement cloud privé. Alors que les données moins sensibles peuvent être stockées dans un cloud public. Certaines organisations utilisent des clouds hybrides pour compléter leurs réseaux d’archivage internes avec l’archivage dans un cloud public.

Explorer l’archivage cloud hybride

Logiciels et appareils de sauvegarde

L’archivage et les appareils de sauvegarde protègent les données contre les catastrophes naturelles, les défaillances techniques ou les fraudes. Ils font des copies périodiques de données et d’applications sur un appareil secondaire distinct, puis utilisent ces copies pour la reprise après sinistre. Les appareils de sauvegarde vont des disques durs et SSD aux lecteurs de bandes en passant par les serveurs, mais le stockage de sauvegarde peut également être offert en tant que service, également appelé sauvegarde en tant que service (BaaS). Comme la plupart des solutions en tant que service, BaaS fournit une option à faible coût pour protéger les données, en les enregistrant dans un emplacement distant avec évolutivité.

Explorer la sauvegarde et la restauration des données

Formes d’archivage des données

Les données peuvent être enregistrées et stockées sous trois formes principales : Archivage de fichiers, archivage en blocs et archivage d’objets.

Archivage de fichiers

L’archivage de fichiers, également appelé archivage au niveau fichier ou basé sur des fichiers, est une méthodologie d’archivage hiérarchique utilisée pour organiser et stocker les données. En d’autres termes, les données sont stockées dans des fichiers, les fichiers sont organisés dans des dossiers et les dossiers sont organisés selon une hiérarchie de répertoires et de sous-répertoires.

En savoir plus sur l’archivage de fichiers

Archivage en blocs

L’archivage en blocs, aussi appelé archivage par blocs, est une technologie utilisée pour stocker les données en blocs. Les blocs sont ensuite stockés sous forme de pièces séparées, chacune avec un identifiant unique. Les développeurs favorisent l’archivage en blocs pour les situations informatiques qui nécessitent un transfert de données rapide, efficace et fiable.

En savoir plus sur l’archivage en blocs

Archivage d’objets

L’archivage d’objets, ou archivage basé sur les objets, est une architecture d’archivage de données permettant de gérer de grandes quantités de données non structurées. Ces données ne sont pas conformes à, ou ne peuvent pas être organisées facilement dans une base de données relationnelle traditionnelle avec des lignes et des colonnes. Par exemple, des courriels, des vidéos, des photos, des pages Web, des fichiers audio, des données de capteurs et d’autres types de médias et de contenu Web (textuel ou non textuel).

En savoir plus sur l’archivage objet

Archivage de données pour les entreprises

La mémoire informatique et la mémoire locale peuvent ne pas fournir suffisamment d’archivage, de protection d’archivage, d’accès pour plusieurs utilisateurs, de vitesse et de performances pour les applications d’entreprise. Ainsi, la plupart des organisations emploient une forme de SAN en plus d’un système d’archivage NAS.

SAN
Parfois appelé le réseau derrière les serveurs, un SAN est un réseau spécialisé à haut débit qui connecte les serveurs et les périphériques d’archivage. Il se compose d’une infrastructure de communication qui fournit des connexions physiques permettant à un dispositif tout-à-tout de passer à travers le réseau en utilisant des éléments interconnectés, tels que des commutateurs et des directeurs. Le SAN peut également être vu comme une extension du concept de bus d’archivage. Ce concept permet aux dispositifs d’archivage et aux serveurs de s’interconnecter en utilisant des éléments similaires, tels que des réseaux locaux (LAN) et des réseaux étendus (WAN). Un SAN comprend également une couche de gestion qui organise les connexions, les éléments d’archivage et les systèmes informatiques. Cette couche assure des transferts de données sûrs et robustes.

Traditionnellement, seul un nombre limité de périphériques d’archivage pouvait se connecter à un serveur. Alternativement, un SAN introduit une flexibilité de réseau permettant à un serveur, ou à de nombreux serveurs hétérogènes à travers de multiples centres de données, de partager un utilitaire d’archivage commun. Le SAN élimine également la connexion dédiée traditionnelle entre un serveur et l’archivage et le concept que le serveur possède et gère effectivement les périphériques d’archivage. Ainsi, un réseau peut comprendre de nombreux dispositifs d’archivage, y compris le disque, la bande magnétique et l’archivage optique. Et l’utilitaire d’archivage peut être situé loin des serveurs qu’il utilise.

Composants SAN
L’infrastructure d’archivage est le fondement sur lequel repose l’information. Par conséquent, l’infrastructure d’archivage doit soutenir les objectifs et le modèle de fonctionnement de l’entreprise. Une infrastructure SAN améliore la disponibilité du réseau, l’accessibilité des données et la facilité de gestion du système. Dans cet environnement, déployer des périphériques d’archivage plus nombreux et plus rapides ne suffit pas. Un bon SAN commence par un bon design.

Les principaux composants d’un SAN sont les canaux Fibre optique, les serveurs, les utilitaires d’archivage et le matériel et les logiciels de réseau.

Fibre Channel

Le premier élément à prendre en compte dans toute implémentation SAN est la connectivité des composants d’archivage et de serveur, qui utilisent généralement Fibre Channel. Les réseaux SAN, tels que les LAN, interconnectent les interfaces d’archivage en de nombreuses configurations réseau et sur de plus longues distances.

Infrastructures serveur

L’infrastructure serveur est la raison sous-jacente de toutes les solutions SAN, et cette infrastructure comprend un mélange de plateformes serveur. Avec des initiatives telles que la consolidation des serveurs et l’e-commerce, le besoin de réseaux SAN augmente, ce qui accroît l’importance de l’archivage en réseau.

Système d’archivage

Un système d’archivage peut être constitué de systèmes de disques et de systèmes de bandes. Le système de disques peut inclure des disques durs, des disques SSD ou des lecteurs Flash. Le système d’archivage sur bandes peut comprendre des lecteurs de bandes, des chargeurs automatiques de bandes et des bibliothèques de cassettes.

Système de réseau

La connectivité SAN se compose de composants matériels et logiciels qui interconnectent les périphériques d’archivage et les serveurs. Le matériel peut comprendre des concentrateurs (hubs), des commutateurs, des directeurs et des routeurs.

Introduction aux réseaux d’archivage SAN (11,6 Mo)

Solutions

Options d’archivage de données

Transformez et améliorez votre entreprise avec une solution d’archivage complète qui intègre et actualise votre infrastructure informatique existante, tout en réduisant les coûts.

Explorer l’archivage de données

Mémoire flash

Grâce à la technologie 100 % flash du système de plateforme unique, éliminez les silos disparates en simplifiant la gestion de vos données sur site ou dans le cloud.

Consultez les solutions d’archivage flash

Virtualisation de l’archivage

Réduisez les coûts et la complexité avec la virtualisation de l’archivage. L’archivage virtualisé vous permet de centraliser la gestion pour simplifier les environnements mixtes et découvrir la capacité cachée.

Découvrez la virtualisation de l’archivage

Technologie d’archivage sur bandes

Explorez une technologie d’archivage sur bandes fiable avec airgap, rétention à long terme, cyber-résilience et efficacité énergétique à moindre coût par rapport aux autres médias. Préservez, protégez et sécurisez vos données de manière rentable avec l’archivage sur bandes IBM.

Afficher les options d’archivage sur bandes

Archivage défini par logiciel (SDS)

L’archivage défini par logiciel signifie des solutions d’archivage plus intelligentes. Détachez l’intelligence et les fonctionnalités du matériel d’archivage pour obtenir la meilleure configuration d’archivage sans compromis.

Explorer l’archivage défini par logiciel

Archivage dans un cloud privé

Obtenez l’archivage cloud privé dont vous aurez besoin pour atteindre vos objectifs.

Découvrez l’archivage sur cloud privé

Ressources

Dernières informations sur l’archivage de données

Retrouvez les dernières informations, actualités et mises à jour techniques sur le blog Serveurs et Archivage. Découvrez les nouvelles améliorations apportées aux solutions d’archivage et de protection des données modernes ou comment les solutions et la technologie d’archivage de données sur bandes aident les clients à relever les défis en matière de coûts d’archivage et de protection des données.

Formation à l’archivage et centre d’apprentissage

Trouvez une formation spécifique à l’archivage dans le centre de formation IBM. Apprenez les nouveautés de l’archivage, commencez un parcours d’apprentissage, gagnez des badges ou explorez vous-même. Lire plus d’articles sur l’archivage.

Qu’est-ce que l’archivage flash ?

Découvrez l’archivage flash et les principaux types d’archivage flash utilisés en entreprise. Lire les cas d’utilisation et comment l’archivage flash répond aux exigences de l’entreprise. Et revisitez son histoire et les tendances à venir.

Communauté d’archivage en ligne

Lisez les dernières discussions dans la communauté d’archivage IBM. Vous pouvez trouver les dernières discussions, les derniers blogs et les derniers fichiers liés à l’archivage de données. Rencontrez, partagez, discutez et apprenez plus en tant que membre de la communauté.