Une stratégie de sauvegarde nécessite un référentiel d’information, » un espace de stockage secondaire pour les données » qui agrège les sauvegardes des » sources » de données. Le référentiel pourrait être aussi simple qu’une liste de tous les supports de sauvegarde (DVD, etc.) et des dates produites, ou pourrait inclure un index informatisé, un catalogue ou une base de données relationnelle.
Les données de sauvegarde doivent être stockées, ce qui nécessite un schéma de rotation des sauvegardes, qui est un système de sauvegarde des données sur des supports informatiques qui limite le nombre de sauvegardes de dates différentes conservées séparément, par une réutilisation appropriée des supports de stockage de données en écrasant les sauvegardes qui ne sont plus nécessaires. Le système détermine comment et quand chaque élément de stockage amovible est utilisé pour une opération de sauvegarde et combien de temps il est conservé une fois que les données de sauvegarde y sont stockées. La règle 3-2-1 peut faciliter le processus de sauvegarde. Elle stipule qu’il doit y avoir au moins 3 copies des données, stockées sur 2 types de supports de stockage différents, et qu’une copie doit être conservée hors site, dans un lieu distant (cela peut inclure le stockage en nuage). Il convient d’utiliser au moins deux supports différents afin d’éliminer les pertes de données dues à des raisons similaires (par exemple, les disques optiques peuvent tolérer d’être immergés alors que les bandes LTO ne le peuvent pas, et les disques SSD ne peuvent pas tomber en panne à cause d’une chute de tête ou d’un moteur de broche endommagé car ils n’ont pas de pièces mobiles, contrairement aux disques durs). Une copie hors site protège contre les incendies, le vol de supports physiques (tels que les bandes ou les disques) et les catastrophes naturelles comme les inondations et les tremblements de terre. Les disques durs protégés contre les catastrophes naturelles comme ceux fabriqués par ioSafe sont une alternative à la copie hors site, mais ils ont des limites comme le fait de ne pouvoir résister au feu que pendant une période limitée, donc une copie hors site reste encore comme le choix idéal.
Méthodes de sauvegardeEdit
Non structuréEdit
Un référentiel non structuré peut simplement être une pile de bandes, de DVD-R ou de disques durs externes avec des informations minimales sur ce qui a été sauvegardé et quand. Cette méthode est la plus facile à mettre en œuvre, mais peu susceptible d’atteindre un haut niveau de récupérabilité car elle manque d’automatisation.
Un référentiel utilisant cette méthode de sauvegarde contient des copies complètes des données sources prises à un ou plusieurs points spécifiques dans le temps. Copie d’images système, cette méthode est fréquemment utilisée par les techniciens informatiques pour enregistrer les bonnes configurations connues. Cependant, l’imagerie est généralement plus utile comme moyen de déployer une configuration standard sur de nombreux systèmes plutôt que comme outil pour effectuer des sauvegardes continues de divers systèmes.
Modification incrémentielle
Une sauvegarde incrémentielle stocke les données modifiées depuis un point de référence dans le temps. Les copies doubles de données inchangées ne sont pas copiées. Généralement, une sauvegarde complète de tous les fichiers est effectuée une fois ou à intervalles peu fréquents, servant de point de référence pour un dépôt incrémentiel. Ensuite, un certain nombre de sauvegardes incrémentielles sont effectuées après des périodes de temps successives. Certains systèmes de sauvegarde peuvent créer une sauvegarde complète synthétique à partir d’une série de sauvegardes incrémentielles, fournissant ainsi l’équivalent d’une sauvegarde complète fréquente. Lorsqu’elle est effectuée pour modifier un seul fichier d’archive, cela accélère les restaurations des versions récentes des fichiers.
La protection des données en continu (CDP) fait référence à une sauvegarde qui enregistre instantanément une copie de chaque modification apportée aux données. Cela permet de restaurer les données à n’importe quel moment et constitue la protection des données la plus complète et la plus avancée. Les applications de sauvegarde quasi-CDP – souvent commercialisées sous le nom de « CDP » – effectuent automatiquement des sauvegardes incrémentielles à un intervalle spécifique, par exemple toutes les 15 minutes, une heure ou 24 heures. Elles ne peuvent donc autoriser les restaurations que jusqu’à une limite d’intervalle. Les applications de sauvegarde Near-CDP utilisent la journalisation et sont généralement basées sur des « instantanés » périodiques, des copies en lecture seule des données gelées à un moment donné.
La méthode Near-CDP (à l’exception d’Apple Time Machine) enregistre intentionnellement chaque changement sur le système hôte, souvent en sauvegardant les différences au niveau des octets ou des blocs plutôt qu’au niveau des fichiers. Cette méthode de sauvegarde diffère de la simple mise en miroir de disques en ce qu’elle permet un retour en arrière du journal et donc une restauration d’anciennes images de données. Le journalisation d’intention permet de prendre des précautions pour la cohérence des données en direct, en protégeant les fichiers autoconsistants mais en exigeant que les applications « soient mises au repos et rendues prêtes pour la sauvegarde. »
La CDP proche est plus praticable pour les applications de sauvegarde personnelles ordinaires, par opposition à la CDP véritable, qui doit être exécutée en conjonction avec une machine virtuelle ou un équivalent et est donc généralement utilisée dans les sauvegardes client-serveur d’entreprise.
Méthode de sauvegarde incrémentielle inverse
Une méthode de sauvegarde incrémentielle inverse stocke un « miroir » de fichier d’archive récent des données source et une série de différences entre le « miroir » dans son état actuel et ses états précédents. Une méthode de sauvegarde incrémentale inversée commence par une sauvegarde complète sans image. Une fois la sauvegarde complète effectuée, le système synchronise périodiquement la sauvegarde complète avec la copie en direct, tout en stockant les données nécessaires à la reconstruction des anciennes versions. Cela peut être fait soit en utilisant des liens durs-comme Apple Time Machine le fait, soit en utilisant des diffs binaires.
Edition différentielle
Une sauvegarde différentielle enregistre uniquement les données qui ont changé depuis la dernière sauvegarde complète. Cela signifie qu’un maximum de deux sauvegardes du référentiel sont utilisées pour restaurer les données. Cependant, plus le temps écoulé depuis la dernière sauvegarde complète (et donc les modifications accumulées dans les données) augmente, plus le temps d’exécution de la sauvegarde différentielle augmente. La restauration d’un système entier nécessite de commencer à partir de la sauvegarde complète la plus récente, puis d’appliquer uniquement la dernière sauvegarde différentielle.
Une sauvegarde différentielle copie les fichiers qui ont été créés ou modifiés depuis la dernière sauvegarde complète, indépendamment du fait que d’autres sauvegardes différentielles aient été effectuées depuis, tandis qu’une sauvegarde incrémentielle copie les fichiers qui ont été créés ou modifiés depuis la plus récente sauvegarde de n’importe quel type (complète ou incrémentielle). Les changements dans les fichiers peuvent être détectés par une date/heure plus récente de la dernière modification de l’attribut du fichier, et/ou des changements dans la taille du fichier. D’autres variantes de la sauvegarde incrémentielle incluent les incrémentiels multi-niveaux et les incrémentiels au niveau des blocs qui comparent des parties de fichiers au lieu de fichiers entiers.
Moyens de stockageEdit
Quel que soit le modèle de dépôt utilisé, les données doivent être copiées sur un support de stockage de données de fichiers d’archives. Le support utilisé est également appelé le type de destination de la sauvegarde.
Bande magnétiqueEdit
La bande magnétique a longtemps été le support le plus utilisé pour le stockage, la sauvegarde, l’archivage et l’échange de données en masse. C’était auparavant une option moins coûteuse, mais ce n’est plus le cas pour les petites quantités de données. La bande est un support à accès séquentiel, de sorte que la vitesse d’écriture ou de lecture continue des données peut être très rapide. Si le support de bande lui-même a un faible coût par espace, les lecteurs de bande sont généralement des dizaines de fois plus chers que les disques durs et les lecteurs optiques.
De nombreux formats de bande ont été propriétaires ou spécifiques à certains marchés comme les mainframes ou une marque particulière d’ordinateur personnel. En 2014, le LTO était devenu la principale technologie de bande. L’autre « super » format viable restant est l’IBM 3592 (également appelé série TS11xx). L’Oracle StorageTek T10000 a été abandonné en 2016.
Disque durEdit
L’utilisation du stockage sur disque dur a augmenté au fil du temps car il est devenu progressivement moins cher. Les disques durs sont généralement faciles à utiliser, largement disponibles et accessibles rapidement. Cependant, les sauvegardes sur disque dur sont des dispositifs mécaniques à tolérance étroite et peuvent être plus facilement endommagées que les bandes, notamment lors de leur transport. Au milieu des années 2000, plusieurs fabricants de disques ont commencé à produire des disques portables utilisant une technologie de chargement par rampe et d’accéléromètre (parfois appelée « capteur de chocs »). En 2010, la moyenne de l’industrie dans les tests de chute pour les disques dotés de cette technologie montrait que les disques restaient intacts et fonctionnaient après une chute non opérationnelle de 36 pouces sur une moquette industrielle. Certains fabricants proposent également des disques durs portables « durcis », qui incluent un boîtier absorbant les chocs autour du disque dur et revendiquent des spécifications de chute plus élevées. Sur une période de plusieurs années, la stabilité des sauvegardes sur disque dur est plus courte que celle des sauvegardes sur bande.
Les disques durs externes peuvent être connectés via des interfaces locales comme SCSI, USB, FireWire ou eSATA, ou via des technologies à plus longue distance comme Ethernet, iSCSI ou Fibre Channel. Certains systèmes de sauvegarde sur disque, via des librairies de bandes virtuelles ou autres, prennent en charge la déduplication des données, ce qui peut réduire la quantité de capacité de stockage sur disque consommée par les données de sauvegarde quotidiennes et hebdomadaires.
Mémoire optiqueModification
Le stockage optique utilise des lasers pour stocker et récupérer des données. Les CD, DVD et disques Blu-ray enregistrables sont couramment utilisés avec les ordinateurs personnels et sont généralement bon marché. Par le passé, les capacités et les vitesses de ces disques étaient inférieures à celles des disques durs ou des bandes, bien que les progrès réalisés dans le domaine des supports optiques réduisent lentement cet écart.
Les pertes de données potentielles futures causées par la dégradation progressive des supports peuvent être prédites en mesurant le taux d’erreurs de données mineures corrigibles, dont le nombre trop élevé consécutif augmente le risque de secteurs non corrigibles. La prise en charge de l’analyse des erreurs varie selon les fournisseurs de lecteurs optiques.
De nombreux formats de disques optiques sont de type WORM, ce qui les rend utiles à des fins d’archivage puisque les données ne peuvent pas être modifiées. De plus, les disques optiques ne sont pas vulnérables aux chocs de tête, au magnétisme, aux entrées d’eau imminentes ou aux surtensions, et une défaillance du lecteur se contente généralement d’arrêter la rotation.
Le support optique est modulaire ; le contrôleur de stockage n’est pas lié au support lui-même comme avec les disques durs ou le stockage flash (→contrôleur de mémoire flash), ce qui permet de le retirer et d’y accéder via un autre lecteur. Cependant, les supports enregistrables peuvent se dégrader plus tôt en cas d’exposition à long terme à la lumière.
Certains systèmes de stockage optique permettent des sauvegardes de données cataloguées sans contact humain avec les disques, ce qui permet une intégrité des données plus longue. Une étude française de 2008 indiquait que la durée de vie des CD-R généralement vendus était de 2 à 10 ans, mais un fabricant a estimé plus tard que la longévité de ses CD-R dotés d’une couche pulvérisée d’or pouvait atteindre 100 ans. L’Optical Disc Archive, propriété de Sony, peut en 2016 atteindre un taux de lecture de 250 Mo/s.
Les lecteurs à état solideEdit
Les lecteurs à état solide (SSD) utilisent des assemblages de circuits intégrés pour stocker les données. Les dispositifs de type mémoire flash, clés de pouce, clés USB, CompactFlash, SmartMedia, Memory Sticks et cartes Secure Digital sont relativement coûteux pour leur faible capacité, mais pratiques pour sauvegarder des volumes de données relativement faibles. Un disque à l’état solide ne contient aucune pièce mobile, ce qui le rend moins susceptible d’être endommagé physiquement, et peut avoir un débit énorme d’environ 500 Mbit/s jusqu’à 6 Gbit/s. Les SSD disponibles sont devenus plus capacitifs et moins chers. Les sauvegardes sur mémoire flash sont stables pendant moins d’années que les sauvegardes sur disque dur.
Service de sauvegarde à distanceEdit
Les services de sauvegarde à distance ou les sauvegardes dans le nuage impliquent que les fournisseurs de services stockent les données hors site. Cela a été utilisé pour se protéger contre des événements tels que les incendies, les inondations ou les tremblements de terre qui pourraient détruire les sauvegardes stockées localement. La sauvegarde dans le nuage (par le biais de services tels que Google Drive et Microsoft OneDrive ou similaires) offre une couche de protection des données. Toutefois, les utilisateurs doivent faire confiance au fournisseur pour préserver la confidentialité et l’intégrité de leurs données, la confidentialité étant renforcée par l’utilisation du cryptage. La vitesse et la disponibilité étant limitées par la connexion en ligne d’un utilisateur, les utilisateurs disposant de grandes quantités de données peuvent avoir besoin d’utiliser l’ensemencement du cloud et la récupération à grande échelle.
GestionEdit
Diverses méthodes peuvent être utilisées pour gérer les supports de sauvegarde, en trouvant un équilibre entre accessibilité, sécurité et coût. Ces méthodes de gestion des supports ne sont pas mutuellement exclusives et sont fréquemment combinées pour répondre aux besoins de l’utilisateur. L’utilisation de disques en ligne pour la mise en scène des données avant qu’elles ne soient envoyées vers une bibliothèque de bandes near-line est un exemple courant.
Edition en ligne
Le stockage de sauvegarde en ligne est généralement le type de stockage de données le plus accessible, et peut commencer une restauration en quelques millisecondes. Un disque dur interne ou une baie de disques (peut-être connectée à un SAN) est un exemple de sauvegarde en ligne. Ce type de stockage est pratique et rapide, mais il est vulnérable à la suppression ou à l’écrasement, que ce soit par accident, par une action malveillante ou dans le sillage d’une charge virale supprimant les données.
Edition en ligne proche
Le stockage en ligne proche est généralement moins accessible et moins coûteux que le stockage en ligne, mais reste utile pour le stockage de données de sauvegarde. Un dispositif mécanique est généralement utilisé pour déplacer les unités de support du stockage vers un lecteur où les données peuvent être lues ou écrites. Il présente généralement des propriétés de sécurité similaires à celles du stockage en ligne. Un exemple est une bibliothèque de bandes avec des temps de restauration allant de quelques secondes à quelques minutes.
Edition hors ligne
Le stockage hors ligne nécessite une certaine action directe pour donner accès aux supports de stockage : par exemple, l’insertion d’une bande dans un lecteur de bande ou le branchement d’un câble. Comme les données ne sont accessibles par aucun ordinateur, sauf pendant les périodes limitées où elles sont écrites ou relues, elles sont largement immunisées contre les modes de défaillance de la sauvegarde en ligne. Le temps d’accès varie selon que les supports sont sur site ou hors site.
Protection des données hors siteModification
Les supports de sauvegarde peuvent être envoyés dans une chambre forte hors site pour se protéger contre un sinistre ou tout autre problème spécifique au site. La chambre forte peut être aussi simple que le bureau à domicile d’un administrateur système ou aussi sophistiquée qu’un bunker de haute sécurité à l’épreuve des catastrophes, à température contrôlée, avec des installations pour le stockage des supports de sauvegarde. Une réplique de données peut être hors site mais aussi en ligne (par exemple, un miroir RAID hors site). Une telle réplique a une valeur assez limitée en tant que sauvegarde.
Site de sauvegardeEdit
Un site de sauvegarde ou un centre de reprise après sinistre est utilisé pour stocker des données qui peuvent permettre de restaurer et de configurer correctement les systèmes et réseaux informatiques en cas de sinistre. Certaines organisations disposent de leurs propres centres de récupération des données, tandis que d’autres confient cette tâche à un tiers. En raison des coûts élevés, la sauvegarde est rarement considérée comme la méthode privilégiée pour déplacer les données vers un site de DR. Une méthode plus typique serait la mise en miroir de disques à distance, qui permet de maintenir les données DR aussi à jour que possible.