Backup | NCGo

Una strategia di backup richiede un repository di informazioni, “uno spazio di stoccaggio secondario per i dati” che aggreghi i backup delle “fonti” di dati. Il repository potrebbe essere semplice come una lista di tutti i supporti di backup (DVD, ecc.) e le date prodotte, o potrebbe includere un indice computerizzato, un catalogo o un database relazionale.

I dati di backup devono essere archiviati, richiedendo uno schema di rotazione dei backup, che è un sistema di backup dei dati su supporti informatici che limita il numero di backup di date diverse conservati separatamente, attraverso un appropriato riutilizzo dei supporti di archiviazione dei dati con la sovrascrittura dei backup non più necessari. Lo schema determina come e quando ogni pezzo di memoria rimovibile viene utilizzato per un’operazione di backup e per quanto tempo viene conservato una volta che ha i dati di backup memorizzati su di esso. La regola del 3-2-1 può aiutare nel processo di backup. Essa afferma che ci dovrebbero essere almeno 3 copie dei dati, memorizzati su 2 diversi tipi di supporti di archiviazione, e una copia dovrebbe essere tenuta fuori sede, in un luogo remoto (questo può includere il cloud storage). 2 o più supporti diversi dovrebbero essere usati per eliminare la perdita di dati dovuta a ragioni simili (per esempio, i dischi ottici possono tollerare di essere sott’acqua mentre i nastri LTO no, e gli SSD non possono fallire a causa di cadute della testina o di motori mandrino danneggiati poiché non hanno parti in movimento, a differenza dei dischi rigidi) Una copia fuori sede protegge da incendi, furto di supporti fisici (come nastri o dischi) e disastri naturali come inondazioni e terremoti. I dischi rigidi protetti dai disastri come quelli prodotti da ioSafe sono un’alternativa a una copia offsite, ma hanno delle limitazioni come il fatto di essere in grado di resistere al fuoco solo per un periodo di tempo limitato, quindi una copia offsite rimane ancora la scelta ideale.

Metodi di backupModifica

Non strutturatoModifica

Un repository non strutturato può essere semplicemente una pila di nastri, DVD-R o HDD esterni con informazioni minime su cosa è stato salvato e quando. Questo metodo è il più facile da implementare, ma è improbabile che raggiunga un alto livello di recuperabilità in quanto manca di automazione.

Solo pieno/System imagingEdit

Un repository che usa questo metodo di backup contiene copie complete dei dati sorgente prese in uno o più punti specifici nel tempo. Copiando immagini di sistema, questo metodo è frequentemente usato dai tecnici informatici per registrare configurazioni note e buone. Tuttavia, l’imaging è generalmente più utile come un modo per distribuire una configurazione standard a molti sistemi piuttosto che come uno strumento per fare backup continui di sistemi diversi.

IncrementalEdit

Un backup incrementale memorizza i dati cambiati da un punto di riferimento nel tempo. Le copie duplicate di dati invariati non vengono copiate. Tipicamente un backup completo di tutti i file viene fatto una volta o a intervalli poco frequenti, servendo come punto di riferimento per un deposito incrementale. Successivamente, un certo numero di backup incrementali viene fatto dopo periodi di tempo successivi. I ripristini iniziano con l’ultimo backup completo e poi applicano gli incrementali.Alcuni sistemi di backup possono creare un backup completo sintetico da una serie di incrementali, fornendo così l’equivalente di fare frequentemente un backup completo. Quando viene fatto per modificare un singolo file di archivio, questo velocizza i ripristini delle versioni recenti dei file.

Near-CDPEdit

La protezione continua dei dati (CDP) si riferisce a un backup che salva istantaneamente una copia di ogni cambiamento fatto ai dati. Questo permette il ripristino dei dati in qualsiasi momento ed è la protezione dei dati più completa e avanzata. Le applicazioni di backup Near-CDP – spesso commercializzate come “CDP” – eseguono automaticamente dei backup incrementali a un intervallo specifico, per esempio ogni 15 minuti, un’ora o 24 ore. Possono quindi permettere solo ripristini ad un intervallo di tempo. Le applicazioni di backup Near-CDP usano il journaling e sono tipicamente basate su “istantanee” periodiche, copie in sola lettura dei dati congelati in un particolare momento.

Near-CDP (eccetto Apple Time Machine) registra intenzionalmente ogni cambiamento sul sistema host, spesso salvando differenze a livello di byte o di blocco piuttosto che a livello di file. Questo metodo di backup differisce dal semplice mirroring del disco in quanto permette un roll-back del log e quindi un ripristino di vecchie immagini di dati. L’Intent-logging permette precauzioni per la consistenza dei dati live, proteggendo i file autoconsistenti ma richiedendo che le applicazioni “siano quiescenti e pronte per il backup”.

Near-CDP è più praticabile per applicazioni di backup personali ordinarie, al contrario del vero CDP, che deve essere eseguito insieme a una macchina virtuale o equivalente ed è quindi generalmente usato nei backup client-server aziendali.

Reverse incrementalEdit

Un metodo di backup incrementale inverso memorizza un file di archivio recente “specchio” dei dati sorgente e una serie di differenze tra lo “specchio” nel suo stato attuale e gli stati precedenti. Un metodo di backup incrementale inverso inizia con un backup completo senza immagine. Dopo che il backup completo è stato eseguito, il sistema sincronizza periodicamente il backup completo con la copia live, mentre memorizza i dati necessari per ricostruire le versioni precedenti. Questo può essere fatto usando collegamenti rigidi, come fa Time Machine di Apple, o usando diffs binari.

DifferentialEdit

Un backup differenziale salva solo i dati che sono cambiati dall’ultimo backup completo. Questo significa che un massimo di due backup dal repository sono usati per ripristinare i dati. Tuttavia, man mano che il tempo trascorso dall’ultimo backup completo (e quindi i cambiamenti accumulati nei dati) aumenta, aumenta anche il tempo per eseguire il backup differenziale. Il ripristino di un intero sistema richiede di partire dal più recente backup completo e poi applicare solo l’ultimo backup differenziale.

Un backup differenziale copia i file che sono stati creati o modificati dall’ultimo backup completo, indipendentemente dal fatto che siano stati fatti altri backup differenziali da allora, mentre un backup incrementale copia i file che sono stati creati o modificati dal più recente backup di qualsiasi tipo (completo o incrementale). I cambiamenti nei file possono essere rilevati attraverso una data/ora più recente dell’ultima modifica dell’attributo del file, e/o cambiamenti nella dimensione del file. Altre variazioni del backup incrementale includono incrementi multilivello e incrementi a livello di blocco che confrontano parti di file invece di file interi.

Storage mediaEdit

Da sinistra a destra, un disco DVD con copertura in plastica, una chiavetta USB e un disco rigido esterno

A prescindere dal modello di repository utilizzato, i dati devono essere copiati su un supporto di archiviazione dati. Il supporto usato è anche indicato come il tipo di destinazione del backup.

Nastro magneticoModifica

Il nastro magnetico è stato per molto tempo il supporto più comunemente usato per la memorizzazione, il backup, l’archiviazione e l’interscambio di dati in massa. Prima era un’opzione meno costosa, ma questo non è più il caso per piccole quantità di dati. Il nastro è un supporto ad accesso sequenziale, quindi il tasso di scrittura o lettura continua dei dati può essere molto veloce. Mentre i supporti a nastro in sé hanno un basso costo per spazio, le unità a nastro sono in genere decine di volte più costose degli hard disk e delle unità ottiche.

Molti formati a nastro sono stati proprietari o specifici per certi mercati come i mainframe o una particolare marca di personal computer. Dal 2014 LTO è diventata la tecnologia a nastro primaria. L’altro formato “super” ancora praticabile è l’IBM 3592 (chiamato anche serie TS11xx). L’Oracle StorageTek T10000 è stato interrotto nel 2016.

Hard diskEdit

L’uso dell’archiviazione su disco rigido è aumentato nel tempo perché è diventato progressivamente più economico. I dischi rigidi sono di solito facili da usare, ampiamente disponibili, e si può accedere rapidamente. Tuttavia, i backup su disco rigido sono dispositivi meccanici a tolleranza stretta e possono essere danneggiati più facilmente dei nastri, specialmente durante il trasporto. A metà degli anni 2000, diversi produttori di dischi hanno iniziato a produrre dischi portatili utilizzando la tecnologia di caricamento a rampa e l’accelerometro (talvolta definito “sensore d’urto”), e dal 2010 la media del settore nei test di caduta per i dischi con questa tecnologia ha mostrato che i dischi sono rimasti intatti e funzionanti dopo una caduta non operativa da 36 pollici su una moquette industriale. Alcuni produttori offrono anche dischi rigidi portatili “ruggedized”, che includono un involucro che assorbe gli urti intorno al disco rigido, e dichiarano una gamma di specifiche di caduta più elevate. In un periodo di anni la stabilità dei backup su disco rigido è inferiore a quella dei backup su nastro.

I dischi rigidi esterni possono essere collegati tramite interfacce locali come SCSI, USB, FireWire o eSATA, o tramite tecnologie a lunga distanza come Ethernet, iSCSI o Fibre Channel. Alcuni sistemi di backup basati su disco, tramite Virtual Tape Libraries o altro, supportano la deduplicazione dei dati, che può ridurre la quantità di capacità di archiviazione su disco consumata dai dati di backup giornalieri e settimanali.

Archiviazione otticaModifica

Vedi anche: Conservazione dei media ottici

L’archiviazione ottica utilizza il laser per memorizzare e recuperare i dati. I CD, i DVD e i Blu-ray Disc registrabili sono comunemente usati con i personal computer e sono generalmente economici. In passato, le capacità e le velocità di questi dischi sono state inferiori a quelle dei dischi rigidi o dei nastri, anche se i progressi nei media ottici stanno lentamente riducendo questo divario.

Potenziali perdite future di dati causate dal graduale degrado dei media possono essere previste misurando il tasso di errori di dati minori correggibili, di cui troppi consecutivi aumentano il rischio di settori non correggibili. Il supporto per la scansione degli errori varia tra i fornitori di unità ottiche.

Molti formati di dischi ottici sono di tipo WORM, il che li rende utili per scopi di archiviazione poiché i dati non possono essere modificati. Inoltre, i dischi ottici non sono vulnerabili agli urti della testa, al magnetismo, all’ingresso imminente di acqua o agli sbalzi di tensione, e un guasto del disco tipicamente arresta solo la rotazione.

Il supporto ottico è modulare; il controller di archiviazione non è legato al supporto stesso come nei dischi rigidi o nella memoria flash (→controller della memoria flash), permettendo di rimuoverlo e di accedervi attraverso un disco diverso. Tuttavia, i supporti registrabili possono degradarsi prima sotto l’esposizione a lungo termine alla luce.

Alcuni sistemi di archiviazione ottica permettono il backup dei dati catalogati senza contatto umano con i dischi, permettendo una più lunga integrità dei dati. Uno studio francese del 2008 ha indicato che la durata di vita dei CD-R tipicamente venduti era di 2-10 anni, ma un produttore ha poi stimato la longevità dei suoi CD-R con uno strato ricoperto d’oro fino a 100 anni. L’Optical Disc Archive proprietario di Sony può raggiungere nel 2016 una velocità di lettura di 250MB/s.

Solid-state driveEdit

Le unità a stato solido (SSD) usano gruppi di circuiti integrati per immagazzinare dati. Le memorie flash, i thumb drive, le chiavette USB, le CompactFlash, gli SmartMedia, i Memory Stick e le schede Secure Digital sono relativamente costosi per la loro bassa capacità, ma convenienti per il backup di volumi di dati relativamente bassi. Un’unità a stato solido non contiene parti mobili, il che la rende meno suscettibile ai danni fisici, e può avere un enorme throughput di circa 500 Mbit/s fino a 6 Gbit/s. Gli SSD disponibili sono diventati più capienti e più economici. I backup su memoria flash sono stabili per meno anni dei backup su disco rigido.

Servizio di backup remotoModifica

I servizi di backup remoto o i backup su cloud coinvolgono i fornitori di servizi che conservano i dati fuori sede. Questo è stato usato per proteggere da eventi come incendi, inondazioni o terremoti che potrebbero distruggere i backup memorizzati localmente. Il backup basato sul cloud (attraverso servizi come o simili a Google Drive e Microsoft OneDrive) fornisce un livello di protezione dei dati. Tuttavia, gli utenti devono fidarsi del fornitore per mantenere la privacy e l’integrità dei loro dati, con la riservatezza migliorata dall’uso della crittografia. Poiché la velocità e la disponibilità sono limitate dalla connessione online di un utente, gli utenti con grandi quantità di dati potrebbero aver bisogno di utilizzare il cloud seeding e il recupero su larga scala.

GestioneModifica

Vari metodi possono essere utilizzati per gestire i supporti di backup, trovando un equilibrio tra accessibilità, sicurezza e costi. Questi metodi di gestione dei media non si escludono a vicenda e sono spesso combinati per soddisfare le esigenze dell’utente. L’uso di dischi in linea per mettere in scena i dati prima che vengano inviati a una libreria a nastro near-line è un esempio comune.

OnlineEdit

L’archiviazione di backup in linea è tipicamente il tipo più accessibile di archiviazione dei dati e può iniziare un ripristino in millisecondi. Un disco rigido interno o un array di dischi (magari collegato alla SAN) è un esempio di backup online. Questo tipo di archiviazione è conveniente e veloce, ma è vulnerabile alla cancellazione o alla sovrascrittura, sia per sbaglio, sia per azione malevola, o sulla scia di un virus che cancella i dati.

Near-lineEdit

L’archiviazione near-line è tipicamente meno accessibile e meno costosa dell’archiviazione online, ma comunque utile per l’archiviazione dei dati di backup. Un dispositivo meccanico è di solito usato per spostare unità di media dallo stoccaggio in un drive dove i dati possono essere letti o scritti. Generalmente ha proprietà di sicurezza simili allo storage online. Un esempio è una libreria a nastro con tempi di ripristino che vanno da secondi a pochi minuti.

Off-lineEdit

La memorizzazione off-line richiede qualche azione diretta per fornire accesso al supporto di memorizzazione: per esempio, inserendo un nastro in un’unità a nastro o collegando un cavo. Poiché i dati non sono accessibili da nessun computer, tranne durante periodi limitati in cui vengono scritti o letti, sono in gran parte immuni da modalità di fallimento del backup on-line. Il tempo di accesso varia a seconda che i supporti siano on-site o off-site.

Protezione dei dati off-siteModifica

I supporti di backup possono essere inviati a un caveau off-site per proteggersi contro un disastro o altri problemi specifici del sito. Il caveau può essere semplice come l’ufficio di casa di un amministratore di sistema o sofisticato come un bunker ad alta sicurezza, a temperatura controllata e resistente ai disastri, con strutture per lo stoccaggio dei supporti di backup. Una replica dei dati può essere off-site ma anche on-line (ad esempio, un mirror RAID off-site). Una tale replica ha un valore abbastanza limitato come backup.

Sito di backupModifica

Un sito di backup o un centro di disaster recovery è utilizzato per memorizzare i dati che possono consentire ai sistemi informatici e alle reti di essere ripristinati e configurati correttamente in caso di disastro. Alcune organizzazioni hanno i propri centri di recupero dati, mentre altre lo affidano a terzi. A causa dei costi elevati, il backup è raramente considerato il metodo preferito per spostare i dati in un sito di DR. Un modo più tipico sarebbe il mirroring remoto del disco, che mantiene i dati DR il più aggiornati possibile.