L’incendio che ha colpito alcuni server di OVH ha messo in luce quanto molte aziende siano ancora impreparate sulle misure di disaster recovery. Vediamo che cos’è il disaster recovery e come questa strategia, spesso fin troppo sottovalutata, sia invece cruciale per mantenere la continuità operativa e tenere in piedi le aziende.
Parleremo dei fattori di rischio, delle strategie utilizzate per far fronte alle emergenze e degli errori da evitare. Ma, prima di tutto, vediamo cosa si intende per disaster recovery.
Table of Contents
Disaster recovery: cos’è?
Una definizione di disaster recovery semplice e esaustiva è quella che troviamo su Wikipedia:
Con disaster recovery, in informatica ed in particolare nell’ambito della sicurezza informatica, si intende l’insieme delle misure tecnologiche e logistico/organizzative atte a ripristinare sistemi, dati e infrastrutture necessarie all’erogazione di servizi […] a fronte di gravi emergenze che ne intacchino la regolare attività.
Wikipedia
Con il termine disaster recovery ci si riferisce, quindi, all’insieme delle procedure da mettere in atto nei casi di eventi non prevedibili. Questa strategia include quindi più aspetti collegati tra loro. Si parte dall’individuare i fattori di rischio, per mettere in atto delle azioni preventive per riuscire a minimizzarli.
Visto che i rischi, però, non possono mai essere ridotti a zero, si devono pianificare anche gli interventi di recupero per ripristinare la continuità delle attività.
Non a caso il disaster recovery è una strategia che fa parte a sua volta di un disegno più ampio conosciuto come business continuity. Proprio per garantire la continuità delle attività di un’azienda è necessario essere preparati per affrontare le interruzioni e ripristinarle nel minor tempo possibile.
Ma veniamo con ordine e capiamo innanzitutto a che genere di rischi si fa riferimento.
I fattori di rischio del disaster recovery
La strategia di disaster recovery in un’azienda si fa concreta solo con l’attuazione di un piano di disaster recovery. Stiamo parlando di quello che viene definito Disaster Recovery Plan o anche DRP.
A differenza della strategia in cui vengono decise a priori quali misure mettere in atto in risposta a una situazione critica, nel piano vengono invece definiti con precisione i passi da seguire. Delineare le procedure con un piano definito a priori consente di minimizzare gli errori e ridurre i tempi di ripristino. Non si può pensare di improvvisare, tanto meno in una situazione delicata come questa.
In una strategia di disaster recovery con il termine disastro ci si riferisci a degli eventi inaspettati di natura molto diversa tra loro.
Da una parte ci sono gli hacker che minano la sicurezza informatica (virus, phishing o attacchi DDoS) senza escludere anche veri e propri furti. Dall’altra ci sono gli eventi naturali come inondazioni, alluvioni, terremoti o incendi.
Altri tipi di malfunzionamenti possono essere associati a guasti nell’hardware o black out. Bisogna anche considerare la possibilità di un errore umano.
A cosa serve un piano di disaster recovery
Dalla definizione dei rischi si stabiliscono le procedure per rispondere all’evento critico in modo adeguato. È proprio questo lo scopo del disaster recovery plan: stabilire come procedere in modo da ridurre al minimo i danni.
Ridurre i danni significa limitare al minor tempo possibile l’interruzione delle attività e quindi riuscire ad arginare anche le perdite economiche associate all’interruzione stessa. Per farlo è strettamente necessario cooperare per ripristinare al più presto il servizio.
È per questo che ognuno all’interno di un’azienda dovrebbe essere informato sulle misure da mettere in pratica in queste eventualità, in modo da poter fare la sua parte.
Se l’operatività non può essere ripristinata a pieno regime in tempi brevi, deve essere messa in atto con prontezza una serie di procedure alternative in modo da non interromperla completamente.
Se un’azienda non definisce un piano di disaster recovery il rischio è di non riuscire a ripristinare la continuità delle attività. Conservare adeguatamente i dati per poterli ripristinare in caso di emergenza è fondamentale per non rischiare di perderli definitivamente.
Una perdita dei dati può mettere in crisi l’intera operatività conducendo l’azienda in stallo. E non è detto che da un evento del genere un’impresa possa poi riuscire a rimettersi in piedi.
Strategie di disaster recovery
Nella definizione di un piano di disaster recovery l’azienda deve prefiggersi due obiettivi principali: il Recovery Point Objective (RPO) e il Recovery Time Objective (RTO).
L’RPO indica la quantità di dati che potrebbero andare persi nel caso si verifichi un disastro. Questo parametro dipende, quindi, dalla frequenza con cui vengono eseguiti i backup. I dati persi, saranno infatti, quelli che sono stati modificati o creati tra il momento dell’ultimo backup e quello in cui si è verificato il disastro.
L’RTO è la quantità di tempo necessaria a ripristinare i dati e le infrastrutture per ritornare all’operatività. In altre parole è il tempo di inattività che si può tollerare. Questo parametro dipenderà, quindi, dalla rapidità con cui avviene il ripristino, operazione che viene solitamente eseguita da un sistemista.
Per limitare il più possibile l’impatto sull’attività, viene da sé che questi due parametri devono essere ridotti al minimo. Questo equivale a perdere meno dati e riuscire a ripristinare i sistemi nel minor tempo possibile.
Il ruolo cruciale dei backup
Il mantenimento dei dati viene garantito assicurandone la ridondanza, vale a dire creato diverse copie degli stessi dati in modo che non vadano persi.
Viene da sé che una strategia per la conservazione dei dati che avviene attraverso i backup è indissolubile dalla strategia di disaster recovery. È importante però, allo stesso tempo non confondere questi due concetti tra loro.
L’obiettivo dei backup è proprio quello di assicurarsi il recupero dei dati, un recupero per quanto più possibile integrale. D’altra parte, però, il disaster recovery si riferisce invece a una strategia più ampia che include non solo il ripristino dei dati, ma dell’intera infrastruttura.
Il caso OVH
L’incendio ai server di Strasburgo di OVHcloud fa sorgere diverse osservazioni sui metodi di conservazione dei dati.
Immaginiamo che il backup sia conservato sullo stesso server del sito principale: in questo caso un danno al server mette a repentaglio i dati originali e la copia stessa rendendo vana l’utilità del backup.
Per questo motivo la strategia migliore è quella di usare server differenti per conservare le copie di backup. Se, però, i server utilizzati sono all’interno di un unico datacenter c’è un altro problema.
Veniamo, quindi, proprio al caso OVH, un incendio scoppiato all’interno di uno dei datacenter si è esteso fino ai datacenter limitrofi. Un evento di questa portata che ha coinvolto più strutture situate nelle vicinanze comporta una perdita irrimediabile dei dati.
Qual è la soluzione ad un evento del genere?
Utilizzare datacenter dislocati in posizioni differenti. Un’opzione che molti provider mettono a disposizione con piani separati di disaster recovery. Opzioni che anche OVH metteva a disposizione, ma che molti utenti, sottovalutando l’importanza di queste procedure, non avevano attivato.
Come proteggiamo i tuoi dati
La prassi di SupportHost è proprio utilizzare server esterni in datacenter dislocati in una nazione diversa rispetto a quella dei server su cui sono ospitati i siti. Il nostro datacenter è in Germania, ma i backup vengono conservati su datacenter separati, in Olanda. Non solo in un datacenter diverso, usiamo una nazione diversa.
In questo modo mettiamo al sicuro i dati dei nostri utenti, potendo garantire l’incolumità dei dati grazie alla dislocazione. Se si verifica un guasto ai server in cui è ospitato il tuo sito non rischi di perdere anche i backup, ma la perdita di dati si riduce al lasso di tempo intercorso dall’ultimo backup.
Per ridurre al minimo gli inconvenienti offriamo nei nostri servizi hosting un backup giornaliero (ogni 24 ore) incluso già nel prezzo dei nostri piani hosting WordPress, hosting condiviso, server dedicati, VPS cloud hosting e hosting reseller. I backup sono mantenuti per 30 giorni e sei libero di ripristinarli in autonomia. Ti bastano pochi click dal pannello di controllo (cPanel) per gestire il ripristino.
DNS cluster geolocalizzato
Oltre a questo usiamo un DNS cluster geolocalizzato e usiamo 4 domini differenti. Mi spiego meglio.
Abbiamo 4 nodi in 4 datacenter separati, e diversi dai datacenter su cui manteniamo i server e i server di backup. Ognuno di questi nodi rappresenta uno dei 4 nameservers.
Solitamente le aziende di hosting usano:
ns1.dominio.com
ns2.dominio.com
E questi vengono fatti puntare direttamente al server dove è ospitato il sito del cliente.
Con la nostra soluzione abbiamo 4 diversi nameservers che puntano a 4 diversi nodi, usando 4 domini differenti:
ns.supporhost.com
ns.supporhost.net
ns.supporhost.eu
ns.supporhost.us
Questa soluzione ci permette di eliminare il rischio dovuto ad un problema con un dominio. Se ad esempio il registro .com sospende il dominio, tutti i siti dei nostri clienti restano online.
Se un datacenter dove risiede uno di questi 4 nodi ha dei problemi, o se uno di questi nodi ha problemi, gli altri 3 continuano a mantenenere raggiungibili tutti i siti dei nostri clienti (ne basta 1 online per avere i siti dei clienti online).
Se il server dove il cliente ha il sito ha un problema (ad esempio prende fuoco il datacenter oppure più semplicemente si rompe un disco sul server) possiamo risolvere in pochi minuti:
- Ripristiniamo il backup su un nuovo server, prendendolo dai backup automatici che risiedono in un datacenter differente
- Cambiamo l’IP di quel dominio nel cluster, in questo caso non abbiamo tempi di propagazione DNS, il puntamento viene aggiornato all’istante
Purtroppo i problemi sono sempre in agguato, e bisogna sempre cercare di migliorare la propria situazione cercando di essere, come si dice in inglese, antifragili.
Conclusioni
Abbiamo visto cosa si intende per disaster recovery e come essere preparati per affrontare eventuali emergenze sia fondamentale per un’azienda al giorno d’oggi.
Sapere come mantenere i propri dati al sicuro è indispensabile nell’ottica di una strategia più ampia che ne permetta il ripristino in tempi brevi. Solo in questo modo si riescono a ridurre al minimo i tempi di inattività e, di conseguenza, le perdite economiche che potrebbero derivarne.
Ti è mai capitato di dover gestire un evento accidentale? Avevi un piano da seguire e sei riuscito a ripristinare i dati e l’attività in tempi brevi? Condividi la tua esperienza con un commento.
Lascia un commento