Snapshot kopije: Kada ih koristiti, a kada vršiti „tiering“

Maša Pevac

NetApp Channel Marketing Manager

masa.pevac@alef.com

Kao jedan od elemenata kompletne backup strategije, snapshot kopije igraju veoma važnu ulogu u većini disaster recovery scenarija. 

VM okruženja ih koriste kao sigurnosne tačke kojima se mogu vratiti pre patch-ovanja ili vršenja važnih upgrade-a. Dev/test timovi mogu koristiti snapshot kopije za kloniranje celih volumena podataka, koji se zatim koriste za testiranje bez uticaja na produkciju. Snapshot kopije mogu se koristiti i za oporavak pojedinačnih fajlova ili brz oporavak od korupcije podataka i ransomware napada.

NetApp poseduje inovativnu snapshot tehnologiju, omogućavajući da se ove kopije brzo kreiraju kao i da budu prostorno efikasne. Ali snapshot kopije i dalje zauzimaju storage prostor, a u on-prem okruženjima taj prostor može biti dragocen. Šta se onda može učiniti u pogledu prostora koji shapshot kopije koriste na high performance storage uređajima, kao što su NetApp AFF i SSD-backed FAS sistemi? Tu dolazi na snagu stupa Cloud Tiering.

U ovom članku ćemo vam pružiti uvid u to kako funkcioniše NetApp Snapshot tehnologija i kako Cloud Tiering servis olakšava efikasno skladištenje ovih kopija u cloud-u.

NetApp Snapshot Technologies


Pregled NetApp Snapshot tehnologije

Svi oni koji su ranije koristili ONTAP sistem, verovatno su već upoznati sa osnovnim konceptom snapshot kopija: read-only, point-in-time kopija Vaših podataka. Međutim, za poznavanje kako stvari funkcionišu u pozadini, neophodno je dublje poznavanje sistema.

Kad god se snapshot pusti da snimi stanje podataka na volumenu, odgovarajući blokovi podataka volumena se na taj način osiguravaju kroz snapshot, i postaju nepromenljivi. U tom trenutku i sve do trenutka kada se neki od blokova koji pripada snapshot-u ne izmeni, snapshot deli potpuno isti storage kao i aktivni fajl sistem volumena. Zbog toga su oni visoko efikasni. Čim se bilo koji od blokova podataka izmeni nakon što je urađen snapshot, snapshot počinje da se odvaja od aktivnog fajl sistema i troši dodatni storage prostor. Storage sistem sada vodi evidenciju i o novom izmenjenom bloku podataka i o originalnom koji postoji samo u snapshot-u.

Da bi bilo jasnije zbog čega je NetApp Snapshot tehnologija izuzetna, potrebno je ispitati dva osnovna tipa snapshot tehnologija koji se koriste za upravljanje procesom modifikacije podataka i da praćenje propratnih postupaka: COW (copy on write) i ROW (Redirect on Write).

Copy on Write

Kod COW pristupa, blokovi podataka u snapshot-u koji treba da budu modifikovani moraju proći kroz proces pravljenja njihove kopije na nekom drugom mestu. Recimo da smo upravo sačuvali fajl na kojem smo radili, i nakon što smo ga sačuvali, taj fajl je uključen u najnoviji snapshot, koji je napravio storage sistem. Kada otvorimo taj fajl i ažuriramo deo njegovog sadržaja, odgovarajući blokovi podataka sa tog fajla trebalo bi sada da budu fizički modifikovani.

Pre prepravljanja bilo kog od postojećih blokova podataka, COW postupak ih kopira i prenosi te kopirane  informacije na neko drugo mesto na disku, na nove storage blokove. Novi storage blokovi sada će sadržati originalne informacije iz našeg fajla, osigurane snapshot-om. Tek nakon završetka postupka kopiranja, sistem upisuje modifikovane fajl podatke u originalne blokove koji sada pripadaju aktivnom fajl sistemu i sadrže ažurne podatke.

COW

Ovaj proces sadrži tri Input/Output operacije:

  1. Operacija čitanja podataka da bi se izvršilo kopiranje originalnih blokova
  2. Operacija upisivanja da bi se podaci smestili u snapshot deo na disku
  3. Operacija upisivanja modifikovanih podataka u originalne blokove

Ovaj model dolazi sa određenim utrošcima računarskih resursa i utiče na performanse:

  • Kod modifikacije podataka, izvršava se ukupno tri I/O operacije: jedna operacija čitanja i dve operacije upisivanja.
  • Slično tome, kada se vrši operacija vraćanja iz snapshot-a, storage sistem prolazi kroz proces odlučivanja, gde ispituje blokove u snapshot-u. Za svaki blok se mora znati da li je bio modifikovan ili ne. Ukoliko nije modifikovan, taj blok se čita sa originalne lokacije. Ukoliko je modifikovan, onda storage sistem mora da vrati blok sa mesta na koje je kopiran.

Ovi nedostaci mogu imati posledice na performanse sistema. Zbog toga se ovaj pristup preporučuje samo za privremene ili kratkoročne backup-e.

A sada ćemo videti kako NetApp ONTAP Snapshot tehnologija funkcioniše koristeći „Redirect on Write“ model.

Redirect on Write

Kod „Redirect to Write“ pristupa, kada god je blok podataka zaštićen snapshot-om potrebno modifikovati, sistem samo preusmerava upisivanje izmenjenih podataka u nove storage blokove i ažurira pokazivače aktivnog fajl sistema na te blokove. To je metoda koju koristi ONTAP Snapshot tehnologija.

Ova ONTAP Snapshot tehnologija koristi samo jednu I/O operaciju upisivanja, za razliku od COW pristupa koji koristi tri I/O operacije po modifikovanom bloku. Takođe, troši manje compute resursa za vraćanje podataka iz snapshot-a, jer snapshot pokazivači uvek pokazuju na originalnu lokaciju blokova podataka, koji su takođe „zaključani“ i nikada ne mogu biti prepisani, sve dok postoji snapshot. Snapshot-ovi su nezavisni setovi pokazivača, koji su nezavisni od pokazivača aktivnog fajl sistema. Kada se izvrši vraćanje podataka, svi pokazivači aktivnog fajl sistema se ažuriraju da se podudare sa odgovarajućim snapshot pokazivačima. Na ovaj način, postupak vraćanja terabajta podataka može se obaviti u roku od nekoliko sekundi. Ove dve ključne tačke, zajedno sa sposobnošću uštede efikasnosti storage memorije koja se postiže deduplikacijom i kompresijom, ono je što čini ONTAP Snapshot tehnologiju tako efikasnom.

ROW


Kako Cloud Tiering može optimizovati Snapshot Storage

Snapshot kopije su, s jedne strane, važan deo strategije backup-a i koriste se kao sredstvo za oporavak u više od 80% slučajeva. S druge strane, neaktivni ili „cold“ podaci mogu činiti više od 50% ukupnog kapaciteta kod srednjih i velikih okruženja, prema Osterman istraživanju. Snapshot kopije su deo ove gomile neaktivnih podataka, pa iako su veoma prostorno efikasne, obično zauzimaju 10% i više storage kapaciteta, što ostavlja prostor za primenu efikasnijeg storage management rešenja.  A tu stupa na snagu Cloud Tiering.

Cloud Tiering nudi rešenje koje je jednostavno za korišćenje sa on-prem AFF ili FAS sistemima, koje se koristi za prebacivanje „cold“ podataka na jeftini objektni storage. Putem NetApp Cloud Manager-a može se lako pretplatiti na ovu uslugu, detektovati postojeći on-prem ONTAP klaster, postaviti željene konfiguracije i započeti prebacivanje „cold“ podataka na Azure Blob, Amazon S3, Google Cloud Storage, ili NetApp StorageGRID.

Sveukupno, Cloud Tiering poseduje tri tiering polise koje se mogu podesiti na nivou volumena, a dve od njih je moguće konfigurisati i „cooling“ periode – „Cold user data & snapshots“ (Auto) i „Cold snapshots“ (Snapshot-only). Budući da je ovde reč o snapshot kopijama, u nastavku ćemo detaljnije razmotriti „Cold-Snapshots“ polisu.

Polisa će izvršiti prebacivanje bilo kojeg bloka podataka unutar snapshot-a koji se trenutno ne dele sa aktivnim fajl sistemom, što se dešava kada se izvrši modifikacija bloka podataka. Blokove podataka koji nisu bili modifikovani dele i snapshot i aktivni fajl sistem. Ovakvo stanje stvari otvara prostor za dodatne uštede storage-a u slučajevima kada se podaci menjaju umreno ili često, što prouzrokuje porast potrošnje snapshot storage-a.

Budući da se šanse korišćenja snapshot-a za oporavak znatno smanjuju posle svega nekoliko dana, „Cold-Snapshots“ polisa, koja se nudi kao Cold Tiering servis, obezbeđuje sjajnu mogućnost prebacivanja „cold snapshot“ blokova i oslobađanja prostora na visoko performantnim SSD-ovima. Ukoliko biste želeli da izvršite oporavak podataka sa jednog od snapshot-a koji su već prebačeni u cloud, odgovarajući blokovi se transparentno čitaju sa „cold cloud tier“-a i vraćaju nazad u „hot performance tier“. Podaci su uvek tu kada zatrebaju.

Iako postoji dosta situacija gde je moguće imati koristi od ovog pristupa, sjajan primer za to je i kada se on primenjuje u database okruženju. Tipična baza podataka po NetApp statistici ima stopu promena od 5% nedeljno u odnosu na punu veličinu baze podataka. Ispitujući dalje, tih 5% postaje 15% zato što se neki od tih blokova podataka modifikuju više puta, a te promene se čuvaju putem snapshot-ova. OLTP radna opterećenja sa višim stopama promena, takođe mogu imati koristi od ovog tipa Snapshot-only polise. 

Festo, Nemačka kompanija za automatizaciju i kontrolu primenila je Snapshot-only polisu na svoje AFF ONTAP okruženje, kako bi pravila snapshot-e blokova starijih od 48 sati, na 200 svojih AFF ONTAP volumena, i tako počela postepeno da proširuje upotrebu ovog servisa na stotinama slobodnih terabajta povećavajući svoj on-prem kapacitet.

Zaključak

NetApp koristi svoju Snapshot tehnologiju kako bi obezbedio trenutne, visoko efikasne storage backup-ove koji se mogu koristiti u velikom broju recovery scenarija, uključujući oporavak od mogućih ransomware pretnji, bez uticaja na AFF ili FAS performanse. Ukoliko se Cloud Tiering rešenje doda ovom miksu, biće dobijena mnogo efikasnija snapshot-based backup strategija, sa uštedama u ukupnim storage kapacitetima koje omogućava Cloud Tiering.

Više na ovu temu možete pročitati ovde.