NetApp All - Flash Arrays

Marko Milošević

Pre Sales Engineer

marko.milosevic@alef.com

Koja je najvažnija karakteristika koju treba uzeti u obzir kada želite da kupite novi storage sistem? Ključnija od performansi, značajnija od vaših potreba kada su u pitanju napajanje i hlađenje, možda čak i važnija od cene? Bez obzira da li je u pitanju All-Flash sistem namenjen preduzećima (firmama), novi drajv za vaš laptop, ili samo USB flash memorija, prvo pitanje koje obično svima pada na pamet je: koliko je veliki?

A ipak, iznenađujuća je činjenica, bar kada su u pitanju All-Flash sistemi, da je sve teže dobiti precizan odgovor na ovo pitanje. Hajde zato da pokušamo da to razjasnimo u ovom tekstu.

Pre nego što počnemo, osvrnimo se najpre na razliku između binarnih i decimalnih mera kapaciteta. Već dugo godina u kompjuterskoj industriji postoje dve različite definicije kapaciteta: kapacitet memorije se uobičajeno izražava u binarnom sistemu vrednosti (stepen dvojke) - na primer, jedan kilobajt = 2^10 bajta=1024 bajta. S druge strane, proizvođači hard drajvova su oduvek koristili decimalne vrednosti (stepen desetke) - na primer jedan kilobajt= 10^3 bajta= 1000 bajta. S obzirom na to da se fleš memorija obično koristi u istu svrhu kao i disk drajv, obično se prodaje sa kapacitetom memorije izraženom  decimalnim vrednostima – zato obavezno uzmite ovo u obzir kada planirate vaše okruženje.

NetApp

Definicije

Sada kada smo to razjasnili, pogledajmo tri načina na  koje se kapacitet najčešće opisuje: raw capacity, usable capacity i effective capacity. Kako ne bismo lutali, upotrebićemo SNIA (Storage Networking Industry Association) definiciju.


RawRaw kapacitet: Ukupna količina kapaciteta koji je moguće adresirati na uređaju za skladištenje unutar storage sistema. 
Raw capacity predstavlja ukupan zbir raspoloživih kapaciteta svakog pojedinačnog fleš čipa na kome se mogu uskladištiti podaci. Zamislite SSD koji sadrži 8 Intel MLC NAND die paketa, od kojih svaki ima 32GB fleša koji se može adresirati. On stoga ukupno ima 576GB raw kapaciteta. Termin „moguće adresirati“ je ovde važan zato što paketi zapravo sadrže dodatni fleš koji nije moguće adresirati, a koji se koristi u svrhe kao što su korekcije grešaka - ali s obzirom da ga ni vi, ni SSD firmware ne možete adresirati, ne ulazi u raw vrednost.

Usable

Usable Capacity: (sinonim sa Formatted Capacity u SNIA terminologiji) Ukupna količina bajtova dostupna za pisanje nakon što se sistem ili uređaj formatiraju za upotrebu. On je manji ili jednak raw kapacitetu.
Verovatno jedan od termina koji su najviše zloupotrebljavani kad se radi o skladištenju podataka (takođe poznat kao net kapacitet), usable kapacitet je ono što preostane nakon što ste zauzeli raw kapacitet i oduzeli prostor koji je izdvojen za sistemsko korišćenje, RAID parnost, over-provisioning, itd.
Ovo je zagarantovani kapacitet, što znači da možete biti sigurni da možete uskladištiti ovu količinu podataka bez obzira na to kako ti podaci izgledaju.
Ovo poslednje je važno kada tehnologije za redukciju podataka stupe na scenu – na primer kompresija, deduplikacija i (diskutabilno) thin provisioning. Uzmite 10TB raspoloživog prostora i upišite 5TB podataka - sada vam je ostalo 5TB korisnog kapaciteta na raspolaganju. Zvuči jednostavno? Ali, ako uzmete 10TB korisnog prostora i upišete 5TB podataka koji se kompresuju i dedupliciraju u 5:1 odnosu – sada vam je potreban samo 1TB korisnog prostora za skladištenje. što znači da vam je ostalo 9TB korisnog kapaciteta na raspolaganju.

Effective

 Effective CapacityKoličina podataka uskladištenih na jednom storage sistemu…

Ne postoji način da se precizno predvidi efektivni kapacitet sistema pre nego se u njega upišu podaci. Ova mera se obično koristi za sisteme koji koriste tehnologije za optimizaciju prostora.
Efektivni kapacitet storage sistema je količina podataka koju biste teorijski mogli uskladištiti na njega pod određenim uslovima. Ovi uslovi su pretpostavke, kao što su “moji podaci će biti smanjeni u odnosu x:1. Ovo donosi puno rizika s obzirom na to da se pretpostavke skoro uvek odnose na sposobnost seta podataka da se redukuje na neki način (npr. kompresuje, deduplicira i slično) – a to se ne može precizno znati sve dok se podaci zapravo ne uskladište. Štaviše, podaci se menjaju, a samim tim i njihova sposobnost da se redukuju.
Iz ovog razloga, effective kapacitet je veoma loš način merenja pri pravljenju bilo kakvih čvrstih planova, osim ako nemate neku vrstu garancije od strane proizvođača. Ona, na primer, može glasiti ovako: “Mi vam garantujemo x terabajta efektivnog kapaciteta – i ako ne uspete da ovo realizujete, mi ćemo vam besplatno obezbediti dodatni storage, kako bismo “ispoštovali” garanciju. Ovo se onda tipično zove garantovani efektivni kapacitet.

Najčešća pretpostavka u storage industriji je da se baze podataka redukuju okvirno u odnosu između 2:1 i 4:1, VSI sistemi od 5:1 do 6:1, a VDI sistemi u odnosu od 8:1 , pa sve do 18:1, ili čak i više. Ovo znači da je prosečna redukcija podataka oko 6:1, što je uobičajeni odnos koji ćete videti na listi podataka većine proizvođača.

Ako uzmete 10TB korisnog kapaciteta i pretpostavite da je prosečan odnos redukcije podataka od 6:1, vi zapravo na kraju imate 60TB efektivnog kapaciteta. Neki proizvođači koriste nižu razmeru, kao što je 3:1 – što je dobro za vas kao kupca, jer vas bolje štiti od rizika nemogućnosti redukovanja podataka.

Ali, sve ovo je besmisleno u stvarnom svetu. Jednostavno ne možete znati koji je efektivni kapacitet storage sistema dok ne učitate SVOJE podatke na njega. I ne možete garantovati da će tako i ostati, ako vam se podaci budu menjali. Nikada ne kupujte storage sistem samo na osnovu efektivnog kapaciteta koji proizvođač nudi, osim ako uz njega ne ide i garancija – i uvek razmislite da li je pretpostavljena razmera redukcije podataka relevantna za vas.

Gledajte na to ovako: ako vam prodaju efektivni kapacitet, vi snosite finansijski rizik povezan sa tom redukcijom podataka. Međutim, ako vam prodaju garantovani efektivni kapacitet, proizvođač preuzima taj finansijski rizik (umesto vas). Koji scenario se vama više dopada?

Upotreba i zloupotreba kapaciteta

Tri različita načina merenja kapaciteta? To zvuči komplikovano. I baš u toj kompleksnosti leži prilika za neke proizvođače fleš sistema da vam zamažu oči i učine da njihov proizvod izgleda primamljivije nego što jeste. Ovde ćemo istaći ono za šta smatramo da su dve najčešće taktike.

  • Mešanje korisnog i efektivnog kapaciteta
    Mnogi proizvođači fleš sistema pružaju uslugu redukcije podataka koja je uvek aktivna/na raspolaganju (Always-On). Često se tvrdi da je ovo za dobrobit kupaca, ali tu se zapravo češće radi o redukovanju količine upisa na fleš medijumu (da bi se umanjili problemi sa performansom i izdržljivošću). Za neke proizvođače, nepostojanje opcije da se onemogući redukcija podataka može se preokrenuti u njihovu korist: oni jednostavno tumače da su termini koristan i efektivan sinonimi, ili ih čak spoje u neoprostivu frazu efektivni koristan kapacitet kako bi učinili da njihov proizvod izgleda bolje.
  • Moja redukcija podataka je bolja od tvoje
    Svaki proizvođač fleš uređaja misli da je njihova tehnologija redukcije podataka najbolja. Ne mogu svi biti u pravu. A opet, ponekad ćete čuti tvrdnje koje su toliko smešne da ćete pomisliti da je to neka šala. Pretpostavljam da svi verujemo u ono što želimo da čujemo.
    Evo isitne. Kompresija I deduplikacija su zrele tehnologije – one postoje već decenijama. Niko u fleš storage svetu neće sada odjednom izmisliti nešto što je značajno bolje od konkurencije. Ponekad, tehnologija jednog proizvođača može doneti bolje rezultate od ostalih, ali u drugim slučajevima (i, ono što je ključno, sa drugim setovima podataka) situacija može biti obrnuta. Iz ovog razloga, a i zbog vašeg duševnog zdravlja, trebalo bi da pretpostavite da će svi oni biti otprilike isti… bar dok ne budete u mogućnosti da ih testirate sopstvenim podacima. Kada budete ocenjivali konkurentske fleševe, naterajte ih da se obavežu na garantovani efektivni kapacitet, I onda ih držite za reč. Ako ne žele da se obavežu, budite oprezni.
  • Ušteda od Thin Provisioning
    Thin Provisioning je opcija gde se fizički storage dodeljuje samo kada se koristi, a ne da se unapred dodeli u trenutku kada se kreira volumen. Stoga, ako se kreira volumen od 10TB, ali se onda upiše 1TB podataka, samo 1TB fizičkog storage prostora će biti iskorišćeno. Host tada pogrešno misli da ima svih 10TB na raspolaganju, ali u realnosti može biti mnogo manje slobodnog fizičkog kapaciteta u skladišnom sistemu.
    Neki proizvođači prikazuju thin provisioning prednosti kao uštedu odvojenu od kompresije i deduplikacije, ali neki saberu sve tri u jednu cifru. Ovo prilično zgodno doprinosi tome da njihovi odnosi redukcije podataka izgledaju sjajno. Thin provisioning se ne može smatrati redukcijom podataka zato što se nikakvi podaci ne redukuju.

Zaključak

Ne dozvolite da vam vaši proizvođači govore o tome koliko vam kapaciteta treba. Ako planirate da kupite određeni kapacitet fleša, obavezno se informišite koji su raw i usable kapaciteti, kao i effective kapacitet i pretpostavljen odnos redukcije podataka koji su koristili pri njegovom računanju. Zapamtite da usable kapacitet treba da bude manji od raw kapaciteta, dok će effective (koji je relevantan samo kada su prisutne tehnologije redukcije podataka) obično biti veći.

Imajte na umu da je effective kapacitet = usable kapacitet x faktor redukcije podataka.

Budite svesni da, kada vas proizvod čija je funkcija redukcije podataka uvek uključena obavesti koliko vam je kapaciteta još ostalo, je to u suštini samo pretpostavka. U stvarnosti, to u potpunosti zavisi od podataka koje nameravate da upišete. Always-on opcija redukcije podataka je samo još jedan marketinški trik pa bismo je lako mogli nazvati i ‘Neizbežna’ ili opcija “Bez izbora”.

Najbolja tehnologija redukcije podataka je ona koja je opciona i granularna. To znači da možete birati, na LUN nivou, da li želite da iskoristite opcije kompresije i/ili deduplikacije, ili ne – niste vezani za određenu arhitekturu. Kao što je slučaj i sa drugim funkcionalnostima, arhitektura bi trebalo da vam omogući da imate izbor, a ne da vam nameće kompromis.

Na kraju, zapamtite pravilo vezano za effective kapacitet. Ako je zagarantovan, onda rizik preuzima proizvođač. Ako ne žele da garantuju, onda je rizik na vama.