Arhitectura Hyperflex si modul de functionare

Adrian Murgescu

adrian.murgescu@alef.com

Arhitectura

In sistemele Cisco Hyperflex, platforma de date (Data Platform) se distribuie pe trei sau mai multe noduri, pentru a crea un cluster cu disponibilitate ridicata. Fiecare nod include un controler Cisco HyperFlex HX Data Platform care implementează sistemul de fisiere distribuit utilizand discuri SSD si discuri de mare capacitate pentru stocarea datelor. Controlerele comunică între ele prin intermediul interfetelor Gigabit de mare viteza (sunt disponibile interfete de 10, 25, 40 Gigabit), pentru a prezenta un singur pool de de stocare care acopera nodurile din cadrul clusterului (vezi figura de mai jos). Nodurile accesează datele printr-un strat de date utilizând plugin-uri de fișiere, blocuri, obiecte și API-uri. Pe masura ce se adauga noduri, clusterul scaleaza liniar, furnizand atat cresterea capacitatii de stocare, cat si cresterea performantei I/O.

Cisco hyperflex arhitectura

In mediul VMware vSphere, controlerul este o masina virtuala cu un numar de nuclee de procesare si o cantitate de memorie RAM, dedicate. Acest lucru ii permite sa asigure o performanta consistenta, fara a afecta performanta celorlalte masini virtuale care ruleaza pe cluster. Controlerul poate accesa toata capacitatea de stocare fara interventia hypervizorului prin intermediul functionalitatii VMware VM_DIRECT_PATH. Discurile SSD ale nodurilor sunt utilizate ca strat de caching distribuit, iar discurile de capacitate sunt utilizate ca strat distribuit de stocare. Controlerul se integreaza cu hypervizorul VMware prin utilizarea a doua VIB-uri preinstalate in imaginea ESXi (VMware ESXi vSphere Installation Bundles):

  • IO Visor: acest VIB furnizeaza un punct de montare (mount point) pentru un sistem de fisiere de retea (NFS), astfel incat hypervizorul ESXi sa poata accesa discurile virtuale ale masinilor virtuale. Din perspectiva hypervizorului, acesta este un sistem de fisiere in retea.
  • VMware vStorage API for Array Integration (VAAI): Acest API de storage offload, permite vSphere sa ceara operatii avansate pentru sistemul de fisiere, cum ar fi clonare, snapshot-uri, etc. Controlerul va putea sa faca aceste operatii sa se intample prin manipularea metadatelor, si nu prin copierea efectiva a datelor.

Cum functioneaza

Controlerul  Cisco HyperFlex HX Data Platform intermediaza toate cererile de citire si scriere catre volumele de date, ce sunt cerute de catre hypervisor, si implicit de catre masinile virtuale. (Hypervizorul are un disc de boot dedicat, si separat de sistemul de fisiere “Data Platform”) Platforma de date creaza un sistem de fisiere structurat pe baza de log-uri, si care utilizeaza un strat de caching, implementat cu ajutorul discurilor SSD, strat care va ajuta la accelerarea cererilor de scriere si citire, si un strat de persistenta, implementat cu discuri de capacitate (rotative sau SSD, in functie de tipul de Hyperflex ales).
Distribuirea efectiva a datelor este realizata prin felierea datelor primite (data stripe units), si stocarea acestora in mod egal pe toate nodurile din cluster. Numarul de copii ale datelor este determinat de politica stabilita de administrator. Cand o aplicatie scrie date, datele sunt trimise catre nodul relevant, bazandu-se pe felia corespunzatoare de date. Aceasta abordare cu date distribuite, in combinatie cu capabilitatea de a avea mai multe fluxuri de scriere paralele, permite evitarea punctelor fierbinti, atat din punct de vedere retea, cat si din punct de vedere stocare. Aceasta abordare va permite livrarea aceleiasi performante catre masinile virtuale, indiferent de locatia acestora, oferind in acelasi timp flexibilitate in plasarea acestora.

Puteti de asemenea sa urmariti video-ul de mai jos. Veti putea vedea, intr-un mod mult mai granular cum interactioneaza intre ele, componentele solutiei Cisco Hyperflex :