GlusterFS - raspodijeljeni podatkovni sustav

Srce je pripremilo seminar za CARNetove sistem-inženjere koji je održao stručnjak za clustere Emir Imamagić. Seminar je održan 3.4. u Splitu i dan kasnije u Zagrebu. Tema je bila GlusterFS, raspodijeljeni podatkovni sustav. U nazivu se krije (GNU?) cluster file system. Radi se o alatu koji omogućuje izgradnju podatkovnih oblaka, međutim pomoću njega se može minimalnim ulaganjima stvoriti vrstu mrežnog RAID polja od diskovnog prostora koji je neiskorišten i raspoloživ na više računala. Pri tome se kreiraju logički diskovi, volumes, kojima pristupaju klijenti preko NFS i CIFS protokola.

Softver je razvijen za Linux, dostupni su paketi za RedHat i Debian, dok klijenti trebaju podržavati standardne protokole, NFS ili CIFS. To znači da datotečni poslužitelji mogu biti samo Linuxi, dok virtualne diskove kao klijenti mogu koristiti i Linux i Windows računala. Podrazumijevani način povezivanja diskova je distributed, što znači da se naprosto pribrajaju diskovi na razlilčitim računalima, a datoteke se, koristeći ugrađene algoritme, raspodjeljuju po njima. Na taj način dobija se najviše diskovnog prostora, ali zbog nedostatka redundancije ispadom jednog čvorišta podaci koji su spremljeni na njemu prestaju biti dostupni. Sigurnije je čuvati redundantne kopije podataka, korištenjem replicated sustava, ili kombinacijom distributed-replicated. Moguće je, tamo gdje su podaci jako važni, sustav podesiti da čuva višestruke kopije podataka, raspršene po čvorištima virtualnog spremišta. Treći način zapisivanja podatka je stripe, koji, poput RAID 0 polja, istu datoteku istovremeno zapisuje na različite diskove. Izbor načina zapisivanja podataka ovisi o poslovnim potrebama korisnika. Zanimljivo je da se novi diskovi mogu dinamički dodavati, bez zaustavljanja rada sustava i za korisnike posve neprimjetno, pri čemu praktički nema ograničenja veličine diskovnog prostora, jer GlusterFS može skalirati do količina koje se mjere petabytima.

RedHat je kupio GlusterFS i intenzivno ga razvija, dodajući grafičko sučelje za konfiguraciju i nadzor rada, te nastojeći uspostaviti interoperabilnost s projektima Apache Hadoop i Open Stack, kako bi korisnicima bio na raspolaganju cjelovit sustav za uspostavu računarstva u oblacima zasnovan na softveru otvorenog koda.

Grafičko sučelje gotovo da i nije potrebno, jer je komandnolinijska konfiguracija izuzetno jednostavna. Dovoljno se ulogirati u jedno čvorište i ukucati naredbe, one će se replicirati na sva ostala čvorišta i prilagoditi konfiguracijske datoteke. Zanimljivo je da je predavač u praktičnom dijelu predavanja demonstrirao rad novog oblaka Srca, u kojem je priredio virtualna računala kao čvorišta i klijente, te pomoću njih demonstrirao lakoću konfiguracije i korištenja GlusterFS-a.

Publika je u Zagrebu bila malobrojna, možda zbog "egzotičnosti" teme, ili zbog činjenice da mnogi kolege ne mogu tako lako dobiti dopuštenje svojih uprava za prisustvovanje edukaciji, pa makar ona bila besplatna. To je šteta, jer je GlusterFS izuzetno zanimljiv softver, kojim se može riješiti mnogo praktičnih problema. Na primjer, ako na nekom serveru nema dovoljno diskovnog prostora, lako mu je pridružiti slobodan prostor na drugim serverima. Drugi primjer je kreiranje dinamičnog virtualnog spremišta za poslovne podatke, pri čemu podaci mogu biti automatski replicirani u višestrukim kopijama, na različitim računalima, čime se smanjuje rizik od njihova gubitka.

 

Vijesti: 
Vote: 
0
No votes yet