Cluster File-rendszerek
Összehasonlítása
Gere Csaba
tudományos munkatárs
Internet Technológiák és Alkalmazások Központ
MTA-SZTAKI
H-1132 Budapest, Victor Hugo u. 18-22.
telefon: (+36 1) 2796027
email: gcsaba@sztaki.hu
Stefán Péter
tudományos munkatárs
Szuperszámítógép Központ
NIIF Iroda
H-1132 Budapest, Victor Hugo u. 18-22.
telefon: (+36 1) 4503076
email: stefan@niif.hu
Kivonat
Napjainkban egyre fontosabbá válik a központi szolgáltatások tartalékolt környezetbe való átültetése. A tartalékolás, mint szolgáltatási irányvonal célja az, hogy a szolgáltatás rendelkezésre állását magas szinten (99,9%) lehessen tartani, akár úgy, hogy az adott szolgáltatás rendkívüli esemény bekövetkezésekor (valamely gép szoftver vagy hardver meghibásodásakor) csökkent teljesítménnyel működjön. A tartalékolásnak, tartalékolt rendszerek kiépítésének nagyon sokféle módja és szintje lehet, ezek közül az egyik, legalsó szint, a tartalékolt file-rendszer megoldások problémaköre.
A tartalékolt file-rendszerek elsősorban a hálózati file-rendszerből (NFS) fejlődtek ki oly módon, hogy azzal szemben a fokozódó igények egyre inkább olyan követelményeket támasztottak, melyeket az már nem tudott kielégíteni.
A cluster fájlrendszerekkel szemben támasztott legfontosabb igények többek között a hiba-tolerancia, (tartalékolás, elosztott adatok kezelése, failover), terhelésmegosztás, nagy sávszélesség hatékony kihasználása, skálázhatóság és hatékony erőforrás-menedzsment (diszkkapacitás-bővítés/csökkentés, terület-összefűzés, tükrözés, stripe-olás).
A cluster file-rendszerek alapvetően háromféle modellben használhatóak: normál (lokális) file-rendszer, hálózati file szolgáltatás, illetve mint tároló-hálózat, SAN architektúra.
Lokális file-rendszerként általában nem használnak cluster file-rendszereket, hiszen ebben az esetben ezek sok fontos tulajdonsága nem, vagy csak rendkívül korlátozott mértékben használható ki, ráadásul rosszabb teljesítmény-jellemzőkkel, mint a normál file-rendszerek.
A file szerver típusú kialakítás azt jelenti, hogy egy adott hálózatban vannak speciális gépek, file szolgáltatók, melyek kizárólagosan kapcsolódnak a háttértároló-kapacitáshoz, és ezek normál (például IP) hálózaton keresztül szolgáltatják a fájlrendszert az összes többi gép számára. Ebben a modellben az alapvető elvárás az, hogy a szerverek képesek legyenek egymástól szolgáltatói feladatot átvenni, a kliensek számára transzparens módon.
A SAN felépítés esetén minden gép fizikailag is kapcsolódik a diszkekhez, rendszerint Fibre Channel kapcsoló (FC switch), vagy hurok (FC loop) segítségével. E megoldás esetén minden gép ugyanazt a diszk-területet látja fizikailag, és ekkor a file-rendszer feladata elsősorban az, hogy a különböző gépek a közös fizikai területen, minél hatékonyabban tudjanak írási, olvasási műveletet végezni anélkül, hogy egymást zavarnák.
A cikkben azt vizsgáljuk, hogy az NIIF Iroda géptermében, 2003 januárjában üzembe helyezett EMC Storage felhasználásával, hogyan alakíthatók ki tartalékolt file szolgáltatások, illetve azok milyen teljesítmény-jellemzőkkel bírnak. Több vizsgált cluster file-rendszer közül az IBM GPFS, illetve a Sistina GFS rendszerekhez kapcsolódó tapasztalatainkat, konfigurációs problémákat, azok lehetséges megoldásait, illetve a mért teljesítmény-jellemzőket szeretnénk összefoglalni.