GlusterFS: di cosa si tratta?

GlusterFS è un file system distribuito e liberamente scalabile, che aggrega elementi di archiviazione da più server in un unico file system. I file system operano dietro le quinte. Generalmente dopo l’installazione non vengono più presi in considerazione, a meno che i dati non vengano persi o il file system non arrivi al limite, a causa, ad esempio, della dimensione massima di una partizione o dei limiti di profondità del percorso di memoria.

Cosa significa e cos’è GlusterFS?

Il nome “Gluster” deriva da “GNU” (GNU’s not Unix) e “Cluster”. Il sistema è stato pubblicato sotto la GNU General Public License (GNU-GPLS) e può quindi essere utilizzato gratuitamente. Il termine “cluster” (traduzione letterale: “grappolo”) descrive, nel contesto dei supporti di dati, il raggruppamento logico di unità fisiche di memoria. Nell’ambito dei computer si riferisce a una combinazione in rete di più sistemi. GlusterFS unisce questi approcci raggruppando lo spazio di archiviazione dei computer collegati in rete e utilizzandolo come unità logica.

Il progetto è stato pubblicato nel 2005 da Gluster Inc. Nel 2011, il distributore Linux RedHat ha rilevato l’azienda e da allora ha continuato a sviluppare il file system. La versione 7 di GlusterFS è stata rilasciata nel gennaio 2020; essa è disponibile precompilata per le seguenti distribuzioni Linux:

  • CentOS
  • Debian
  • Fedora
  • RedHat/RHEL
  • SUSE
  • Ubuntu

La restrizione ai sistemi basati su Unix è dovuta all’integrazione della memoria tramite il modulo FUSE, che non è ancora in grado di garantire una sufficiente stabilità in Windows.

N.B.

FUSE è l’abbreviazione di File System in Userspace. I sistemi operativi sono solitamente divisi in spazio utente e kernel. Quest’ultimo è particolarmente protetto e accessibile solo con diritti di amministratore. Pertanto, il montaggio (“mounten”) e la gestione delle unità sono generalmente possibili solo con diritti di amministratore. Tuttavia, FUSE consente di gestire i file system anche agli utenti.

I computer possono fungere da server e da client. L’accesso al file system è possibile anche da altri sistemi. Sono supportati NFS (Network File System) e SMB/CIFS (Server Message Block/Common Internet File System).

Funzionamento di GlusterFS

Un file system distribuito ha senso solo se più computer sono collegati tra loro. Nella documentazione di GlusterFS vengono richiesti almeno tre server. Il termine “server”, tuttavia, non va preso alla lettera, in quanto può comprendere praticamente ogni forma di hardware fisico o emulato. Oltre a qualsiasi computer, è fattibile anche l’uso di macchine virtuali, con vantaggi soprattutto in termini di flessibilità.

I server integrati fungono da Nodes (punti nodali), che si collegano tramite la rete TCP/IP. I dispositivi integrati formano un cosiddetto Trusted Pool, ovvero un’interconnessione di server affidabili. Questi mettono a disposizione la loro memoria sotto forma di Bricks (mattoni), sui quali vengono formati i Volumes (unità). Questi ultimi possono essere montati e utilizzati come normali supporti dati. I computer che accedono vengono definiti client. Un PC può essere sia server, sia client.

Una caratteristica particolare è la grande scalabilità: infatti è possibile aggiungere in un secondo momento un numero qualsiasi di Nodes e Bricks. Ciò consente di adattare continuamente le dimensioni dello spazio di memoria in base alle esigenze. La dimensione massima della memoria da gestire è di diversi petabyte.

Inoltre, GlusterFS garantisce la sicurezza attraverso la ridondanza. Il rischio di guasto è inizialmente distribuito su più sistemi, che possono anche essere separati fisicamente. Inoltre, è possibile impostare gruppi RAID, dove, invece del Volume Distribuito standard, deve essere creato un Volume Replicato. Questo volume memorizza ogni file due volte e corrisponde ad un Mirror-RAID.

Fatto

Il Redundant Array of Independent Disks (RAID) è un’interconnessione di dischi rigidi, fisicamente indipendenti, sui quali viene costruita un’unità coerente. A seconda dell’obiettivo, si può dare più importanza alla velocità o alla sicurezza dei dati. Di conseguenza, lo spazio di archiviazione viene poi ridotto tramite un’archiviazione multipla dei dati o tramite la memorizzazione di informazioni aggiuntive per il recupero di un file.

GlusterFS offre dieci Translator predefiniti per le operazioni sullo spazio di memoria, che traducono i comandi per l’esecuzione sulla memoria, impartiti con i diritti dell’utente. Ne sono un esempio il translator “Storage”, che memorizza i dati sul file system locale e ne controlla l’accesso, o il translator “Encryption”, responsabile della crittografia.

Una nuova funzionalità è la replica geografica, che permette la distribuzione asincrona di dati su server con ubicazioni diverse. Ciò offre una protezione aggiuntiva da impatto fisico sui server, ad esempio attraverso eventi dannosi come incendi o furti. Un computer funge da Master e un altro da Slave e la trasmissione dei dati è protetta da SSH (Secure Shell).

Vantaggi e svantaggi di GlusterFS

Abbiamo riassunto per voi alcuni vantaggi e svantaggi di un file system distribuito rispetto a un sistema di archiviazione di rete convenzionale:

Vantaggi di Gluster Svantaggi di Gluster
Buon utilizzo delle capacità esistenti Creazione di una struttura di rete più complessa
Maggior sicurezza Maggior impegno amministrativo durante l’installazione
Distribuzione del carico di rete Necessità di un’infrastruttura di rete veloce
Ottima scalabilità Sforzo supplementare per la sicurezza tecnica

Casi d’uso di GlusterFS

In linea di principio, GlusterFS riflette esemplarmente un cloud. Lo spazio di memoria che si trova in un cluster è reso accessibile ai client collegati. Ciò è particolarmente adatto per le reti di grandi dimensioni in cui sono disponibili risorse sufficienti per creare un’interconnessione.

Poiché i dispositivi sono collegati tramite il protocollo Internet, il file system distribuito è adatto soprattutto alle strutture aziendali con più filiali. Tuttavia, anche nelle strutture più circoscritte, si può risparmiare in tal modo memoria di rete, senza dover rinunciare alla ridondanza.

Alternative a GlusterFS

Un’alternativa a GlusterFS è Ceph, che è disponibile gratuitamente e offre molti dei vantaggi dei file system distribuiti che vi abbiamo elencato sopra. Ceph e Gluster hanno rispettivamente diversi vantaggi e svantaggi.

BeeGFS (ex FhGFS) è stato sviluppato dal Fraunhofer Institut soprattutto per sistemi informatici ad alte prestazioni. Inoltre è gratuito e si distingue per una funzionalità semplice.

Nel settore commerciale esistono anche sistemi Microsoft come Storage Spaces Direct (S2D), anche se il loro utilizzo è limitato ai server Windows con licenza a pagamento.

Hai trovato questo articolo utile?
Per offrirti una migliore esperienza di navigazione online questo sito web usa dei cookie, propri e di terze parti. Continuando a navigare sul sito acconsenti all’utilizzo dei cookie. Scopri di più sull’uso dei cookie e sulla possibilità di modificarne le impostazioni o negare il consenso.
Page top