Google File System (GFS)

Autore: Robert Simon
Data Della Creazione: 15 Giugno 2021
Data Di Aggiornamento: 1 Luglio 2024
Anonim
Google File System - Paper that inspired Hadoop
Video: Google File System - Paper that inspired Hadoop

Contenuto

Definizione - Che cosa significa Google File System (GFS)?

Google File System (GFS) è un file system distribuito scalabile (DFS) creato da Google Inc. e sviluppato per soddisfare i crescenti requisiti di elaborazione dei dati di Google. GFS offre tolleranza d'errore, affidabilità, scalabilità, disponibilità e prestazioni a reti di grandi dimensioni e nodi connessi. GFS è costituito da numerosi sistemi di archiviazione realizzati con componenti hardware di base a basso costo. È ottimizzato per soddisfare le diverse esigenze di utilizzo e archiviazione dei dati di Google, come il suo motore di ricerca, che genera enormi quantità di dati che devono essere archiviati.


Il file system di Google ha sfruttato la forza dei server standardizzati minimizzando le debolezze dell'hardware.

GFS è anche noto come GoogleFS.

Un'introduzione a Microsoft Azure e Microsoft Cloud | In questa guida imparerai cos'è il cloud computing e in che modo Microsoft Azure può aiutarti a migrare e gestire la tua azienda dal cloud.

Techopedia spiega Google File System (GFS)

Il cluster di nodi GFS è un singolo master con più server di blocchi a cui è continuamente possibile accedere da diversi sistemi client. I server di blocchi archiviano i dati come file Linux su dischi locali. I dati memorizzati vengono suddivisi in blocchi di grandi dimensioni (64 MB), che vengono replicati nella rete almeno tre volte. Le grandi dimensioni del blocco riducono il sovraccarico della rete.

GFS è progettato per soddisfare i requisiti di cluster di Google di grandi dimensioni senza gravare sulle applicazioni. I file sono archiviati in directory gerarchiche identificate dai nomi dei percorsi. I metadati - come spazio dei nomi, dati di controllo degli accessi e informazioni sulla mappatura - sono controllati dal master, che interagisce e monitora gli aggiornamenti di stato di ciascun server di blocchi tramite battiti cardiaci a tempo.


Le funzionalità di GFS includono:

  • Tolleranza ai guasti
  • Replica dei dati critici
  • Ripristino automatico ed efficiente dei dati
  • Alta produttività aggregata
  • Interazione client e master ridotta a causa delle dimensioni del server di grandi dimensioni
  • Gestione e blocco dello spazio dei nomi
  • Alta disponibilità

I cluster GFS più grandi hanno più di 1.000 nodi con capacità di archiviazione su disco di 300 TB. Questo è accessibile da centinaia di clienti su base continua.