JobTracker

Autore: Roger Morrison
Data Della Creazione: 19 Settembre 2021
Data Di Aggiornamento: 21 Giugno 2024
Anonim
019 MapReduce Daemons JobTracker and TaskTracker Explained
Video: 019 MapReduce Daemons JobTracker and TaskTracker Explained

Contenuto

Definizione - Cosa significa JobTracker?

JobTracker è un demone che viene eseguito sul motore MapReduce di Apache Hadoops. JobTracker è un servizio essenziale che distribuisce tutte le attività MapReduce ai diversi nodi del cluster, idealmente a quei nodi che già contengono i dati, o almeno si trovano nello stesso rack dei nodi che contengono i dati.


Un'introduzione a Microsoft Azure e Microsoft Cloud | In questa guida imparerai cos'è il cloud computing e in che modo Microsoft Azure può aiutarti a migrare e gestire la tua azienda dal cloud.

Techopedia spiega JobTracker

JobTracker è il servizio all'interno di Hadoop che è responsabile dell'accettazione delle richieste dei clienti. Li assegna a TaskTrackers su DataNodes in cui i dati richiesti sono presenti localmente. Se ciò non è possibile, JobTracker tenta di assegnare le attività a TaskTrackers all'interno dello stesso rack in cui i dati sono presenti localmente. Se per qualche motivo anche questo non riesce, JobTracker assegna l'attività a un TaskTracker in cui esiste una replica dei dati. In Hadoop, i blocchi di dati vengono replicati su DataNodes per garantire la ridondanza, in modo che se un nodo nel cluster fallisce, anche il lavoro non fallisce.

Processo JobTracker:


  1. Le richieste di lavoro dalle applicazioni client vengono ricevute da JobTracker,
  2. JobTracker consulta il NameNode al fine di determinare la posizione dei dati richiesti.
  3. JobTracker individua i nodi TaskTracker che contengono i dati o almeno sono vicini ai dati.
  4. Il lavoro viene inviato al TaskTracker selezionato.
  5. TaskTracker esegue i suoi compiti mentre viene attentamente monitorato da JobTracker. Se il lavoro non riesce, JobTracker reinvia semplicemente il lavoro a un altro TaskTracker. Tuttavia, JobTracker stesso rappresenta un singolo punto di errore, ovvero se si guasta l'intero sistema si arresta.
  6. JobTracker aggiorna il suo stato al completamento del lavoro.
  7. Il richiedente client può ora eseguire il polling delle informazioni da JobTracker.