Qual è la differenza tra big data e Hadoop?

Autore: Judy Howell
Data Della Creazione: 5 Luglio 2021
Data Di Aggiornamento: 23 Giugno 2024
Anonim
Qual è la differenza tra big data e Hadoop? - Tecnologia
Qual è la differenza tra big data e Hadoop? - Tecnologia

Contenuto

D:

Qual è la differenza tra big data e Hadoop?


UN:

La differenza tra i big data e il programma software open source Hadoop è distinta e fondamentale. Il primo è un vantaggio, spesso complesso e ambiguo, mentre il secondo è un programma che realizza una serie di obiettivi e obiettivi per gestire tale bene.

I big data sono semplicemente le grandi serie di dati che le aziende e le altre parti mettono insieme per servire obiettivi e operazioni specifici. I big data possono includere molti diversi tipi di dati in molti diversi tipi di formati. Ad esempio, le aziende potrebbero dedicare molto lavoro alla raccolta di migliaia di dati sugli acquisti in formati di valuta, su identificativi dei clienti come nome o numero di previdenza sociale o sulle informazioni sui prodotti sotto forma di numeri di modello, numeri di vendita o numeri di inventario. Tutto questo, o qualsiasi altra grande mole di informazioni, può essere chiamato big data. Di norma, è grezzo e non ordinato fino a quando non viene sottoposto a vari tipi di strumenti e gestori.


Hadoop è uno degli strumenti progettati per gestire i big data. Hadoop e altri prodotti software lavorano per interpretare o analizzare i risultati delle ricerche sui big data attraverso specifici algoritmi e metodi proprietari. Hadoop è un programma open source con licenza Apache gestito da una comunità globale di utenti. Include vari componenti principali, tra cui un set di funzioni MapReduce e un file system distribuito Hadoop (HDFS).

L'idea alla base di MapReduce è che Hadoop può prima mappare un set di dati di grandi dimensioni, quindi eseguire una riduzione su quel contenuto per risultati specifici. Una funzione di riduzione può essere considerata come una sorta di filtro per i dati non elaborati. Il sistema HDFS agisce quindi per distribuire i dati attraverso una rete o migrarli secondo necessità.

Gli amministratori di database, gli sviluppatori e altri possono utilizzare le varie funzionalità di Hadoop per gestire i big data in vari modi. Ad esempio, Hadoop può essere utilizzato per perseguire strategie di dati come il clustering e il targeting con dati non uniformi o dati che non si adattano perfettamente a una tabella tradizionale o rispondono bene a semplici query.