Analisi dei Big Data open source

Autore: Laura McKinney
Data Della Creazione: 1 Aprile 2021
Data Di Aggiornamento: 14 Maggio 2024
Anonim
Top 6 Tool Types For Data Analysis / Data Science - Save hours by using the right tool
Video: Top 6 Tool Types For Data Analysis / Data Science - Save hours by using the right tool

Contenuto

Definizione - Cosa significa Open Data Source Big Analytics?

L'analisi dei big data open source si riferisce all'uso di software e strumenti open source per l'analisi di enormi quantità di dati al fine di raccogliere informazioni pertinenti e fruibili che un'organizzazione può utilizzare al fine di promuovere i propri obiettivi aziendali. Apaches Hadoop è il più grande player nell'analisi dei big data open source: è la libreria software più utilizzata per elaborare enormi set di dati in un cluster di computer utilizzando un processo distribuito per il parallelismo.


Un'introduzione a Microsoft Azure e Microsoft Cloud | In questa guida imparerai cos'è il cloud computing e in che modo Microsoft Azure può aiutarti a migrare e gestire la tua azienda dal cloud.

Techopedia spiega Open Data Source Big Analytics

L'analisi dei big data open source si avvale di software e strumenti open source per eseguire l'analisi dei big data utilizzando un'intera piattaforma software o vari strumenti open source per diverse attività nel processo di analisi dei dati. Apache Hadoop è il sistema più noto per l'analisi dei big data, ma sono necessari altri componenti prima di poter mettere insieme un vero sistema di analisi.

Hadoop è l'implementazione open source dell'algoritmo MapReduce lanciato da Google e Yahoo, quindi è oggi la base della maggior parte dei sistemi di analisi. Molti strumenti di analisi dei big data si avvalgono dell'open source, inclusi robusti sistemi di database come MongoDB open source, un database NoSQL sofisticato e scalabile molto adatto per applicazioni di big data, così come altri.


I servizi di analisi dei big data open source comprendono:

  • Sistema di raccolta dati
  • Centro di controllo per l'amministrazione e il monitoraggio dei cluster
  • Libreria di machine learning e data mining
  • Servizio di coordinamento dell'applicazione
  • Calcola il motore
  • Quadro di esecuzione