La sfida dei big data di oggi deriva dalla varietà, non dal volume o dalla velocità

Autore: Judy Howell
Data Della Creazione: 28 Luglio 2021
Data Di Aggiornamento: 1 Luglio 2024
Anonim
La sfida dei big data di oggi deriva dalla varietà, non dal volume o dalla velocità - Tecnologia
La sfida dei big data di oggi deriva dalla varietà, non dal volume o dalla velocità - Tecnologia

Contenuto


Porta via:

Troppi dipartimenti IT lanciano tutto ciò che hanno sui problemi di volume e velocità dei dati, dimenticando di affrontare il problema fondamentale della varietà dei dati.

La sfida di gestire e sfruttare i big data deriva da tre elementi, secondo Doug Laney, vicepresidente della ricerca di Gartner. Laney ha notato per la prima volta oltre un decennio fa che i big data rappresentano un problema per l'impresa perché introducono volume, velocità e varietà difficili da gestire. Il problema è che troppi dipartimenti IT lanciano tutto ciò che hanno sui problemi di volume e velocità dei dati, dimenticando di affrontare il problema fondamentale della varietà di dati.

Nel 2001 Laney ha scritto che "le aziende leader useranno sempre più un data warehouse centralizzato per definire un vocabolario comune per migliorare la collaborazione interna ed esterna". La questione di quel vocabolario - e la variabilità che impedisce alle aziende di crearlo - rimane oggi l'aspetto meno affrontato dell'enigma dei big data. (Scopri cosa hanno da dire gli altri esperti. Dai un'occhiata agli esperti di Big Data per continuare.)


Tre V di big data

Numerose aziende hanno trovato metodi per sfruttare il volume e la velocità di dati aumentati. , ad esempio, può analizzare enormi volumi di dati. Naturalmente, questi dati vengono spesso presentati più e più volte all'interno degli stessi parametri. Ciò ha guidato innovazioni tecnologiche come i database delle colonne, che ora sono ampiamente utilizzati da altre società che affrontano negozi ugualmente considerevoli di elementi di dati simili.

In termini di velocità di addomesticamento, fornitori come Splunk aiutano le aziende ad analizzare rapidamente i dati creati attraverso file di registro che catturano diverse migliaia di eventi al secondo. Questa analisi di eventi ad alto volume è mirata ai casi d'uso di sicurezza e monitoraggio delle prestazioni. Come per la sfida del volume di dati, la sfida della velocità è stata ampiamente affrontata attraverso sofisticate tecniche di indicizzazione e analisi dei dati distribuite che consentono di ridimensionare la capacità di elaborazione con una maggiore velocità dei dati.


Quando si tratta di varietà, tuttavia, troppe aziende devono ancora affrontare un grosso problema nel loro approccio all'analisi dei big data. Questo problema è determinato da tre fattori: in primo luogo, a causa della crescita, delle acquisizioni e delle innovazioni tecnologiche che aggiungono nuovi sistemi all'ambiente, le imprese sono bloccate in un ambiente altamente eterogeneo e questa eterogeneità aumenta solo con il tempo. Le aziende devono tenere traccia di una moltitudine di tipi di sistemi e gestire decine di migliaia di tipi di dati, nonché gli stessi dati rappresentati utilizzando nomenclature e formati diversi.

In secondo luogo, questi sistemi e tipi di dati in molti casi riportano sia informazioni pertinenti che informazioni che possono essere filtrate in modo sicuro come irrilevanti per il problema affrontato. È necessario identificare in modo affidabile le informazioni di impatto.

La terza dimensione della sfida della varietà è la costante variabilità o cambiamento nell'ambiente. I sistemi vengono aggiornati, vengono introdotti nuovi sistemi, vengono aggiunti nuovi tipi di dati e viene introdotta una nuova nomenclatura. Ciò compromette ulteriormente la nostra capacità di domare la sfida della varietà dei dati. Questo aggiunge un ulteriore livello alla sfida della varietà. (Per ulteriori approfondimenti, dai un'occhiata ai Big Data: come vengono acquisiti, elaborati e utilizzati per prendere decisioni aziendali.)

Affrontare il problema della varietà dei dati

Per affrontare il problema della varietà dei dati, le aziende devono iniziare con il dominio IT, poiché spesso rappresenta sia i peggiori trasgressori sia le peggiori vittime del problema di varietà. Il primo passo è iniziare con una definizione o tassonomia completa di tutti gli elementi o risorse IT. Ciò fornisce una base o una base per fare riferimento a qualsiasi cosa all'interno o sull'IT e consente alle aziende di gestire la crescente eterogeneità rispetto a una tassonomia o terminologia nota.

Nessun bug, nessuno stress: la tua guida passo passo alla creazione di software che ti cambia la vita senza distruggere la tua vita

Non puoi migliorare le tue capacità di programmazione quando a nessuno importa della qualità del software.

Il prossimo passo è identificare i numerosi modi in cui lo stesso oggetto è rappresentato attraverso diversi sistemi di registrazione. Ciò consente ai professionisti IT di guardare attraverso il loro ambiente eterogeneo e di filtrare e comprimere i dati in blocchi pertinenti e gestibili.

Infine, i responsabili IT devono adottare un processo di esame costante dell'ambiente per verificare che vengano introdotti cambiamenti come nuovi tipi di elementi o nuove nomenclature per fare riferimento allo stesso elemento.

Con questi passaggi, le organizzazioni IT possono gestire il problema della varietà e ricavare intuizioni profonde che hanno storicamente eluso i team IT. Inoltre, la gestione del problema della varietà migliora notevolmente il loro ritorno sugli investimenti in strumenti e tecniche che affrontano i più tradizionali problemi relativi ai big data di volume e velocità.