I grandi dati hanno un problema, ma non è la tecnologia

Autore: Judy Howell
Data Della Creazione: 26 Luglio 2021
Data Di Aggiornamento: 8 Maggio 2024
Anonim
I grandi dati hanno un problema, ma non è la tecnologia - Tecnologia
I grandi dati hanno un problema, ma non è la tecnologia - Tecnologia

Contenuto


Porta via:

Il termine big data viene utilizzato sia dai professionisti del marketing che dai professionisti IT, spesso in modo casuale e scorretto. In questo articolo descriviamo bene che cosa sono veramente i big data e cosa è solo un problema di marketing.

I big data stanno affrontando un grosso problema in questi giorni e, cosa abbastanza interessante, non hanno nulla a che fare con la tecnologia. No, questo è un problema di pubbliche relazioni, in cui i big data sono un po 'come le famigerate buffonate di Tom Cruise su Oprah: tutti ne parlavano, ma la maggior parte delle persone non aveva idea di cosa significasse (e il resto probabilmente non gliene importava) . Per le celebrità, l'oscurità dell'hype può essere un gradito jackpot. Quando si tratta di business e tecnologia, tuttavia, le parole d'ordine come i big data non colmano sempre il divario tra il CTO che vuole implementare i big data e il CEO che vuole sapere perché.


Una definizione completa di big data potrebbe essere ancora oggetto di dibattito, ma ciò di cui nessuno discute è che i big data stanno diventando più grandi di giorno in giorno, con i dati aziendali che esplodono di anno in anno e le interazioni dei social media si estendono in centinaia di milioni al giorno. E man mano che gli affari di ogni tipo diventano sempre più digitali, la quantità di dati disponibili è destinata a diventare ancora più grande. Ecco perché è importante capire come i big data possono aiutare. Quindi diamo un'occhiata a come potrebbero essere definiti i big data e perché la riduzione di tale definizione sta diventando sempre più preziosa per le aziende di tutte le dimensioni. (Segui la conversazione online sui big data controllando gli esperti sui Big Data da seguire.)

Cosa sono i Big Data?

Alcuni chiamano semplicemente qualsiasi situazione con "molti" dati big data. Questo non è corretto Mentre un grande volume di informazioni fa parte della definizione, è incompleto. Le persone hanno elaborato grandi volumi di dati per decenni. Questo significa che il tuo database da 10 GB degli anni '90 era un grande dato perché sembrava molto al momento?


Penso che conosciamo tutti la risposta a questa domanda. Allora, cosa traccia la linea tra molti dati e big data? Questo concetto è stato meglio spiegato da Doug Laney alla fine del 2000 - sì, scusate, i big data non sono nuovi! Ha fatto riferimento alle "3 V" dei big data: volume, velocità e varietà. Queste V caratterizzano i diversi aspetti dei big data e rappresentano anche le sue sfide principali. In altre parole, sono ciò con cui chiunque deve tentare di implementare i big data deve fare i conti. Questo framework aiuta anche a spiegare i tipi di software e tecnologia richiesti per affrontare queste sfide. Diamo un'occhiata a ciascuno a turno. (Ottieni maggiori informazioni sulle 3 V nella sfida Big Data di oggi deriva dalla varietà, non dal volume o dalla velocità.)

Pensa ad alcune delle aziende considerate precursori dei big data, come Google e. Chiaramente, queste aziende hanno molto volume in termini di dati digitali, ma la velocità con cui tali dati vengono formati è anche incredibilmente veloce e, in molti casi, sta accelerando. Nell'agosto del 2012, ha rivelato che il suo sistema stava elaborando 2,5 miliardi di contenuti - e oltre 500 terabyte di dati - ogni giorno.

La velocità dipende dalla rapidità con cui i dati possono essere acquisiti e analizzati, poiché i risultati più rapidi sono disponibili e le aziende più veloci possono rispondere ad essi. In alcuni casi aziendali, anche un minuto sarebbe del tutto inaccettabile: la velocità di inversione di tendenza viene misurata in secondi (o frazioni di secondo). Un ottimo esempio di questa esigenza di velocità può essere trovato nell'e-commerce. Pensa a come Amazon.com può acquistare un cliente e, al momento del rendering della schermata di conferma, dai loro una raccomandazione personalizzata per l'acquisto di nuovi prodotti. Quel tipo di elaborazione istantanea è ora la norma accettata. La velocità, quindi, è una sfida nei big data perché se i dati non possono essere sgranati abbastanza rapidamente, potrebbero non essere utili. (Maggiori informazioni sui Big Data: come vengono acquisiti, elaborati e utilizzati per prendere decisioni aziendali.)

Nessun bug, nessuno stress: la tua guida passo passo alla creazione di software che ti cambia la vita senza distruggere la tua vita

Non puoi migliorare le tue capacità di programmazione quando a nessuno importa della qualità del software.

Varietà

Se solo i dati si presentassero sempre come uniformi, ordinati e pronti per l'elaborazione in un database relazionale. Tuttavia, maggiore è il numero di dati raccolti da un'organizzazione, maggiore è la probabilità che arrivi in ​​forme diverse, ad esempio immagini o dati dei sensori. Sul Web, anche diversi browser, software e impostazioni dell'utente possono portare alla raccolta di dati incoerenti. Certo, potresti ripulire le cose e conservare ciò che è utile, ma i big data generalmente mirano a conservare qualunque cosa, che rende la varietà di dati una grande sfida in termini di impostazione dell'architettura dei big data. Di conseguenza, comporta lo sviluppo di database più agili e meno strutturati per estrarre e archiviare dati diversi. Per coloro che desiderano implementare l'infrastruttura dei big data, ciò che significa veramente è approfondire alcune tecnologie nuove e intimidatorie e impegnarsi molto per rendere utili dati così diversi.

Una grande definizione per una grande sfida

In sintesi, pensare ai big data come a dati non strutturati ed è quindi difficile elaborarli utilizzando architetture di database tradizionali. Il modo in cui ti arriva è un po 'come bere da una manichetta antincendio, motivo per cui il modello 3 Vs fa un ottimo lavoro nel descriverlo e definirlo.

Per essere chiari, alcuni discutono con questo e affermano che i big data sono ancora mal definiti. In realtà, è più simile ai big data, in quanto concetto, è troppo grande e troppo complesso per essere incapsulato in un singolo termine. Ed Dumbill, presidente del programma della conferenza Oilly, Strata, descrive i big data come "dati che superano la capacità di elaborazione dei sistemi di database". Quella definizione semplice e concisa dice tutto, almeno in teoria. In pratica, le sfide che devono essere superate nei big data sono molto più complicate.

Come ha scritto Marc Andreesen in un articolo dell'agosto 2011 per il Wall Street Journal, "tutta la tecnologia necessaria per trasformare le industrie attraverso il software finalmente funziona e può essere ampiamente distribuita su scala globale". Ciò ha generato una nuova necessità per l'approccio statistico, il pensiero sistemico e l'apprendimento automatico associati ai big data. Quindi, qualunque sia la definizione, è chiaro che i big data sono una delle opportunità più importanti nell'IT.