Come coltivare uno scienziato di dati

Autore: Judy Howell
Data Della Creazione: 26 Luglio 2021
Data Di Aggiornamento: 21 Giugno 2024
Anonim
Lodi - Presentazione libro "Pensa come uno scienziato Come coltivare.... (28.10.21)
Video: Lodi - Presentazione libro "Pensa come uno scienziato Come coltivare.... (28.10.21)

Contenuto


Porta via:

Per alimentare i data scientist, le aziende devono concentrarsi maggiormente sulla cultura e sulla struttura organizzativa.

Tra le startup tecnologiche, data scientist è un termine sempre più comune usato per indicare i fanatici dei dati in grado di collegare aree funzionali tradizionalmente separate dell'intelligenza dei dati. Uno scienziato di dati è qualcuno che si sente a proprio agio nell'esecuzione di diversi (se non tutti) aspetti dei progetti di data intelligence:

  1. Acquisizione dati: ciò potrebbe comportare la scrittura di parser e crawler Web o script personalizzati destinati a servizi Web o API specifici per origini dati non tradizionali.
  2. Gestione dei dati: ETL, manipolazione, query e gestione dei dati in database, archivi di valori-chiave o Hadoop.
  3. Visualizzazione delle informazioni: scoprire modelli attraverso l'uso di toolkit di visualizzazione statica e / o piattaforme interattive basate su Flash, JavaScript o Processing.
  4. Analytics: questo può variare da tecniche semplici a complesse in statistiche multivariate, machine learning e PNL.
  5. Approfondimento: estrai, riassumi e presenta i risultati chiave a un vasto pubblico.

Ci sono molti strumenti, abilità e dettagli tecnici e si può passare anni a padroneggiare ciascuno degli elementi sopra elencati. Mentre uno scienziato di dati potrebbe non possedere una vera conoscenza di esperti in nessuna delle aree, è a suo agio nel saltare avanti e indietro e svolgere compiti di base in tutte. Il risultato è un agitatore di dati abbastanza agile da indagare rapidamente su un progetto di dati e produrre risposte a domande (di alto livello) dalla direzione. (Maggiori informazioni sui data scientist in Data Scientists: The New Rock Stars of the Tech World.)


Per alimentare i data scientist, le aziende devono concentrarsi maggiormente sulla cultura e sulla struttura organizzativa. Molti data worker hanno competenze e formazione sufficienti per diventare rapidamente produttivi in ​​più aree dell'intelligence dei dati. Il problema è che la maggior parte non funziona in ambienti che li incoraggiano a diventare data scientist. Sono bloccati nei silos e limitati a una o due aree di intelligenza dei dati. Spesso, sono limitati all'uso di strumenti "approvati" dai loro gestori.

Dopo aver lavorato in aziende sia grandi che piccole, mi è chiaro che la stretta separazione dei compiti è il principale ostacolo affrontato dai data scientist. La manifestazione più comune è la separazione tra analisi e gestione dei dati. In molte grandi aziende, la maggior parte degli analisti / statistici devono attendere i dati da un team di deposito dati designato e in molti casi attendono i dati da più proprietari di diversi data warehouse.


Come incoraggiare la scienza dei dati in un'organizzazione

Per il momento, i data scientist prosperano in start-up più piccole, società Internet e altre organizzazioni in cui c'è meno enfasi su ruoli e compiti definiti. Ma non c'è davvero alcun motivo per cui organizzazioni grandi e mature non possano unirsi al divertimento. (Non c'è motivo per cui i tuoi statistici non possano imparare a scrivere semplici web scraper e perché i tuoi database non possano imparare semplici statistiche e visualizzazioni.) Ecco alcuni suggerimenti su come farlo accadere:

Una volta che ti impegni a formare un team di data scientist, puoi iniziare identificando i dipendenti attuali che potrebbero adattarsi al profilo. Devono essere di mentalità aperta, orientati al gruppo e avere alcune capacità di programmazione in una delle aree sopra descritte. Idealmente, avresti un mix di persone provenienti da informatica, statistiche / sfondi quantitativi o orientati ai dati. I membri del team devono essere disposti a condividere strumenti, hack e tecniche semplici tra loro. La fecondazione incrociata avverrà naturalmente se i membri del team si entusiasmano sull'apprendimento reciproco. I dipendenti che sono riluttanti a condividere tecniche, strumenti e idee ostacolerebbero il progresso.

Non puoi migliorare le tue capacità di programmazione quando a nessuno importa della qualità del software.

Una volta che i manager hanno la sensazione che ci sia una squadra che gioca con nuove fonti di dati, potrebbero provare a sollevare ostacoli ("Che dire dell'integrità dei dati? Non stanno usando le appropriate tecniche di apprendimento automatico / statistiche! Il design sperimentale è sbagliato! Come possono combinarlo con i nostri dati? "). Senza supporto politico, il tuo team di data scientist incontrerà un fuoco (non) amico. Le nuove cose tendono ad essere percepite come minacce, quindi è meglio rassicurare i manager rapidamente che i data scientist integrano ciò che fanno. Gli approfondimenti scoperti dal tuo piccolo team di data scientist possono essere utilizzati per informare dati formali / progetti analitici più formali. I data scientist non elimineranno la necessità di statistici, ma potrebbero indirizzarli verso diversi set di dati e domande.

Usa il tuo team iniziale di data scientist come evangelisti

Se hai scelto correttamente il tuo team iniziale di data scientist, dovrebbero essere a proprio agio nel presentare le loro scoperte ad altri nella tua azienda. Meglio ancora, ne sarebbero entusiasti! Usali per influenzare il modo in cui il resto dell'azienda vede l'intelligence dei dati e per abbattere lentamente quei silos.

Non sto dicendo che alla fine non saranno necessari nuovi strumenti di formazione e enterprise quando formerai il tuo team interno di data scientist. Ma penso che rivolgendosi alle strutture culturali e organizzative, molte aziende possono utilizzare i propri dipendenti insieme a strumenti gratuiti per seminare un piccolo team di data scientist. Parlo per esperienza, avendo lavorato per grandi aziende: il talento è lì e le tecniche non sono così difficili da imparare, ma i silos organizzativi sono difficili da superare. I loro ranghi includono già un pool di talenti pronti a brillare, se non per le rigide strutture aziendali che limitano ciò che possono fare.


Ripubblicato con il permesso di http://practicalquant.blogspot.ca e Ben Lorica. L'articolo originale può essere trovato qui: http://practicalquant.blogspot.ca/2010/07/how-to-nurture-data-scientists.html