Ruolo professionale: Data Scientist

Autore: Roger Morrison
Data Della Creazione: 28 Settembre 2021
Data Di Aggiornamento: 11 Maggio 2024
Anonim
Data scientist is NOT the only SEXY job // All data careers explained
Video: Data scientist is NOT the only SEXY job // All data careers explained

Contenuto


Fonte: Sergey Khakimullin / iStockphoto

Porta via:

I data scientist svolgono lavori di ampia portata che variano notevolmente a seconda dell'applicazione. Ma una cosa che tutti hanno in comune è l'unità per fare buon uso dei dati.

Cosa fa uno scienziato di dati nell'ambito dell'intelligenza artificiale e del lavoro di apprendimento automatico? Molti professionisti che affrontano questo tipo di progetti ogni giorno direbbero che alla domanda è difficile rispondere semplicemente. Una domanda migliore sarebbe: cosa NON fanno i data scientist?

Uno scienziato di dati è parte integrante di un processo AI o ML, nel senso che tutti questi progetti dipendono da big data o input complessi. Il data scientist è il professionista di carriera essenziale che sa come lavorare con i dati per produrre risultati.

Tuttavia, ci sono alcuni modi per parlare di ciò che fa uno scienziato di dati, di quali qualifiche ha bisogno e quale sia il suo ruolo nel processo.


Leggere: 6 concetti chiave di data science che puoi apprendere attraverso l'apprendimento online

Definizioni varie, doveri vari

Molti esperti che descrivono il lavoro di uno scienziato di dati ne parlano in termini generali.

"Nelle piccole aziende o quando si lavora in un nuovo mercato, il ruolo di uno scienziato di dati è quello di convertire fonti di dati relativamente nuove (ma ovvie) in materiale che risolva un problema per un utente finale, che non sarebbe stato possibile, in precedenza, dove non esistevano le tecnologie impiegate ", afferma Antonio Hicks, Account Manager presso Mercury Global Partners. "Il candidato ideale è qualcuno che è in parte matematico, in parte ingegnere del software e in parte imprenditore".

Altri fanno eco a questa idea di base, menzionando quali dati sono necessari agli scienziati per affrontare i progetti di modellistica.

"L'attributo più importante di cui uno scienziato di dati ha bisogno è una profonda curiosità per il mondo che li circonda: che si tratti di rispondere a domande o di costruire modelli, è fondamentale il desiderio di comprendere il problema di fronte a loro", afferma Erin Akinci, Data Scientist Manager ad Asana. "Da lì, la maggior parte delle persone richiederà competenze matematiche e di programmazione per trovare soluzioni, ma i tipi specifici di matematica e programmazione variano ampiamente a seconda dell'area di competenza nell'ambito della scienza dei dati."


Nessun bug, nessuno stress: la tua guida passo passo alla creazione di software che ti cambia la vita senza distruggere la tua vita

Non puoi migliorare le tue capacità di programmazione quando a nessuno importa della qualità del software.

"Un eccellente lavoro scientifico ha più a che fare con il modo in cui uno scienziato pensa a un problema, che con gli strumenti che usano per risolverlo", aggiunge Charlie Burgoyne, fondatore e CEO di Valkyrie Intelligence. Valkyrie è una società di consulenza scientifica applicata con importanti progetti sotto la sua ala come Mark I, un'appliance di rete dedicata che aumenta la formazione e i test delle reti neurali, migliorando ciò che è possibile con le precedenti piattaforme di machine learning basate su cloud.

"Il mercato richiede scienziati esperti nello sviluppo di Python, nella progettazione di reti neurali e nella capacità di rimodellare un repository di dati nell'ultima architettura di database", afferma Burgoyne. "Queste capacità, tuttavia, sono poste in gioco per uno scienziato di talento. Ciò che è meno ovvio è l'attitudine di uno scienziato per l'intrepida curiosità, l'ingegnosità aggressiva e l'adesione al metodo scientifico. "

Le competenze di uno scienziato di dati

Per quanto riguarda le competenze pratiche, i data scientist necessitano di una certa creatività e buon senso per quanto riguarda la modellazione. Possono anche trarre grandi benefici dall'avere "competenze" come la codifica di esperienza in Python, C ++ o altri linguaggi comuni applicati ai progetti ML.

"Python e C ++ sono essenziali e la capacità di combinare le capacità di codifica con l'analisi e l'elaborazione dei dati e le statistiche sono le competenze fondamentali che faranno emergere uno scienziato come candidato o dipendente forte", afferma Val Streif presso Pramp, una piattaforma di intervista finta online per ingegneri del software, sviluppatori e data scientist. "Sebbene alcune delle capacità di programmazione possano essere gestite accoppiando uno scienziato di dati con uno sviluppatore, è molto più facile se hai entrambe le competenze combinate in una, dal punto di vista di un'azienda."

Altri esperti aggiungono R, Hadoop, Spark, Sas e Java all'elenco, nonché tecnologie come Tableau, Hive e MATLAB.

Tutti rappresentano un curriculum impressionante, ma alcuni di coloro che hanno esperienza nel reclutamento di scienziati dei dati affermano che anche le altre questioni "umane" sono importanti. (Un tipo di scienziato dei dati è lo scienziato dei dati dei cittadini. Ulteriori informazioni in Il ruolo dei cittadini scienziati dei dati nel mondo dei Big Data.)

"Tradizionalmente, le persone con una diversa educazione alle arti liberali sono eccellenti scienziati dei dati", afferma Burgoyne, facendo una distinzione tra ingegneri, che si trovano sul lato dell'edificio e scienziato dei dati, il cui lavoro può essere molto più concettuale. Lui continua:

La competenza in un campo STEM tradizionale con un focus complementare nelle discipline umanistiche, artistiche o aziendali produce quelle qualità che rendono un eccellente scienziato orientato all'industria. Va detto che è altrettanto importante per la capacità dell'organizzazione di sfruttare quelle qualità e modellare il loro fervore e i metodi in modo produttivo. Ho osservato che quando un'iniziativa di data science non ha successo, è probabile che l'organizzazione sia colpevole quanto gli scienziati. Gli scienziati non sono ingegneri. Non sono guidati da eseguire e costruire. Sono spinti a scoprire e capire. Le organizzazioni che comprendono questa differenza sono ben ricompensate per la coltivazione di entrambi i campi.

Per quanto riguarda ciò a cui gli scienziati dei dati si applicano in genere, ciò ha a che fare con gli obiettivi principali dell'azienda. Alcune aziende stanno inseguendo una rete decentralizzata, altre stanno giocando con IoT o SaaS. Altri stanno cercando di fare il pioniere dell'intelligenza artificiale "user-friendly" o "etica" o "trasparente".

In ogni caso, è probabile che i data scientist stiano colmando il divario tra le metriche rigide sui dati che usano, in qualunque stack tecnologico sia in gioco, e il lavoro a ruota libera di concettualizzare la funzionalità AI / ML.

"Assumiamo data scientist per gestire la raccolta e la pulizia dei dati, oltre a tradurli in informazioni significative", afferma Michael Hupp, Manager di Data Science and Analytics presso G2 Crowd. Elabora:

In genere questo significa gestire eventuali importanti algoritmi che guidano il motore di dati di un'azienda ed essere fluenti in strumenti e linguaggi chiave di analisi, ma negli ultimi anni ha incluso anche campi emergenti come l'elaborazione del linguaggio naturale, l'apprendimento automatico e altre forme di analisi abilitate all'intelligenza artificiale. I data scientist di maggior successo sono quelli che combinano le loro capacità complesse con la capacità di apprendere rapidamente e la capacità di comunicare efficacemente le intuizioni che scoprono in modo che siano significative per la loro attività.

Con questi tipi di approfondimenti, è più facile per i giovani professionisti o studenti capire se il data scientist avrebbe un buon ruolo per loro e come acquisire competenze. L'apprendimento STEM sta diventando più accessibile nelle scuole di tutto il paese, ma non c'è sostituto per la passione per la programmazione e la tecnologia e la capacità di apprendere al volo.