12 suggerimenti chiave per l'apprendimento della scienza dei dati

Autore: Laura McKinney
Data Della Creazione: 3 Aprile 2021
Data Di Aggiornamento: 1 Luglio 2024
Anonim
12 suggerimenti chiave per l'apprendimento della scienza dei dati - Tecnologia
12 suggerimenti chiave per l'apprendimento della scienza dei dati - Tecnologia

Contenuto


Fonte: Artinspiring / Dreamstime.com

Porta via:

I data scientist necessitano ovviamente di forti capacità matematiche e di codifica, ma anche la comunicazione e altre competenze trasversali sono essenziali per il successo.

Lo scienziato di dati si classifica come il miglior lavoro per il 2019 in America su Glassdoor. Con uno stipendio base medio di $ 108.000 e un grado di soddisfazione sul lavoro di 4,3 su 5, oltre a un discreto numero di aperture previste, non è sorprendente. La domanda è: cosa bisogna fare per arrivare in pista per qualificarsi per questo lavoro?

Per scoprirlo, abbiamo cercato il consiglio dato a coloro che cercano di intraprendere questa carriera. Molto dipende dalle dure capacità di programmazione e matematica. Ma quel forte calcolo da solo non lo taglia. I data scientist di successo devono anche essere in grado di parlare con gli uomini d'affari alle proprie condizioni, il che richiede le capacità associate alle competenze trasversali e alla leadership. (Per ulteriori informazioni sui compiti di uno scienziato di dati, vedere Ruolo di lavoro: scienziato di dati.)


Costruire la fondazione educativa: tre consigli primari

Drace Zhan, uno scienziato di dati presso la Data Science Academy di New York, sottolinea la necessità di una base educativa che includa gli elementi essenziali di programmazione e abilità matematiche:

  1. R / Python + SQL. Se non hai le capacità di programmazione, hai bisogno di molta potenza di rete e di altre aree per rafforzare questo deficit. Ho visto scienziati dei dati con matematica debole e poca esperienza nel dominio, ma sono sempre stati portati avanti da una forte capacità di codifica. Python è l'ideale ma R è un ottimo strumento di fallback. È meglio avere entrambi nel tuo arsenale. SQL è anche estremamente importante per un analista di dati.

  2. Abilità matematiche forti. Avere un'ottima conoscenza di alcuni dei metodi comunemente usati: modelli lineari generalizzati, albero decisionale, K-media e test statistici è meglio che avere un ampio quadro di vari modelli o specializzazioni come RNN.

Queste sono competenze centrali su cui basarsi, sebbene alcuni esperti le aggiungano. Ad esempio, un elenco di KDnuggets include i componenti di codifica citati da Zhan e aggiunge alcune altre cose utili da sapere sul lato tecnico, tra cui la piattaforma Hadoop Apache Spark, visualizzazione dei dati, dati non strutturati, apprendimento automatico e AI.


Ma se prendiamo spunto da un sondaggio sugli strumenti più comunemente utilizzati identificati per l'uso nella vita reale da un sondaggio Kaggle, otteniamo risultati leggermente diversi. Come puoi vedere dal grafico delle prime 15 scelte di seguito, Python, R e SQL rendono facilmente i primi tre, ma il quarto sono i notebook Jupyter, seguiti da TensorFlow, Amazon Web Services, shell Unix, Tableau, C / C ++, NoSQL , MATLAB / Octave e Java, tutti davanti a Hadoop e Spark. Un'altra aggiunta che può sorprendere le persone è il Data mining di Microsoft Excel.

Immagine gentilmente concessa da Kaggle

L'elenco KDnuggets include anche un suggerimento sull'educazione formale. La maggior parte dei data scientist possiede gradi avanzati: il 46 percento ha dottorati di ricerca e l'88 percento possiede almeno un master. I titoli di studio che possiedono sono generalmente suddivisi tra aree correlate. Circa un terzo è in matematica e statistica, che è il più popolare per questa carriera. Il prossimo più popolare è una laurea in informatica, detenuta dal 19 percento, e ingegneria, la scelta del 16 percento. Naturalmente, gli strumenti tecnici specifici per la scienza dei dati spesso non vengono studiati nei corsi di laurea ma in boot camp specializzati o attraverso corsi online.

Più che corsi: altri due consigli

Hank Yun, assistente di ricerca nel dipartimento polmonare della Weill Cornell Medicine e studente presso la Data Science Academy di New York, consiglia agli aspiranti scienziati dei dati di pianificare su cosa lavoreranno e di trovare un mentore. Egli ha detto:

Nessun bug, nessuno stress: la tua guida passo passo alla creazione di software che ti cambia la vita senza distruggere la tua vita

Non puoi migliorare le tue capacità di programmazione quando a nessuno importa della qualità del software.

Non commettere l'errore che ho fatto dicendo a te stesso che conosci la scienza dei dati perché hai seguito un corso e hai ricevuto un certificato. È un ottimo inizio, ma quando inizi a studiare, pensa a un progetto. Quindi trova un mentore sul campo e inizia subito un progetto di passione! Quando sei fresco, non sai cosa non sai, quindi aiuta quando qualcuno è lì per guidarti verso ciò che è importante per te e cosa no. Non vuoi passare molto tempo a studiare senza nulla da mostrare!

Conoscere quale strumento estrarre dalla casella degli strumenti: Suggerimento per rimanere in testa alla curva

Data la disparità nella classifica degli strumenti di data science, alcuni potrebbero sentirsi sconcertati su cosa concentrarsi. Celeste Fralick, capo scienziato di dati presso la società di software di sicurezza McAfee, affronta il problema in un articolo del CIO che esamina le competenze essenziali per uno scienziato di dati, dichiarando: "Uno scienziato di dati deve stare davanti alla curva della ricerca, così come capire quale tecnologia applicare quando ". Ciò significa non essere attirati dal" sexy "e nuovo, quando il problema reale" richiede qualcosa di molto più comune. "Essere consapevoli del costo computazionale per l'ecosistema, l'interpretazione, la latenza, la larghezza di banda e altre condizioni al contorno del sistema - nonché la maturità del cliente - aiuta lo scienziato dei dati a capire quale tecnologia applicare".

Competenze trasversali essenziali: altri sei consigli

Il punto sollevato da Fralick riguarda le capacità non tecniche richieste dal lavoro di data scientist. Ecco perché l'elenco di KDnuggets include questi quattro: curiosità intellettuale, lavoro di squadra, capacità di comunicazione e acume negli affari. Zhan includeva anche le competenze chiave nei suoi suggerimenti per i data scientist, identificando "abilità comunicative" come KDnuggets, ma usando "competenze di dominio" al posto di "acume degli affari". Qualunque cosa si chiami, si riferisce all'applicazione pratica della scienza dei dati al attività commerciale. (Per saperne di più sulle abilità comunicative, vedi L'importanza delle abilità comunicative per i professionisti tecnici.)

Olivia Parr-Rud ha offerto la sua personale spinta su questo, aggiungendo altre due soft skills, con enfasi sul ruolo della creatività, affermando: "Penso che la scienza dei dati sia un'arte tanto quanto una scienza", qualcosa che richiede di attingere i punti di forza di entrambi i lati del cervello. “Molte persone parlano della scienza dei dati come una carriera che utilizza principalmente il cervello sinistro. Ho scoperto che per avere successo, i data scientist devono usare tutto il loro cervello. "

Ha spiegato che il progresso nel campo richiede non solo competenza tecnica ma creatività e visione necessarie per la leadership:

La maggior parte delle attività del cervello sinistro / lineari possono essere automatizzate o esternalizzate. Per offrire un vantaggio competitivo come data scientist, dobbiamo essere in grado di riconoscere modelli e sintetizzare grandi quantità di informazioni utilizzando entrambi i lati del nostro cervello. E dobbiamo essere pensatori innovativi. Molti dei migliori risultati derivano dall'integrazione del cervello destro e sinistro.

Ha anche sottolineato perché comunicare chiaramente una visione è essenziale:

Come data scientist, il nostro obiettivo è utilizzare i dati per aiutare i nostri clienti a far crescere i loro profitti. La maggior parte dei dirigenti non capisce cosa facciamo o come lo facciamo. Quindi dobbiamo pensare come leader e comunicare i nostri risultati e raccomandazioni in un linguaggio che i nostri stakeholder comprendono e di cui si fidano.

The Data Dozen

I suggerimenti chiave incorporano un numero maggiore di strumenti tecnici, abilità e capacità, nonché qualità meno quantificabili come l'attitudine alla creatività e alla leadership. In definitiva, non è solo un gioco di numeri. Dato che la scienza dei dati non riguarda solo la creazione di modelli nel vuoto, ma la creazione di applicazioni pratiche per risolvere i problemi della vita reale per le aziende, coloro che avranno successo nel campo non dovranno solo padroneggiare la tecnologia ma conoscere il proprio dominio aziendale e comprendere le esigenze di i vari membri del team al lavoro.