Data Science o Machine Learning? Ecco come individuare la differenza

Autore: Laura McKinney
Data Della Creazione: 3 Aprile 2021
Data Di Aggiornamento: 1 Luglio 2024
Anonim
Types Of Machine Learning | Machine Learning Algorithms | Machine Learning Tutorial | Simplilearn
Video: Types Of Machine Learning | Machine Learning Algorithms | Machine Learning Tutorial | Simplilearn

Contenuto


Fonte: Elnur / Dreamstime.com

Porta via:

La scienza dei dati e l'apprendimento automatico sono diversi nei modi chiave. In un certo senso, uno può essere visto come un sottoinsieme dell'altro. Entrambi sono importanti nell'attuale progresso dell'IT.

In questo nuovo mondo di intelligenza artificiale e gestione dei dati, è facile confondersi con alcuni dei termini più comunemente utilizzati nel mondo IT.

Ad esempio, la scienza dei dati e l'apprendimento automatico hanno molto a che fare l'uno con l'altro. Non sorprende che molte persone con una conoscenza passante di queste discipline avrebbero difficoltà a capire come differiscono l'una dall'altra.

Ecco il modo migliore per separare la scienza dei dati dall'apprendimento automatico, come principio e come approccio tecnologico.

Data science e machine learning: terminologia ampia e ristretta

Innanzitutto, la scienza dei dati è in realtà una vasta e ampia categoria di tecnologia che comprende molti diversi tipi di progetti e creazioni. (Per ulteriori informazioni su ciò che è coinvolto in un lavoro di data science, vedi Ruolo di lavoro: Data Scientist.)


La scienza dei dati è essenzialmente la pratica di lavorare con i big data. È emerso come la legge di Moore e la proliferazione di dispositivi di archiviazione più efficienti ha portato a enormi quantità di dati raccolti da aziende e altre parti. Quindi, piattaforme e strumenti per i big data come Hadoop hanno iniziato a ridefinire l'informatica modificando il funzionamento della gestione dei dati. Ora, con il cloud e la containerizzazione, nonché con modelli nuovi di zecca, i big data sono diventati il ​​motore principale del modo in cui lavoriamo e viviamo.

Nella sua forma più semplice, la scienza dei dati è il modo in cui gestiamo tali dati, dalla loro pulizia e raffinamento fino a metterli in pratica sotto forma di approfondimenti.

La definizione di apprendimento automatico è molto più ristretta. Nell'apprendimento automatico, le tecnologie raccolgono i dati e li mettono attraverso algoritmi, al fine di simulare i processi cognitivi umani descritti come "apprendimento". In altre parole, dopo aver preso i dati e addestrato su di essi, il computer è in grado di fornire i propri risultati , in cui la tecnologia sembra aver appreso dai processi messi in atto dai programmatori.


Set di abilità di data science e machine learning

Un altro modo per contrastare la scienza dei dati e l'apprendimento automatico è quello di esaminare le diverse competenze che sono più preziose per i professionisti in uno di questi campi.

Nessun bug, nessuno stress: la tua guida passo passo alla creazione di software che ti cambia la vita senza distruggere la tua vita

Non puoi migliorare le tue capacità di programmazione quando a nessuno importa della qualità del software.

Esiste un consenso generale sul fatto che i data scientist traggano vantaggio da profonde capacità analitiche e matematiche, esperienza pratica con le tecnologie di database e conoscenza dei linguaggi di programmazione come Python o altri pacchetti utilizzati per l'analisi dei big data.

"Chiunque sia interessato a costruire una forte carriera in (scienza dei dati) dovrebbe acquisire competenze chiave in tre dipartimenti: analisi, programmazione e conoscenza del dominio", scrive Srihari Sasikumar presso Simplilearn. "Passando a un livello più profondo, le seguenti competenze ti aiuteranno a ritagliare una nicchia come scienziato dei dati: forte conoscenza di Python, SAS, R (e) Scala, esperienza pratica nella codifica di database SQL, capacità di lavorare con dati non strutturati da varie fonti come video e social media, comprendono molteplici funzioni analitiche (e) conoscenza dell'apprendimento automatico ".

Per quanto riguarda l'apprendimento automatico, gli esperti citano spesso abilità di modellazione dei dati, probabilità e conoscenze statistiche e più ampie capacità di programmazione come strumenti utili nel toolkit dell'ingegnere dell'apprendimento automatico.

Come individuare l'apprendimento automatico

La chiave qui è che ogni sorta di cose comprende il lavoro di scienza dei dati, ma non è l'apprendimento automatico a meno che tu non abbia un regime molto rigido impostato per aiutare il computer ad imparare dai suoi input.

Quando questo è a posto, crea alcuni sistemi sorprendentemente capaci che possono avere effetti ad ampio raggio sulla nostra vita.

"Gran parte di ciò che facciamo con l'apprendimento automatico avviene sotto la superficie", ha riferito il fondatore di Amazon Jeff Bezos, sottolineando alcune delle applicazioni di questi tipi di sistemi. "L'apprendimento automatico guida i nostri algoritmi per la previsione della domanda, il posizionamento nella ricerca dei prodotti, i consigli su prodotti e offerte, i posizionamenti di merchandising, il rilevamento delle frodi, le traduzioni e molto altro. Anche se meno visibile, gran parte dell'impatto dell'apprendimento automatico sarà di questo tipo - silenziosamente ma significativamente migliorando le operazioni di base. "

Uno degli esempi più utili qui è l'emergere della rete neurale - è un metodo comune e popolare per impostare i processi di apprendimento automatico.

Nella sua forma più elementare, la rete neurale è composta da strati di neuroni artificiali. Ogni singolo neurone artificiale ha funzionalità equivalenti a un neurone biologico - ma invece di sinapsi e dendriti, ha input, una funzione di attivazione ed eventuali output.

La rete neurale è fatta per agire come un cervello umano e i professionisti dell'apprendimento automatico utilizzano spesso questo modello per creare risultati di apprendimento automatico.

Tuttavia, questo non è l'unico modo per eseguire l'apprendimento automatico. Alcuni progetti di apprendimento automatico più rudimentali includono semplicemente mostrare a un computer una vasta gamma di fotografie (o fornirgli altri dati non elaborati), introdurre idee attraverso il processo di utilizzo dell'apprendimento automatico supervisionato e etichettare i dati e consentire al computer di essere in grado di discriminare tra varie forme o oggetti in un campo visivo. (Per le nozioni di base sull'apprendimento automatico, consulta Machine Learning 101.)

Due discipline all'avanguardia

In conclusione, l'apprendimento automatico è una parte preziosa della scienza dei dati. Ma la scienza dei dati rappresenta la frontiera più vasta e il contro in cui avviene l'apprendimento automatico.

In un certo senso, si potrebbe dire che l'apprendimento automatico non avverrebbe mai senza i big data. I big data in sé non hanno creato l'apprendimento automatico, invece - dopo aver aggregato collettivamente così tanti dati che quasi non sapevamo cosa farsene, le migliori menti si sono inventate questi processi di bio-simulazione come un modo sovralimentato di fornire approfondimenti.

Un'altra cosa buona da tenere a mente qui è che la scienza dei dati può essere applicata in due modi principali: possiamo abbracciare l'apprendimento automatico e l'intelligenza artificiale, lasciare che i computer pensino per noi, o possiamo riportare la scienza dei dati a un approccio più centrato sull'uomo in cui il computer presenta semplicemente i risultati e noi come esseri umani prendiamo le decisioni.

Ciò sta portando alcuni esperti, inclusi alcuni dei migliori innovatori di oggi, a richiedere una contabilità più vivace dei modi in cui utilizziamo queste tecnologie.

"(AI) è in grado di fare molto di più di quanto quasi tutti sappiano e il tasso di miglioramento è esponenziale", ha detto Elon Musk, mentre avverte che i programmi di apprendimento automatico e IA richiedono supervisione.

In ogni caso, sia la scienza dei dati che l'apprendimento automatico sono parti fondamentali del progresso che noi come società stiamo facendo oggi nella tecnologia.