4 miti sull'avvio di un progetto di Machine Learning

Autore: Laura McKinney
Data Della Creazione: 3 Aprile 2021
Data Di Aggiornamento: 15 Maggio 2024
Anonim
4 miti sull'avvio di un progetto di Machine Learning - Tecnologia
4 miti sull'avvio di un progetto di Machine Learning - Tecnologia

Contenuto


Fonte: monsitj / iStockphoto

Porta via:

Scopri questi miti dell'apprendimento automatico per orientarti meglio all'adozione aziendale.

Non è una cosa da prendere alla leggera: iniziare con un progetto di apprendimento automatico può essere un processo scoraggiante per i dirigenti che vogliono approfittare di questa tendenza IT, ma potrebbero non avere le conoscenze interne per comprendere davvero i dettagli di ciò che rende la macchina spuntare progetti di apprendimento.

Qui parleremo di alcune delle idee sbagliate di base che stanno avendo un impatto sul modo in cui le aziende sviluppano tecnologie di apprendimento automatico in un mercato in rapida evoluzione. (La scienza dei dati è un altro campo che le aziende stanno implementando, ma in cosa differisce dalla ML? Scoprilo in Data Science o Machine Learning? Ecco come individuare la differenza.)

Mito n. 1: più dati è sempre meglio

Questo è davvero uno dei più grandi miti dell'apprendimento automatico. Le persone pensano che un numero maggiore di dati significhi una maggiore capacità di approfondire approfondimenti attuabili. In alcuni casi, hanno ragione, ma più spesso può essere vero il contrario.


Più dati sono migliori solo se sono dati rilevanti che si aggiungono all'intera immagine. I dati devono adattarsi al modello di apprendimento automatico, oppure il programma può soffrire di qualcosa chiamato "overfitting" in cui i risultati di apprendimento automatico non riescono a comparire nei modi in cui dovrebbero.

"La causa delle scarse prestazioni nell'apprendimento automatico è il sovra-adattamento o la mancanza di dati", scrive Jason Brownlee in Machine Learning Mastery.

Nelle statistiche, un adattamento si riferisce a quanto bene approssimi una funzione target. Questa è una buona terminologia da utilizzare nell'apprendimento automatico, poiché gli algoritmi di apprendimento automatico supervisionato cercano di approssimare la funzione di mappatura sottostante sconosciuta per le variabili di output date le variabili di input. Le statistiche spesso descrivono la bontà dell'adattamento che si riferisce alle misure utilizzate per stimare quanto l'approssimazione della funzione corrisponda alla funzione target.


In poche parole, i dati estranei possono causare seri problemi. Prima di far funzionare un progetto di apprendimento automatico, i dirigenti e le altre parti interessate devono fare un brainstorming e capire quali sono i tipi specifici di dati che forniranno la giusta base per andare avanti.

Mito n. 2: i dati che abbiamo sono abbastanza buoni

Ancora una volta, i processi di apprendimento automatico funzionano su modelli di dati molto precisi. I dati non sono abbastanza buoni a meno che non siano chiaramente mirati, eliminati o valutati per tenere conto di cose come la distorsione e la varianza.

Nessun bug, nessuno stress: la tua guida passo passo alla creazione di software che ti cambia la vita senza distruggere la tua vita

Non puoi migliorare le tue capacità di programmazione quando a nessuno importa della qualità del software.

Una cosa di cui si sente molto parlare nel mondo dell'apprendimento automatico è la distorsione incontrollata. L'apprendimento automatico prende le nostre inclinazioni umane e le amplifica sfornando i dati che il programma ottiene con risultati potenzialmente estremi.

Ciò significa che i dati devono essere maggiormente mirati per compensare questa tendenza.

Mito n. 3: è troppo presto per noi!

Alcune aziende temono che sia troppo presto per entrare nel machine learning. Ma se parli con molti innovatori e imprenditori, diranno che questo è esattamente il momento di entrare al piano terra.

Ovunque sia la tendenza IT, vuoi essere all'avanguardia. All'avanguardia è la posizione migliore. Aspettare di ottenere tutto perfetto potrebbe costare un'azienda a lungo termine. (Per ulteriori informazioni sui motivi per cui le aziende non hanno ancora implementato la ML, vedere 4 Roadblock che bloccano l'adozione del machine learning.)

Mito n. 4: l'apprendimento automatico è sempre lo stesso

Esiste sicuramente un ampio spettro di programmi di apprendimento automatico.

Alcuni essenzialmente scappano da un singolo algoritmo: sono matematicamente leggibili e trasparenti. Gli ingegneri possono vedere come i dati che entrano sono correlati a ciò che esce dal sistema.

Altri processi di apprendimento automatico sono molto più elaborati e più difficili da comprendere. Le reti neurali composte da neuroni artificiali possono essenzialmente diventare una "scatola nera" in cui anche i migliori ingegneri hanno difficoltà a rintracciare i dati attraverso il sistema o spiegare come funzionano gli algoritmi.

"Le tecnologie più capaci - vale a dire, le reti neurali profonde - sono notoriamente opache, offrendo pochi indizi su come arrivano alle loro conclusioni", scrive Ariel Bleicher di Scientific American, esaminando alcuni aspetti di questo enigma essenziale.

Strumenti come le reti di stato dell'eco prendono questa idea della scatola nera e la eseguono. Ciò rende ancora più difficile accertare veramente come funzionano questi sistemi.

Mito n. 5: l'apprendimento automatico funziona solo con dati attentamente curati

Mentre il punto sopra riportato sui dati di precisione è ancora vero, due diversi tipi di apprendimento automatico funzionano su una base fondamentalmente diversa.

Un tipo di apprendimento automatico chiamato apprendimento automatico supervisionato riguarda i dati etichettati: i dati di addestramento dispongono già di etichette per descriverne le proprietà e le categorie.

Un altro tipo di apprendimento automatico è chiamato apprendimento automatico senza supervisione. Si occupa di dati senza etichetta.

L'apprendimento automatico senza supervisione prende i dati grezzi e la macchina essenzialmente li analizza per caratteristiche e li raggruppa in categorie da sola. Esistono molte potenzialità in entrambi i tipi di apprendimento automatico, ma è più semplice impostare un programma con dati etichettati per l'apprendimento automatico supervisionato. L'apprendimento automatico non supervisionato è una specie di acque inesplorate per molte aziende.

Queste sono alcune delle considerazioni che potresti avere e idee sbagliate sull'apprendimento automatico che possono causare problemi nell'adozione aziendale. Spero che ciò abbia contribuito a chiarire un po 'di confusione sui progetti di apprendimento automatico.