Contenuto
- Definizione: cosa significano i dati senza etichetta?
- Un'introduzione a Microsoft Azure e Microsoft Cloud | In questa guida imparerai cos'è il cloud computing e in che modo Microsoft Azure può aiutarti a migrare ed eseguire la tua azienda dal cloud.
- Techopedia spiega i dati senza etichetta
Definizione: cosa significano i dati senza etichetta?
I dati senza etichetta sono una designazione per parti di dati che non sono state taggate con etichette che identificano caratteristiche, proprietà o classificazioni. I dati senza etichetta sono generalmente utilizzati in varie forme di apprendimento automatico.
Un'introduzione a Microsoft Azure e Microsoft Cloud | In questa guida imparerai cos'è il cloud computing e in che modo Microsoft Azure può aiutarti a migrare ed eseguire la tua azienda dal cloud.
Techopedia spiega i dati senza etichetta
Nei tipi di machine learning chiamati machine learning senza supervisione, il programma di machine learning opera valutando serie di dati senza etichetta. Poiché i dati non hanno etichette, il programma di apprendimento automatico deve identificare ogni pezzo di dati sulle sue proprietà e caratteristiche.
Uno dei modi migliori per spiegarlo è usare la metafora della ciotola di frutta. Supponiamo che il programma di apprendimento automatico stia imparando a identificare tre diversi tipi di frutta: banane, uva e mele. Se i dati nel set di addestramento iniziale sono etichettati, il programma di apprendimento automatico funziona da quella prospettiva, abbinando le immagini successive a una di queste tre categorie.
Se, tuttavia, nessuno dei dati è etichettato con i tre nomi di frutta - banane, uva e mele - il programma di apprendimento automatico dovrà funzionare valutando ogni immagine e osservando caratteristiche come il colore - giallo, rosso o viola - forme - lungo e sottile, rotondo o raggruppato - e altre caratteristiche.
Da questo esempio, è facile vedere come i dati etichettati offrano opportunità molto più semplici di utilizzare algoritmi di apprendimento automatico per i risultati delle decisioni. Tuttavia, anche sofisticati programmi di apprendimento automatico senza supervisione che si occupano di dati senza etichetta possono produrre risultati sorprendentemente accurati e precisi.