Insegnamento rafforzativo

Autore: Lewis Jackson
Data Della Creazione: 11 Maggio 2021
Data Di Aggiornamento: 15 Maggio 2024
Anonim
Harvard CS50 AI Lecture 0  Search
Video: Harvard CS50 AI Lecture 0 Search

Contenuto

Definizione - Cosa significa apprendimento di rinforzo?

L'apprendimento per rinforzo, nel senso dell'intelligenza artificiale, è un tipo di programmazione dinamica che forma gli algoritmi usando un sistema di ricompensa e punizione.


Un algoritmo di apprendimento di rinforzo, o agente, apprende interagendo con il suo ambiente. L'agente riceve premi eseguendo correttamente e penali per aver eseguito in modo errato. L'agente impara senza l'intervento di un essere umano massimizzando la sua ricompensa e minimizzando la sua penalità.

Un'introduzione a Microsoft Azure e Microsoft Cloud | In questa guida imparerai cos'è il cloud computing e in che modo Microsoft Azure può aiutarti a migrare e gestire la tua azienda dal cloud.

Techopedia spiega l'apprendimento per rinforzo

L'apprendimento per rinforzo è un approccio all'apprendimento automatico ispirato alla psicologia comportamentale. È simile a come un bambino impara a svolgere un nuovo compito. L'apprendimento per rinforzo contrasta con altri approcci di apprendimento automatico in quanto all'algoritmo non viene esplicitamente spiegato come eseguire un'attività, ma risolve il problema da solo.


Come agente, che potrebbe essere un'auto a guida autonoma o un programma che gioca a scacchi, interagisce con il suo ambiente, riceve uno stato di ricompensa a seconda delle sue prestazioni, come guidare verso una destinazione sicura o vincere una partita. Al contrario, l'agente riceve una penalità per l'esecuzione non corretta, come andare fuori strada o essere controllato.

L'agente nel tempo prende le decisioni per massimizzare la sua ricompensa e minimizzare la sua penalità usando la programmazione dinamica. Il vantaggio di questo approccio all'intelligenza artificiale è che consente a un programma di intelligenza artificiale di apprendere senza che un programmatore spieghi come un agente dovrebbe svolgere l'attività.