L'apprendimento per rinforzo può dare una piacevole svolta dinamica al marketing

Autore: Roger Morrison
Data Della Creazione: 1 Settembre 2021
Data Di Aggiornamento: 1 Luglio 2024
Anonim
L'apprendimento per rinforzo può dare una piacevole svolta dinamica al marketing - Tecnologia
L'apprendimento per rinforzo può dare una piacevole svolta dinamica al marketing - Tecnologia

Contenuto



Fonte: Juliatimchenko / Dreamstime.com

Porta via:

L'apprendimento per rinforzo è un sottoinsieme dell'intelligenza artificiale e dell'apprendimento automatico in grado di prevedere i risultati e aiutare gli utenti a prendere decisioni migliori.

Gli esperti di marketing sono costantemente alla ricerca di soluzioni scalabili e intelligenti quando cercano di ottenere un vantaggio nelle condizioni di marketing sempre più competitive. Non c'è da meravigliarsi che l'intelligenza artificiale (AI) e l'apprendimento automatico (ML) siano ora adottati in massa dai marchi e dalle loro organizzazioni di marketing. (Per saperne di più sulle basi di ML, controlla Machine Learning 101.)

Per chi non lo sapesse, l'IA può essere generalmente considerata una tecnologia quando un computer automatizza i compiti definiti che un umano farebbe altrimenti. L'apprendimento automatico, come area funzionale all'interno dell'IA, è quando un computer ha un obiettivo finale, ma deve calcolare il percorso migliore da solo.


Oggi vediamo queste tecnologie, in particolare l'apprendimento automatico, implementate in molte aree del marketing, tra cui il rilevamento di frodi pubblicitarie, la previsione del comportamento dei consumatori, i sistemi di raccomandazione, la personalizzazione creativa e altro ancora.

Mentre va tutto bene, esiste una nuova tecnologia di derivazione che, per gli esperti di marketing, offrirà davvero la domanda che sta creando l'apprendimento automatico. Si chiama "apprendimento di rinforzo" (RL).

Che cos'è l'apprendimento per rinforzo?

Il passaggio da ML a RL è molto più di una semplice lettera. La maggior parte delle attività trasmesse all'apprendimento automatico prevede l'utilizzo di un solo passaggio, come "riconoscere questa immagine", "comprendere il contenuto del libro" o "catturare le frodi". Per un operatore di marketing, un obiettivo aziendale come "attrarre, trattenere e coinvolgere gli utenti" è intrinsecamente multi-step e a lungo termine, non facilmente realizzabili con l'apprendimento automatico.


È qui che entra in gioco l'apprendimento per rinforzo. Gli algoritmi RL si basano sull'ottimizzazione per un viaggio in evoluzione e in continua evoluzione, in cui si verificano problemi dinamici. Impiegando una "funzione di ricompensa" matematica per calcolare l'esito di ciascuna permutazione, RL può vedere nel futuro ed effettuare la chiamata giusta.

Oggi, le migliori forme di realizzazione di questa tecnologia all'avanguardia possono essere viste nei giochi e nelle auto a guida autonoma. Quando il sistema AlphaGo di Google ha battuto il miglior giocatore al mondo del gioco da tavolo Go l'anno scorso, la loro salsa segreta era l'apprendimento per rinforzo. Mentre i giochi hanno fissato delle regole, le opzioni di un giocatore per il percorso verso la vittoria cambiano in modo dinamico in base allo stato del tabellone. Con l'apprendimento per rinforzo, il sistema tiene conto di tutte le possibili permutazioni che potrebbero cambiare in base a ogni mossa successiva.

Allo stesso modo, un'auto a guida autonoma intraprende un viaggio in cui le regole della strada e la posizione della destinazione rimangono fisse, ma le variabili lungo la strada - dai pedoni ai blocchi stradali ai ciclisti - cambiano in modo dinamico. Ecco perché OpenAI, l'organizzazione fondata da Elon Musk di Tesla, utilizza algoritmi RL avanzati per i suoi veicoli.

Nessun bug, nessuno stress: la tua guida passo passo alla creazione di software che ti cambia la vita senza distruggere la tua vita


Non puoi migliorare le tue capacità di programmazione quando a nessuno importa della qualità del software.

Macchine per operatori di marketing

Che cosa significa questo per i professionisti del marketing?

Le principali sfide di molti marketer sono create dal fatto che le condizioni aziendali cambiano continuamente. Una strategia di campagna vincente può diventare sfavorevole nel tempo, mentre una vecchia strategia può guadagnare nuova trazione. RL è un passo verso l'imitazione della vera intelligenza umana in cui apprendiamo dal successo e / o dal fallimento di molteplici risultati e formiamo una strategia vincente per il futuro. Lasciami fare alcuni esempi:

1. Miglioramento del coinvolgimento degli utenti

Concentriamoci sul coinvolgimento dei clienti per una catena di ristoranti e l'obiettivo di moltiplicarlo di dieci volte per il prossimo anno. Oggi, una campagna di marketing potrebbe comportare un saluto di compleanno con un'offerta di sconto, forse anche in base alle preferenze alimentari. Questo è il pensiero lineare in cui il marketer ha definito un punto iniziale e finale.

In un mondo frenetico, la vita dei clienti cambia costantemente in tempo reale - a volte sono più coinvolti, a volte meno. Nell'apprendimento per rinforzo, un sistema ricalibrerebbe costantemente quali tattiche nell'arsenale di marketing, in un dato momento, abbiano le migliori possibilità di spostare il destinatario verso l'obiettivo finale di un coinvolgimento di 10 volte.

2. Allocazione dinamica del budget

Ora immagina uno scenario pubblicitario in cui hai un budget di 1 milione di dollari e devi spenderne alcuni ogni giorno fino alla fine del mese, distribuito su quattro canali diversi: TV, promozioni fedeltà e Google. Come puoi assicurarti di spendere il budget nel modo più ottimale? La risposta dipende dal giorno, dagli utenti target, dal prezzo dell'inventario e da una serie di altri fattori.

Nell'apprendimento per rinforzo, gli algoritmi utilizzerebbero i risultati storici degli annunci per scrivere funzioni di ricompensa che valutano determinate decisioni di spesa. Ma tiene anche conto di fattori in tempo reale come i prezzi e la probabilità di un'accoglienza positiva da parte del pubblico destinatario. Attraverso l'apprendimento iterativo, l'allocazione della spesa pubblicitaria durante il mese cambierebbe dinamicamente. Sebbene sia fissato l'obiettivo finale, RL avrà assegnato il budget nel miglior modo possibile in tutti gli scenari. (Per ulteriori informazioni sull'intelligenza artificiale nel marketing, vedere In che modo l'intelligenza artificiale rivoluzionerà il settore delle vendite.)

Prossimamente

L'apprendimento per rinforzo riconosce la complessità e riconosce che le persone sono eterogenee e tiene conto di queste verità, migliorando ogni azione successiva nel tempo man mano che i pezzi del tabellone cambiano attorno ad esso.

L'apprendimento rafforzato è ancora in gran parte una riserva di progetti di ricerca e di adozione di avanguardia. Il concetto e la tecnica matematica esiste da oltre 40 anni, ma non è stato possibile implementarlo fino a tempi relativamente recenti, grazie a tre tendenze:

  1. Proliferazione della potenza di calcolo tramite unità di elaborazione grafica (GPU) ad alta potenza.

  2. Il cloud computing rende disponibile la potenza del processore di fascia alta a una frazione del costo di acquisto delle GPU stesse, consentendo a terzi di noleggiare una GPU per addestrare il loro modello RL per diverse ore, giorni o settimane a un prezzo relativamente conveniente.

  3. Miglioramento degli algoritmi numerici o euristica intelligente. Alcuni passaggi numerici critici in un algoritmo RL sono ora in grado di convergere ad un ritmo molto più veloce. Senza questi trucchi numerici magici, non sarebbero ancora fattibili anche con i computer più potenti di oggi.

Pensare in grande

Tutto ciò significa che i nuovi poteri dell'apprendimento per rinforzo saranno presto disponibili su larga scala per marchi e operatori di marketing. Tuttavia, abbracciarlo richiederà un cambiamento nella mentalità. Per un responsabile marketing, questa tecnologia significa la capacità di togliere le mani dal volante.

Ogni azienda ha un obiettivo, ma quando sei in profondità nelle trincee, le azioni quotidiane intraprese verso quell'obiettivo possono diventare confuse. Ora la tecnologia RL consentirà ai decisori di fissare l'obiettivo, avendo più fiducia nel fatto che i sistemi tracceranno la strada migliore per raggiungerlo.

Nella pubblicità, ad esempio, oggigiorno molte persone si rendono conto che le metriche come la percentuale di clic (CTR) sono semplicemente dei proxy per i veri risultati di business, contati solo perché sono numerabili. I sistemi di marketing basati su RL ridurranno il valore di tali parametri intermedi e di tutto il pesante sollevamento ad essi associato, consentendo ai capi di concentrarsi sugli obiettivi.

Ciò richiederà alle aziende di pensare ai loro grandi problemi in un modo molto più proattivo ea lungo termine. Quando la tecnologia è matura, raggiungeranno il loro obiettivo.

Percorso di adozione

L'apprendimento per rinforzo non è ancora pronto per l'uso su vasta scala da parte dei marchi; tuttavia, gli esperti di marketing dovrebbero dedicare del tempo a comprendere questo nuovo concetto che potrebbe rivoluzionare il modo in cui i marchi fanno marketing, mantenendo alcune delle prime promesse dell'apprendimento automatico.

Quando arriva la potenza, arriverà nel software di marketing con un'interfaccia utente, ma i compiti richiesti da quel software saranno radicalmente semplificati. Per il personale, ci saranno meno commutatori mobili e immissione di numeri, nonché meno lettura di report analitici e azione su di essi. Dietro la dashboard, l'algoritmo gestirà la maggior parte di questo.

È improbabile che RL possa eguagliare l'intelligenza umana fin dal cancello. La velocità del suo sviluppo dipenderebbe dal feedback e dai suggerimenti degli esperti di marketing. Dobbiamo assicurarci di chiedere a un computer di risolvere il problema giusto e di penalizzarlo quando non lo fa. Sembra come insegneresti a tuo figlio, no?