tokenizzazione

Autore: Louise Ward
Data Della Creazione: 8 Febbraio 2021
Data Di Aggiornamento: 18 Maggio 2024
Anonim
Tokenizzazione, cosa è e come funziona? - Smart Contract -
Video: Tokenizzazione, cosa è e come funziona? - Smart Contract -

Contenuto

Definizione - Cosa significa tokenizzazione?

La tokenizzazione è l'atto di spezzare una sequenza di stringhe in pezzi come parole, parole chiave, frasi, simboli e altri elementi chiamati token. I token possono essere singole parole, frasi o persino frasi intere. Nel processo di tokenizzazione, alcuni caratteri come i segni di punteggiatura vengono scartati. I token diventano l'input per un altro processo come l'analisi e il mining.


La tokenizzazione è utilizzata nell'informatica, dove svolge un ruolo importante nel processo di analisi lessicale.

Un'introduzione a Microsoft Azure e Microsoft Cloud | In questa guida imparerai cos'è il cloud computing e in che modo Microsoft Azure può aiutarti a migrare e gestire la tua azienda dal cloud.

Techopedia spiega la tokenizzazione

La tokenizzazione si basa principalmente su euristiche semplici per separare i token seguendo alcuni passaggi:

  • I token o le parole sono separati da spazi bianchi, segni di punteggiatura o interruzioni di riga
  • Spazi bianchi o segni di punteggiatura possono o meno essere inclusi a seconda delle necessità
  • Tutti i caratteri all'interno di stringhe contigue fanno parte del token. I token possono essere costituiti solo da tutti i caratteri alfa, alfanumerici o numerici.

I token stessi possono anche essere separatori. Ad esempio, nella maggior parte dei linguaggi di programmazione, gli identificatori possono essere posizionati insieme ad operatori aritmetici senza spazi bianchi. Sebbene sembri che ciò appaia come una singola parola o token, la grammatica della lingua considera effettivamente l'operatore matematico (un token) come un separatore, quindi anche quando più token sono raggruppati insieme, possono comunque essere separati tramite il matematico operatore.