Pulizia dei dati

Autore: Randy Alexander
Data Della Creazione: 26 Aprile 2021
Data Di Aggiornamento: 1 Luglio 2024
Anonim
Qualità e “pulizia” dei dati
Video: Qualità e “pulizia” dei dati

Contenuto

Definizione - Cosa significa Pulizia dati?

La pulizia dei dati è il processo di modifica dei dati in una determinata risorsa di archiviazione per assicurarsi che sia accurata e corretta. Esistono molti modi per perseguire la pulizia dei dati in vari software e architetture di archiviazione dei dati; la maggior parte di essi si concentra sull'attenta revisione dei set di dati e dei protocolli associati a una particolare tecnologia di archiviazione dei dati.


La pulizia dei dati è anche nota come pulizia dei dati o pulizia dei dati.

Un'introduzione a Microsoft Azure e Microsoft Cloud | In questa guida imparerai cos'è il cloud computing e in che modo Microsoft Azure può aiutarti a migrare e gestire la tua azienda dal cloud.

Techopedia spiega la pulizia dei dati

La pulizia dei dati viene talvolta confrontata con l'eliminazione dei dati, in cui i dati vecchi o inutili verranno eliminati da un set di dati. Sebbene la pulizia dei dati possa comportare la cancellazione di dati vecchi, incompleti o duplicati, la pulizia dei dati è diversa dall'eliminazione dei dati in quanto l'eliminazione dei dati si concentra in genere sullo spazio libero per i nuovi dati, mentre la pulizia dei dati si concentra sulla massimizzazione dell'accuratezza dei dati in un sistema. Un metodo di pulizia dei dati può utilizzare l'analisi o altri metodi per eliminare errori di sintassi, errori tipografici o frammenti di record. Un'attenta analisi di un set di dati può mostrare come l'unione di più set ha portato alla duplicazione, nel qual caso è possibile utilizzare la pulizia dei dati per risolvere il problema.


Molti problemi legati alla pulizia dei dati sono simili a quelli che gli archivisti, il personale dell'amministratore del database e altri affrontano processi come la manutenzione dei dati, il data mining mirato e la metodologia di estrazione, trasformazione, caricamento (ETL), in cui i vecchi dati vengono ricaricati in un nuovo set di dati. Questi problemi riguardano spesso la sintassi e l'uso specifico del comando per eseguire attività correlate nelle tecnologie di database e server come SQL o Oracle. L'amministrazione del database è un ruolo molto importante in molte aziende e organizzazioni che si affidano a grandi set di dati e record accurati per il commercio o qualsiasi altra iniziativa.