Web Crawler

Autore: John Stephens
Data Della Creazione: 1 Gennaio 2021
Data Di Aggiornamento: 1 Luglio 2024
Anonim
Web Crawler - CS101 - Udacity
Video: Web Crawler - CS101 - Udacity

Contenuto

Definizione: cosa significa Web Crawler?

Un crawler Web è un bot Internet che aiuta nell'indicizzazione Web. Esplorano una pagina alla volta attraverso un sito Web fino a quando tutte le pagine non sono state indicizzate. I crawler Web aiutano a raccogliere informazioni su un sito Web e i collegamenti ad essi correlati e aiutano anche a convalidare il codice HTML e i collegamenti ipertestuali.


Un crawler Web è anche noto come Web spider, indicizzatore automatico o semplicemente crawler.

Un'introduzione a Microsoft Azure e Microsoft Cloud | In questa guida imparerai cos'è il cloud computing e in che modo Microsoft Azure può aiutarti a migrare e gestire la tua azienda dal cloud.

Techopedia spiega Web Crawler

I crawler Web raccolgono informazioni quali l'URL del sito Web, le informazioni sui meta tag, il contenuto della pagina Web, i collegamenti nella pagina Web e le destinazioni che conducono da tali collegamenti, il titolo della pagina Web e qualsiasi altra informazione pertinente. Tengono traccia degli URL che sono già stati scaricati per evitare di scaricare di nuovo la stessa pagina. Una combinazione di politiche come la politica di visita, la politica di selezione, la politica di parallelizzazione e la politica di cortesia determina il comportamento del crawler Web. Ci sono molte sfide per i web crawler, vale a dire il World Wide Web grande e in continua evoluzione, i compromessi nella selezione dei contenuti, gli obblighi sociali e la gestione degli avversari.


I crawler Web sono i componenti chiave dei motori di ricerca e dei sistemi Web che guardano le pagine Web. Aiutano a indicizzare le voci Web e consentono agli utenti di eseguire query sull'indice e forniscono anche le pagine Web corrispondenti alle query. Un altro uso dei crawler Web è l'archiviazione Web, che prevede la raccolta e l'archiviazione periodica di grandi serie di pagine Web. I crawler Web vengono utilizzati anche nel data mining, in cui le pagine vengono analizzate per proprietà diverse come le statistiche e quindi vengono eseguite analisi dei dati su di esse.