Benvenuto! Per postare e godere delle funzionalità del forum registrati, occorrono pochi secondi ed è gratis!

il bot di google che gira per hackmix (spiegazione)

BF Master
Messaggi: 1,105
Discussioni: 179
Registrato: 03-2011
Mix: 0
Googlebot effettua due tipi di scansione del web: la Deep-crawl (fatta una volta al mese circa) e la Fresh-crawl (quasi tutti i giorni). La prima come detto viene fatta una volta al mese e viene scansionato tutto il web pagina per pagina, aggiornando indici, pagerank e cache. Dopo una Deep-crawl Google impiega circa 6-8 giorni per aggiornare completamente i suoi indici e propagarli in tutti i datacenter. In questo periodo di tempo si parla della cosiddetta "Google dance" perché i risultati che escono possono essere diversi di volta in volta. Dopo qualche giorno invece si stabilizzano.

La seconda invece viene fatta quasi tutti i giorni e in pratica aggiorna le pagine che già sono presenti nell'indice e aggiunge quelle eventualmente create dopo l'ultima Deep-crawl.

Esistono altri strumenti e procedure che il GoogleBot utilizza per indirizzare (e limitare) le sue scansioni. Uno tra i più importanti è il file "robots.txt", che dovrebbe essere sempre presente sui web server attestati su internet, in quanto naturale oggetto di scansione da parte degli spider.

Il Googlebot solitamente si fa riconoscere. Oltre a provenire da alcuni specifici IP riconoscibili (risolvibili come domini di terzo livello di googlebot.com o google.com), i contatti generati dallo spider si identificano[1] con una di queste stringhe User agent:

*Googlebot/2.1 (+http://www.googlebot.com/bot.html)
*Googlebot/2.1 (+http://www.google.com/bot.html)
*Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html) (per compatibilità)
*Googlebot-Image/1.0 (il crawler della ricerca immagini)

fonte : wikipedia (

[Per vedere i link devi REGISTRARTI.]

)
P.S.
lo avrei postato in articoli geek,ma non sono amministratore xD



23/12/2011, 22:51
#1
Cerca


Messaggi in questa discussione
il bot di google che gira per hackmix (spiegazione) - da generalmistic - 23/12/2011, 22:51
[Nessun oggetto] - da MAUROW - 23/12/2011, 22:55
[Nessun oggetto] - da Pocciox - 23/12/2011, 23:02
[Nessun oggetto] - da MAUROW - 23/12/2011, 23:22
[Nessun oggetto] - da Pocciox - 24/12/2011, 0:06
[Nessun oggetto] - da orochimaru - 24/12/2011, 3:25
[Nessun oggetto] - da Pocciox - 24/12/2011, 13:10
[Nessun oggetto] - da orochimaru - 24/12/2011, 13:57
[Nessun oggetto] - da Pocciox - 24/12/2011, 15:31
[Nessun oggetto] - da orochimaru - 24/12/2011, 15:56
[Nessun oggetto] - da Pocciox - 26/12/2011, 0:29

Discussioni simili
Discussione Autore Risposte Letto Ultimo messaggio
  Hackmix App Lelep0w4 17 5,166 02/05/2014, 23:17
Ultimo messaggio: Giniu
  hackmix:come è fatto??? Pocciox 9 2,318 31/12/2011, 2:02
Ultimo messaggio: Cato97
  Google Panda castiga alcuni siti Admin 13 3,283 09/11/2011, 22:38
Ultimo messaggio: generalmistic



Utenti che stanno guardando questa discussione: 1 Ospite(i)