Login

generalmistic · 23/12/2011, 22:51 #1

Googlebot effettua due tipi di scansione del web: la Deep-crawl (fatta una volta al mese circa) e la Fresh-crawl (quasi tutti i giorni). La prima come detto viene fatta una volta al mese e viene scansionato tutto il web pagina per pagina, aggiornando indici, pagerank e cache. Dopo una Deep-crawl Google impiega circa 6-8 giorni per aggiornare completamente i suoi indici e propagarli in tutti i datacenter. In questo periodo di tempo si parla della cosiddetta "Google dance" perché i risultati che escono possono essere diversi di volta in volta. Dopo qualche giorno invece si stabilizzano.

La seconda invece viene fatta quasi tutti i giorni e in pratica aggiorna le pagine che già sono presenti nell'indice e aggiunge quelle eventualmente create dopo l'ultima Deep-crawl.

Esistono altri strumenti e procedure che il GoogleBot utilizza per indirizzare (e limitare) le sue scansioni. Uno tra i più importanti è il file "robots.txt", che dovrebbe essere sempre presente sui web server attestati su internet, in quanto naturale oggetto di scansione da parte degli spider.

Il Googlebot solitamente si fa riconoscere. Oltre a provenire da alcuni specifici IP riconoscibili (risolvibili come domini di terzo livello di googlebot.com o google.com), i contatti generati dallo spider si identificano[1] con una di queste stringhe User agent:

*Googlebot/2.1 (+http://www.googlebot.com/bot.html)
*Googlebot/2.1 (+http://www.google.com/bot.html)
*Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html) (per compatibilità)
*Googlebot-Image/1.0 (il crawler della ricerca immagini)

fonte : wikipedia (

[Per vedere i link devi REGISTRARTI.]

)
P.S.
lo avrei postato in articoli geek,ma non sono amministratore xD

**MAUROW** · 23/12/2011, 22:55 #2

grazie , almeno adesso tutti sapranno chi è google..!!!

Pocciox · 23/12/2011, 23:02 #3

WOW, Bella ricerca, ma se lo bannassimo??cosa succederebbe???

**MAUROW** · 23/12/2011, 23:22 #4

che google non saprebbe più chi è hack mix.... :s

Pocciox · 24/12/2011, 0:06 #5

ah allora non banniamolo XD
ma avevate parlato anche di un altro bot qual era??

orochimaru · 24/12/2011, 3:25 #6

Non penso si possa bannare visto che non è registrato, è come se fosse un ospite

Pocciox · 24/12/2011, 13:10 #7

ma allora non può guardare i link.....quindi come fa a postarli nelle ricerche su google?

orochimaru · 24/12/2011, 13:57 #8

(24/12/2011, 13:10)pocciox Ha scritto:
[Per vedere i link devi REGISTRARTI.]
quindi come fa a postarli nelle ricerche su google?

Fà una scansione di ogni pagina/frase e la salva nel Server, ognuno che cercherà ogni minima parola o frase, riuscirà a trovare questo Forum

Citazione:ma allora non può guardare i link.....

Penso di no, "scannerizza" la pagina non i link esterni, mia opinione eh...

ps. Stamane c'era Bing Happywide

Pocciox · 24/12/2011, 15:31 #9

magari troviamo anche safari XD

orochimaru · 24/12/2011, 15:56 **#10**

(24/12/2011, 15:31)pocciox Ha scritto:
[Per vedere i link devi REGISTRARTI.]
magari troviamo anche safari XD

che centra safari che è un Browser 0.o...

Pocciox · 26/12/2011, 0:29 **#11**

Ooops scusa LoL
stavo dimenticando la differenza tra browser e motore di ricerca DX
vabbè non vado off topic

Login
Username:
Password:	Lost Password?
	Remember me

Discussioni simili
Discussione		Autore	Risposte	Letto	Ultimo messaggio
	Hackmix App	Lelep0w4	17	5,317	02/05/2014, 23:17 Ultimo messaggio: Giniu
	hackmix:come è fatto???	Pocciox	9	2,379	31/12/2011, 2:02 Ultimo messaggio: Cato97
	Google Panda castiga alcuni siti	Admin	13	3,348	09/11/2011, 22:38 Ultimo messaggio: generalmistic