L'indicizzazione dei siti web è l'operazione di archiviazione svolta dal motore di ricerca.
Vi siete mai chiesti quale sia la logica, o i meccanismi se preferite, che permette di rendervi la risposta alle vostre richieste quando effettuate una ricerca su Google?
Anche se la tecnica d'indicizzazione è molto sofisticata può essere facilmente spiegata.
Google come molti altri motori di ricerca dispone di un programma capace di seguire i link presenti sulla rete segnalando nuovi link e mutazioni di quelli esistenti.
Questo programma è detto anche Spider, ossia ragno, grazie alla sua capacità di muoversi sulla rete seguendone i nodi esattamente come un farebbe un regno sulla sua tela.
Appena questo programma trova un collegamento inizia a seguirlo cercando di archiviare i percorsi di tutte le pagine del sito.
Ecco perchè il sito web deve essere realizzato tenendo presente questa esigenza.
Naturalmente lo spider del motore di ricerca farà delle distinzioni tra tutti i collegamenti che portano nella radice del sito ossia interni e quelli esterni.
Successivamente i percorsi delle pagine del sito saranno ripresi da altri programmi che collaborano all'archiviazione dei contenuti. Questi programmi visiteranno così tutte le pagine che saranno state indicizzate dal primo spider ed effettueranno l'archiviazione dei suoi contenuti (testi, foto, filmati, files).
Successivamente questi contenuti saranno "pesati" ossia analizzati e confrontati con i contenuti espressi da altri siti web simili al vostro.
Questo passaggio sfrutta degli algoritmi matematici che fanno poi la fortuna o meno del motore di ricerca, ossia esprimono la capacità di separare il contenuto scarso da quello buono e fare in modo che il secondo compaia in posizioni privilegiate rispetto agli altri. Google con il suo PageRank e TrustRank è diventato quello che oggi tutti sappiamo.
Questi algoritmi sono in costante evoluzione e ogni tre mesi circa i risultati delle ricerche subiscono veri e propri terremoti facendo nascere delle new-entry e naturalmente facendo scomparire i siti meno fortunati (comunque quì la fortuna non c'entra ma conta solo il lavoro ben eseguito)