Creare una Sitemap
La Sitemap rappresenta un indice del sito, una mappa, che il Webmaster realizza per migliorare la navigazione sia dell'utente che dello spider.
È utile soprattutto perché fornisce al motore di ricerca delle indicazioni molto chiare e rilevanti, con l'elenco degli URL di tutte le pagine componenti il sito e una serie di informazioni aggiuntive, come:
- l'ultima data dell'aggiornamento di ogni singola pagina
- la frequenza tipica delle modifiche;
- l'importanza di una pagina rispetto alle altre del sito.
Questo aiuta lo spider ad effettuare una scansione più efficiente e un'indicizzazione più completa.
La struttura della Sitemap
La Sitemap fornita al motore di ricerca è un file XML che deve seguire uno standard definito Sitemap 0.90, che è adottato dai principali motori di ricerca, Google, Bing, Yahoo!, e le cui specifiche sono elencate su sitemaps.org.
Il vantaggio di un unico protocollo è evidente: rispetto al passato, quando erano presenti più protocolli, adesso creando un'unità Sitemap possiamo fornirla ai vari motori di ricerca.
Vediamo come creare manualmente una Sitemap, seguendo le indicazioni del protocollo Sitemap (http://www.sitemaps.org/protocol.html).
Come anticipato, si tratta di un file XML, che deve essere codificato in UTF-8. Se utilizziamo programmi come Notepad++ potremo farlo senza problemi.
Qui vediamo un esempio di Sitemap:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="https://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://www.miosito.it/</loc>
<lastmod>2014-12-01</lastmod>
<changefreq>monthly</changefreq>
<priority>1.0</priority>
</url>
<url>
<loc>https://www.miosito.it/ristoranti/migliori-ristoranti-firenze.html</loc>
<changefreq>weekly</changefreq>
<priority>0.8</priority>
</url>
<url>
<loc>https://www.miosito.it/ristoranti/trattorie-osterie/antica-osteria-san-niccolo.html</loc>
<lastmod>2014-12-23T18:00:15+00:00</lastmod>
<changefreq>yearly</changefreq>
<priority>0.5</priority>
</url>
</urlset>
Il file inizia con un tag di apertura <urlset> che chiude anche il documento, con </urlset>.
Al suo interno viene definito lo standard del protocollo:
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
Abbiamo poi, per ogni singola pagina, il tag <url> e al suo interno una voce secondaria obbligatoria
<loc> dove definiamo l'URL della pagina.
L'url deve iniziare con http:// e contenere meno di 2048 caratteri.
Se abbiamo le stesse pagine con www e senza www, non occorre creare due versioni della Sitemap. Il consiglio però è quello di scegliere una delle due versioni: www.miosito.it o miosito.it.
Abbiamo poi una serie di altri tag facoltativi, che ci permettono di fornire maggiori informazioni allo spider.
<lastmod>
Con questo tag indichiamo la data dell'ultima modifica del file, secondo il formato W3 Date Time.
Possiamo inserire la data nel formato YYYY-MM-DD e se vogliamo possiamo aggiungere anche l'orario, sempre secondo l'indicazione e gli esempi che troviamo su W3 Date Time.
<changefreq>
Qui possiamo indicare la frequenza con la quale la pagina potrebbe venire modificata, utilizzando seguenti valori:
- always - se il contenuto viene modificato ogni volta che si accede della pagina
- hourly - modifica ogni ora
- weekly - modifica settimanale
- monthly - modifica mensile
- yearly - modifica annuali
- never - per contenuti archiviati e che quindi non verranno più modificati.
Si tratta di un suggerimento che lo spider può prendere in considerazione come no.
<priority>
Qui possiamo definire la priorità di un URL rispetto alle altre pagine, secondo un valore che va da 0,0 a 1,0.
La priorità predefinita è 0,5; quella più alta 1,0.
1,0 solitamente viene assegnata per la home page.
Il consiglio è di definire con valori più alti di 0,5 solo le pagine veramente più rilevanti.
Se assegniamo infatti a tutti gli URL una priorità pari a 1,0 questo suggerimento non sarà di grande aiuto allo spider, per ricavare informazioni su quali realmente siano effettivamente le pagine più importanti, e quindi non sortirà nessun effetto.
Come definito dal protocollo questo file non può contenere più di 50.000 URL e non può pesare più di 10 MB.
In questo caso occorrerà creare più Sitemap e riunirle, preferibilmente, in un indice Sitemap.
Riguardo il peso del file, può essere compresso tramite Gzip (ma in ogni caso deve avere un peso massimo di 10 MB).
Una volta creata la Sitemap, occorre salvarlo nel formato XML e codifica UTF-8.
Includiamo quindi il file XML all'interno del nostro sito. Il consiglio è di inserirlo nella directory principale del server, e non in un'area molto interna del sito.
Avremo così questo file al seguente URL: https://miosito.it/sitemap.xml
Utilizzando CMS come WordPress o Joomla! è possibile creare automaticamente la Sitemap grazie ad appositi plugin ed estensioni. In alternativa, se si volesse creare automaticamente una Sitemap XML, è possibile utilizzare appositi generatori di Sitemap.