Cos’è e come si crea una Sitemap in XML

Un semplice tutorial che può sempre servire ai SEO (Search Engine Optimizer) che hanno iniziato da poco o a coloro che vogliono capire cos'è e come si crea una sitemap in formato xml necessaria per i motori di ricerca.

Una sitemap è un documento creato in XML e contiene tutti gli url delle pagine del nostro sito. Possiamo decidere di ometterne alcuni, per esempio gli url delle aree riservate che ci consentono di amministrare il nostro sito.

Possiamo vedere la sitemap XML come un'altra versione della sitemap che normalmente includiamo tra le pagine del nostro sito che serve per orientare gli utenti all'interno del sito; questa versione (XML) però non è per gli utenti, ma per i motori di ricerca e pià precisamente per i bot che fanno visita al nostro sito. Sono bot, non possiamo parlare con parole e foto sottoforma di HTML o PHP ... loro vogliono l'XML. E allora passiamo alla creazione vera e propria della sitemap, non dimentichiamo però la logica che sta in ogni documento XML, bisogna infatti pensare alle matrioske, ogni elemento sarà contenuto dentro un altro fino ad arrivare al genitore, non dimenticatelo durante l'implementazione della vostra sitemap.

Iniziamo con quello che nelle normali pagine HTML sarebbe l'header, infatti troviamo alcuni dati relativi al formato della sitemap come formato e codifica

<?xml version="1.0" encoding="UTF-8"?>

<urlset

xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"

xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"

xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9

http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd">

<url>

in questa prima parte del codice dichiariamo anche a quali standard fa riferimento la sitemap

passiamo alla parte centrale della sitemap:

si comincia sempre con lo specificare l'indirizzo del nostro sito, dopo passeremo alle singole pagine (index, ecc...)

<url>

<loc>http://www.vostrosito.it/</loc>

<priority>1.00</priority>

<lastmod>2008-12-08T03:00:00+00:00</lastmod>

<changefreq>daily</changefreq>

</url>

spieghiamo quanto appena scritto:

abbiamo racchiuso tutto nell'elemto URL, aperto all'inizio del blocco e chiuso alla fine

con l'elemento LOC definiamo l'indirizzo della pagina (come già detto, inizalmente inseriamo l'indirizzo del nostro sito)

l'elemento LASTMOD contiene la data dell'ultima modifica dell'url che abbiamo inserito nella riga precedente

con l'elemento CHANGEFREQ specifichiamo con che frequenza viene modificata (aggiornata) la pagina dell'url dichiarato poco prima. i valori possibili per questo elemento sono always (conetnuto diverso ogni volta che vi si accede), hourly (contenuto aggiornato ogni ora), daily(contenuto aggiornato ogni giorno), weekly(contenuto aggiornato ogni settimana), monthly (contenuto aggiornato ogni mese), yearly (contenuto aggiornato ogni anno), never (contenuto mai aggiornato)

ripetete l'ultimo blocco del codice per ogni pagina che desiderate sia indicizzata dal motore di ricerca e alla fine chiudete con

</urlset>

il quale chiude quanto aperto inizialmente nel nostro documento XML. URLSET rappresenta l'elemento contenitore di tutto, il più esterno, all'interno del quale troviamo i singoli URL che vogliamo far indicizzare dai motori di ricerca.

Salvate il documento nel formato XML assegnando il nome che preferite ed avrete la vostra sitemap. Vi ricordo che per uno stesso sito potete avere più sitemap, fate attenzione a non assegnare lo stesso nome altrimenti sul server ne troverete solo una; ciò accade se si è in più di una persona a gestire il sito e magari involontariamente i colleghi possono inserire sitemap con nomi già esistenti (ricordate che esiste sempre l'errore umano!).

Per approfondimenti: sitemaps.org